1、2023-1-13医学统计学第十章第十章 统计表与统计图统计表与统计图Statistical Table&Statistical Graph2023-1-13医学统计学 统计表(statistical table)是表达统计分析结果中数据和统计指标的表格形式;统计图(statistical graph)是用点、线、面等各种几何图形来形象化表达统计数据。2023-1-13医学统计学第一节 统计表 一、统计表的意义与制作原则1统计表的意义 统计表用简明的表格形式,有条理地罗列数据 和统计量,方便阅读、比较和计算。2制表原则:重点突出、层次清楚 3制表的基本要求 2023-1-13医学统计学(1)标
2、题:概括表的主要内容,包括研究的时间、地点和研究内容,放在表的上方。(2)标目:分别用横标目和纵标目说明表格每行和每列数字的意义,注意标明指标的单位。2023-1-13医学统计学(3)线条:至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。其它竖线和斜线一概省去。2023-1-13医学统计学(4)数字:用阿拉伯数字表示。无数字用“”表示,缺失数字用“”表示,数值为0者记为“0”,不要留空项。数字按小数位对齐。(5)备注:表中数字区不要插入文字,也不列备注项。必须说明者标“*
3、”号,在表下方说明。2023-1-13医学统计学二、统计表的种类2023-1-13医学统计学 例10-1 表10-1列出某地进行喷昔洛韦软膏治疗颜面单纯疱疹与阿昔洛韦软膏比较的随机对照临床试验结果。该表只有试验分组一个层次,属简单表。1.简单表 统计表的主语只有一个层次 2023-1-13医学统计学表10-1 某年某地喷昔洛韦软膏治疗颜面单纯疱疹疗效比较组别 例数 治愈数 治愈率(%)治愈天数(SX)试验组 107 93 86.9 5.71.3 对照组 108 84 77.8 6.41.2 如何完成喷昔洛韦软膏治疗颜面单纯疱疹疗效的比较分析?2023-1-13医学统计学2.组合表 统计表的主语
4、有两个以上层次 例10-2 某年某地分别在城乡进行乙型肝炎病毒抗原携带者的检测,该研究的对象按城乡和年龄两个特征分层,结果列在表10-2。该表属组合表。2023-1-13医学统计学表10-2 某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析 城市 乡村 年龄组 检查数 阳性数 阳性率()检查数 阳性数 阳性率()20 42384 274 6.46 9854 49 4.97 20 228076 2018 8.85 13874 124 8.94 25 235879 2697 11.43 8414 134 15.93 30 146142 2093 14.32 5690 90 15.82 35 74
5、629 1299 17.41 3950 81 20.51 40 21193 273 12.88 1499 31 20.68 合计 748303 8654 11.56 43281 509 11.76 请分别指出城乡25组的发生率和构成比。2023-1-13医学统计学三、编制统计表的注意事项 例10-3 某地进行冠心病危险因素研究时,调查了居民的心理得分值与其它冠心病有关因素,结果列成表10-3。2023-1-13医学统计学表10-3 不同心理分值的冠心病危险因素水平比较 心理分值 1(252 人)2(253 人)3(252 人)4(253 人)P 值 危险 因素 SX%SX%SX%SX%年龄(岁
6、)35.26.5 37.06.3 36.56.8 37.86.5 0.05 收缩压(mmHg)120.713.4 121.213.2 121.113.2 120.412.8 0.5 舒张压(mmHg)78.810.2 77.910.5 78.211.0 78.410.6 0.39 体力活动 2.10.2 2.10.1 2.10.2 2.30.3 0.08 体重指数 23.13.2 24.03.5 24.83.1 25.83.1 0.01 吸烟率(%)70.8 69.4 70.7 71.1 0.41 吸烟量(支/天)81 102 152 152 0.001 饮酒率(%)52.3 55.5 53.
7、1 52.8 0.13 饮酒量(克/天)60.17.5 78.28.5 79.36.8 106.810.2 0.001 受教育程度 4.50.8 4.20.9 3.50.8 3.40.8 0.05 社会支持 8.71.2 7.51.1 7.01.2 7.01.2 0.05 慢性疾患数构成(%)0 81.6 79.3 77.5 73.9 0.18 1 15.1 16.2 16.5 15.0 0.43 2 3.3 4.5 6.0 11.1 0.05 2023-1-13医学统计学问 题将太多的内容放在一个表里,特别是将两种不同类型资料(计量资料和计数资料)的统计量放在同一表中。互不相容的内容分别占了
8、不同的列,导致表中有许多空格。纵横标目倒置。内容较多,层次复杂,表格中数据罗列无条理,较难读懂。2023-1-13医学统计学表10-4 某年某地居民不同心理分值的冠心病危险因素水平比较(XS)心理 分值 例数 年龄(岁)收缩压(mmHg)舒张压(mmHg)体力 活动 体重指数 吸烟量(支/天)饮酒量(克/天)受教育 程度 社会支持 1 252 35.26.5 120.713.4 78.810.2 2.10.2 23.13.2 81 60.1 7.5 4.50.8 8.71.2 2 253 37.06.3 121.213.2 77.910.5 2.10.1 24.03.5 102 78.2 8.
9、5 4.20.9 7.51.1 3 252 36.56.8 121.113.2 78.211.0 2.10.2 24.83.1 152 79.3 6.8 3.50.8 7.01.2 4 253 37.86.5 120.412.8 78.410.6 2.30.3 25.83.1 152 106.810.2 3.40.8 7.01.2 P 值-0.05 0.5 0.39 0.08 0.01 0.001 0.001 0.05 0.05 处理办法:将该表资料分别制成两个统计表,见表10-4和表10-5。2023-1-13医学统计学表10-5 某年某地居民不同心理分值的冠心病危险因素水平比较 慢性疾患数
10、构成(%)心理分值 例数 吸烟率(%)饮酒率(%)0 1 2 1 252 70.8 52.3 81.6 15.1 3.3 2 253 69.4 55.5 79.3 16.2 4.5 3 252 70.7 53.1 77.5 16.5 6.0 4 253 71.1 52.8 73.9 15.0 11.1 2023-1-13医学统计学第二节 统计图1统计图的意义:统计图将统计数据形象化,让读者更易于领会统计资料的核心内容,易于做分析比较,并且可以给读者留下深刻的印象。2023-1-13医学统计学2统计图的种类:根据资料类型和统计分析目的不同,需要用不同的统计图表达数据和统计指标值。常用的统计图有直
11、条图、直方图、百分比条图和圆图、线图、散点图和统计地图等,还有在数据探索性分析中应用的茎叶图、残差图、箱式图,序贯分析的检验区域图,判别分析的类别分布图,聚类分析的谱系图等特殊分析图等。2023-1-13医学统计学3统计图制作的一般原则(1)根据资料性质和分析目的正确选用适当的统计图。(2)必须有标题,概括统计图资料的时间、地点和主要内容。统计图的标题一般 放在图的下方。2023-1-13医学统计学(3)统计图一般有横轴和纵轴,并分别用横标目和纵标目说明横轴和纵轴代表的指标和单位。一般将两轴的相交点即原点处定为0。纵横轴的比例一般以5:7或7:5为宜。(4)统计图用不同线条和颜色表达不同事物和
12、对象的统计量,需要附图例加以说明。图例可放在图的右上角空隙处或下方中间位置。2023-1-13医学统计学二、常用统计图1直条图(bar chart)2圆图(pie chart)和百分比条图(percent bar chart)3线图(line graph)4直方图(histogram)5统计地图(statistical map)6其他特殊分析图 箱式图(box plot)茎叶图(stem-leaf plot)误差条图误差条图(error bar chart)2023-1-13医学统计学1直条图(bar chart)用相同宽度的直条长短表示相互独立的某统计指标值的大小。直条图按直条是横放还是竖放
13、分卧式和立式两种,按对象的分组是单层次和两层次分单式和复式两种。2023-1-13医学统计学 例10-4 图10-1显示某地某年主要死因死亡率资料,不同死因是相互独立的不连续指标,因此用直条图。该图只按死因分类,为单式立式直条图。2023-1-13医学统计学020406080100120140呼吸系病 恶性肿瘤 脑血管病心脏病传染病 消化系病 损伤中毒 新生儿病死亡率(/10万)图10-1 某年某地主要死因的死亡率(/10万)2023-1-13医学统计学2023-1-13医学统计学 直条图的纵轴尺度起点必须为零示意图2023-1-13医学统计学2圆图和百分比条图 圆图(pie chart)是以
14、圆形总面积作为100%,将其分割成若干个扇面表示事物内部各构成部分所占的比例。百分比条图(percent bar chart)是以矩形总长度作为100%,将其分割成不同长度的段表示各构成的比例。圆图和百分比条图适合描述分类变量的构成比资料。2023-1-13医学统计学 例10-5 某年某地进行婴儿死亡原因的调查,根据城市婴儿死因的构成资料绘制成图10-2。从图10-2可见出生窒息是婴儿死亡的首位死因,出生窒息、早产和肺炎头三位死因占总死亡的60.3%,是婴儿死亡防治的重点。2023-1-13医学统计学20.55.65.222.56.418.121.7早产先天异常先天心其它颅内出血肺炎出生窒息
15、图10-2 某年某地城市婴儿死因构成比 2023-1-13医学统计学 例10-6 图10-3是根据某地20世纪70年代和80年代恶性肿瘤发病登记资料绘制成的百分比条图。由图可见不同年代主要恶性肿瘤中,鼻咽癌和肝癌构成减少,肺癌明显增加。百分比条图特别适合作多个构成比的比较,将不同组别,不同时间或不同地区的某分类指标的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差异。2023-1-13医学统计学0%20%40%60%80%100%70年代80年代肺癌鼻咽癌肝癌胃癌肠癌其它 图10-3 20世纪70年代和80年代某地7常见恶性肿瘤发病构成比较 2023-1-13医学统计学3线图(li
16、ne graph)线图是用线段的升降来表示数值的变化,适合于描述某统计量随另一连续性数值变量变化而变化的趋势,最常用于描述统计量随时间变化而变化的趋势。普通线图:横轴和纵轴都是算术尺度。半对数线图:横轴是算术尺度,纵轴是对数尺度,特别适宜作不同指标变化速度的比较。2023-1-13医学统计学 例10-7 图10-4是根据19902000年某沿海城市甲状腺功能亢进(甲亢)发病率资料绘制的普通线图。图10-4可看出在1995年开始食盐加碘后,甲亢发病率有一突增高峰,1999年以后又逐渐下降的趋势。2023-1-13医学统计学0102030405060199019921994199619982000
17、年份甲亢发病率(/10万)图10-4 19902000年某沿海城市甲状腺功能亢进发病率变化趋势 2023-1-13医学统计学 例10-8 调查某地1997年2001年两种与性传播有关疾病艾滋病和梅毒的发病率变化趋势,资料分别绘制成普通线图和半对数线图。普通线图显示梅毒的增长幅度较大,但半对数线图则显示艾滋病的增长速度更快。2023-1-13医学统计学0123456719971998199920002001发病率(1/10万)0.0010.010.111019971998199920002001发病率(1/10万)艾滋病梅毒图图10-5 19972001年某地艾滋病和梅毒发病率的变化趋势年某地艾
18、滋病和梅毒发病率的变化趋势(a)纵轴为算术尺度纵轴为算术尺度;(b)纵轴为对数尺度。纵轴为对数尺度。2023-1-13医学统计学注意:注意:普通线图的纵轴一般以0点作起点,否则需作特殊标记或说明,以防给读者错误印象。标记直线的连接点时要注意,如测定值是在某时间段或数值段的,应标记在段的中点;如测定值是在某时点或确定值的,标记在相应时点或数值上。2023-1-13医学统计学4直方图(histogram)以直方面积描述各组频数的多少,面积的总和相以直方面积描述各组频数的多少,面积的总和相当于各组频数之和,适合表示数值变量的频数分布。直当于各组频数之和,适合表示数值变量的频数分布。直方图的横轴尺度是
19、数值变量值,纵轴是频数。注意如各方图的横轴尺度是数值变量值,纵轴是频数。注意如各组的组距不等时,要折合成组的组距不等时,要折合成等距等距后再绘图,即将频数除后再绘图,即将频数除以组距得到单位组距的频数作为直方的高度,组距为直以组距得到单位组距的频数作为直方的高度,组距为直方的宽度。另一种表示数值变量资料频数分布的方式是方的宽度。另一种表示数值变量资料频数分布的方式是将各组段观察频数除以总观察频数得到各组段的频率,将各组段观察频数除以总观察频数得到各组段的频率,以各组段频率除以组距得到的频率密度作为直方图高度,以各组段频率除以组距得到的频率密度作为直方图高度,绘制的直方图称为频率直方图,它以各直
20、方面积表示各绘制的直方图称为频率直方图,它以各直方面积表示各组频率,其组频率,其面积的总和为面积的总和为1 1。2023-1-13医学统计学 例10-9 1997年某地共报告乙型病毒性脑炎104例,其年龄分布如表10-6。2023-1-13医学统计学024681012141603691025年龄(岁)每岁病例数图10-6 1997年某地乙型病毒性脑膜炎病例的年龄分布 2023-1-13医学统计学5统计地图(statistical map)统计地图是用不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研究指标的地理分布。例10-10 2003年广东省发生了某急性传染病的流行,图10-7描
21、述了该急性传染病发病数在广东省的分布情况。2023-1-13医学统计学图10-7 2003年广东省某急性传染病发病数的地理分布 图例中括号内是发生相同病例数的行政区频数,其余指数据缺失的行政区2023-1-13医学统计学6其他特殊分析图 在探索性数据分析中,一些特殊的统计图对于发现数据分布特征有着重要的意义。这里介绍常用的箱式图、茎叶图和误差条图。2023-1-13医学统计学箱式图(box plot)使用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值。箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除异常值外的最小值和最大值。另
22、外标记可能的异常值。显然箱子越长,数据变异程度越大。中间横线在箱子中点表明分布对称,否则不对称。2023-1-13医学统计学 例10-11 某地调查不同类型化妆品厂车间内粉尘数,结果绘制成图10-8。图中显示粉尘数的分布呈偏态分布,净化厂粉尘数较少,非净化厂粉尘数较多。2023-1-13医学统计学工厂类型粉类非净化净化尘粒数(亿)2.01.81.61.41.21.0.8.6.4.20.0图图10-8 某地不同类型化妆品厂车间粉尘数分布箱式图某地不同类型化妆品厂车间粉尘数分布箱式图 2023-1-13医学统计学茎叶图(stem-leaf plot)将数据分离成两部分:整数部分和尾数部分,整数部分
23、形成图的茎,尾数部分形成图的叶。茎叶图的排列方式与频数表有些相似,每行由一个整数的茎和若干叶构成。左边是茎的数值,茎宽一般标在图的下方。右边是叶,图显示每个叶的尾数数值,同样在图的下方标示每个叶代表几个实际观察值。茎叶图可以非常直观地显示数据的分布范围和形态,近年非常流行。2023-1-13医学统计学例例10-1210-12 利用第二章例2-1的数据绘制茎叶图,结果为图10-9。图中茎的宽度为1,即观察值的整数位。每个叶代表1个观察值,显示的尾数即观察值的第一位小数。从图可以看出血清总胆固醇的分布范围从2.3到5.7,基本近似正态分布。而且可以查看每个观察值的取值情况。2023-1-13医学统计学2023-1-13医学统计学误差条图误差条图(error bar chart)(error bar chart)2023-1-13医学统计学例10-13 利用第四章例4-2的数据绘制误差条图,结果显示为图10-10。从图示可见安慰剂组的低密度脂蛋白平均值高于所有不同剂量的新药组,而大剂量新药组的低密度脂蛋白平均值低于低剂量组和中剂量组,差异有统计学意义。2023-1-13医学统计学练习题P231P231一、最佳选择题一、最佳选择题全做全做三、计算分析题三、计算分析题 第第1 1题题