1、第十章第十章 统计表与统计图统计表与统计图 统计表是表达统计分析结果中统计表是表达统计分析结果中数据数据和和统计指统计指标标的表格形式。统计图是用点、线、面等各种的表格形式。统计图是用点、线、面等各种几何图形来几何图形来形象化形象化表达统计数据。他们都是表达统计数据。他们都是统统计描述计描述的重要方法,也是科研论文中数据表达的重要方法,也是科研论文中数据表达的主要工具。的主要工具。第一节第一节 统计表统计表1 1。统计表的意义。统计表的意义一、统计表的意义与制作原则一、统计表的意义与制作原则 统计表用简明的表格形式,有条理的罗列数据和统统计表用简明的表格形式,有条理的罗列数据和统计量,方便计量
2、,方便阅读、比较和计算阅读、比较和计算。 统计描述时,统计表展示统计数据的统计描述时,统计表展示统计数据的结构结构、分布分布和和主要特征主要特征,便于在,便于在进一步分析中选择进一步分析中选择和计算统计量。和计算统计量。 学术报告和论文中常用统计表学术报告和论文中常用统计表代替文字叙述代替文字叙述,表达,表达主要的研究结果、数据、指标和统计量,方便读者比主要的研究结果、数据、指标和统计量,方便读者比较和掌握主要研究结果。较和掌握主要研究结果。2 2。统计表的制表原则。统计表的制表原则 重点突出,一张表一般只表达一个中心内容。重点突出,一张表一般只表达一个中心内容。 统计表如同完整的一句话,要有
3、描述的对象和内容。统计表如同完整的一句话,要有描述的对象和内容。 统计表应简单明了,一切文字、数字和线条都尽量统计表应简单明了,一切文字、数字和线条都尽量从简。从简。表表1 1 不同药物治疗急性冠周炎效果比较不同药物治疗急性冠周炎效果比较分组分组治愈治愈未愈未愈合计合计替硝唑替硝唑2525 4 42929甲硝唑甲硝唑181814143232合计合计434318186161标题标题 横标目横标目的总标目的总标目横横标标目目纵标目纵标目顶线顶线底线底线分分隔隔线线数值数值3 3。统计表的基本结构。统计表的基本结构4 4。制表的基本要求。制表的基本要求 标题:统计表的标题要确切、简练,能够高标题:统
4、计表的标题要确切、简练,能够高度概括表的主要内容,应包括研究的度概括表的主要内容,应包括研究的时间、地时间、地点和研究内容点和研究内容,放在表的,放在表的上方上方中央位置。中央位置。 如果一篇文章当中有多个表,应在左侧加上如果一篇文章当中有多个表,应在左侧加上表号表号。 如果整个表的指标统一,可将研究指标的单如果整个表的指标统一,可将研究指标的单位标在标题后面。位标在标题后面。 标目:标目: 标目可分为标目可分为横标目横标目和和纵标目纵标目,用以说明,用以说明每行和每列数字的意义。标目文字要精练、准确。每行和每列数字的意义。标目文字要精练、准确。横标目是主语横标目是主语,是描述的对象,是描述的
5、对象,在表的左侧在表的左侧;纵纵标目是宾语标目是宾语,是描述的内容,是描述的内容,在表的右侧在表的右侧。横标横标目和纵标目的位置不能颠倒,从左到右应构成一目和纵标目的位置不能颠倒,从左到右应构成一句完整的话。句完整的话。 有时根据需要可以有横(或纵)标目上写出适有时根据需要可以有横(或纵)标目上写出适当的当的总标目总标目,用以概括说明有共同性质或特征的,用以概括说明有共同性质或特征的两个(或多个)横(或纵)标目,便于分析。两个(或多个)横(或纵)标目,便于分析。 线条:统计表中有三条基本线条,分别是顶线、线条:统计表中有三条基本线条,分别是顶线、底线和纵标目下横线。这三条线要从表的最左端底线和
6、纵标目下横线。这三条线要从表的最左端画至表的最右端。根据需要可由其他短的横线,画至表的最右端。根据需要可由其他短的横线,如合计上方的横线、纵标目的总标目和纵标目之如合计上方的横线、纵标目的总标目和纵标目之间的横线。间的横线。 统计表中不允许出现斜线和竖线。统计表中不允许出现斜线和竖线。 数字:统计表中的数字一律用数字:统计表中的数字一律用阿拉伯阿拉伯数字表示,数字表示,小数点位置小数点位置对齐对齐。如无数字用。如无数字用“-”“-”表示,缺失表示,缺失或未记录数字用或未记录数字用“”“”表示,数值为表示,数值为0 0的要填写的要填写“0”“0”,不能空白不能空白。 备注:统计表中数字区域备注:
7、统计表中数字区域不能插入文字不能插入文字,也不,也不列备注项。必须说明的内容用列备注项。必须说明的内容用“* *”表示,在表表示,在表的下方说明。的下方说明。二、统计表的种类二、统计表的种类 统计表可分为简单表、复合表(组合表)、频统计表可分为简单表、复合表(组合表)、频数表和列联表等。数表和列联表等。 简单表是指只按一种主要标志分组(主语只有简单表是指只按一种主要标志分组(主语只有一个层次)的表。复合表是按两个或两个以上标一个层次)的表。复合表是按两个或两个以上标志相结合分组的表。志相结合分组的表。表表10-2 10-2 某年某地城乡各年龄组居民的乙型肝炎病毒抗原携带率分析某年某地城乡各年龄
8、组居民的乙型肝炎病毒抗原携带率分析年龄组年龄组城市城市农村农村检查数检查数 阳性数阳性数 阳性率(阳性率()检查数检查数阳性数阳性数 阳性率(阳性率()2020 42384 42384 274 274 6.46 6.46 9854 9854 49 49 4.97 4.9720-20-22807622807620182018 8.85 8.851387413874124124 8.94 8.9425-25-2358792358792697269711.4511.45 8414 841413413415.9315.9330-30-1461421461422093209314.3214.32 569
9、0 5690 90 9015.8215.8235-35- 74629 746291299129917.4117.41 3950 3950 81 8120.5120.514040 21193 21193 273 27312.8812.88 1499 1499 31 3120.6820.68合计合计7483037483038645864511.5611.56432814328150950911.7611.76 在统计表的编制中最常见的问题就是受文章篇在统计表的编制中最常见的问题就是受文章篇幅所限,作者希望用尽可能少的表格表达尽可能幅所限,作者希望用尽可能少的表格表达尽可能多的内容,导致统计表过大,
10、内容过多,条理不多的内容,导致统计表过大,内容过多,条理不清楚。清楚。常见的缺陷有项目残缺、结构凌乱、主谓不分、表常见的缺陷有项目残缺、结构凌乱、主谓不分、表意不明、内容过繁或(过简)表内重复。意不明、内容过繁或(过简)表内重复。统计表的审查应从标题、纵横标目排列、内容、表统计表的审查应从标题、纵横标目排列、内容、表线等方面综合考虑线等方面综合考虑三、编制统计表的注意事项三、编制统计表的注意事项表表1 某年某地不同职业居民高血压发病率某年某地不同职业居民高血压发病率职业职业男男女女合计合计例数例数发病发病数数发病发病率率(%)例例数数发病发病数数发病发病率率(%)例数例数发病发病数数发病发病率
11、率(%)工人工人102 3 2.9802025.01822312.6农民农民 77 7 9.186 2 2.3163 9 5.5职员职员1071816.8911011.01982814.1表表2 2 某地某地EBEB病毒抗体阳性人群药物干预治疗后病毒抗体阳性人群药物干预治疗后EBEB病毒抗体阳性例数病毒抗体阳性例数第一疗程第一疗程第二疗程第二疗程检查人数检查人数VCAVCAEAEADNAseDNAse检查人数检查人数VCAVCAEAEADNAseDNAse1 1月月32832825225284845252283283192192565622222 2月月31531523723778784646
12、272272168168444420203 3月月3063062292296262282826626614414438381818第二节第二节 统计图统计图一、统计图的意义与制作原则一、统计图的意义与制作原则1 1。统计图的意义。统计图的意义 统计图将统计数据统计图将统计数据形象化形象化,便于领会统计资料的核,便于领会统计资料的核心内容,易于作比较分析。医学文献中使用统计图表心内容,易于作比较分析。医学文献中使用统计图表达分析结果可使文章生动。教材、科普文章中使用统达分析结果可使文章生动。教材、科普文章中使用统计图具有教育意义和宣传鼓动性。计图具有教育意义和宣传鼓动性。 但统计图只能提供概略情
13、况,不能获得确切数值,但统计图只能提供概略情况,不能获得确切数值,所以所以不能完全替代统计表不能完全替代统计表,需要同时列出统计表作为需要同时列出统计表作为统计图的数据依据。统计图的数据依据。2 2。统计图的种类。统计图的种类 根据根据资料类型资料类型和和统计分析目的统计分析目的不同,需要用不同的不同,需要用不同的统计图表达数据和统计指标值。统计图表达数据和统计指标值。 常用的统计图有:直条图、直方图、百分条图和圆常用的统计图有:直条图、直方图、百分条图和圆图、线图、散点图、统计地图等。图、线图、散点图、统计地图等。 此外,还有在对数据进行探索分析时应用的茎叶图、此外,还有在对数据进行探索分析
14、时应用的茎叶图、残差图、箱式图;序贯分析的试验区域图,判别分析残差图、箱式图;序贯分析的试验区域图,判别分析的类别分布图,聚类分析的谱系图等特殊分析图等。的类别分布图,聚类分析的谱系图等特殊分析图等。3 3。统计图制作的一般原则。统计图制作的一般原则 根据资料的性质和分析目的选择正确、适当的统根据资料的性质和分析目的选择正确、适当的统计图。计图。 统计图的标题列于图的下方中央部位,要概括统统计图的标题列于图的下方中央部位,要概括统计图资料的时间、地点和主要内容。计图资料的时间、地点和主要内容。 统计图一般有横轴和纵轴,分别用横标目和纵统计图一般有横轴和纵轴,分别用横标目和纵标目说明其所代表的标
15、目说明其所代表的指标和单位指标和单位。一般两轴的交点。一般两轴的交点定为定为0 0。纵横轴的比例一般为。纵横轴的比例一般为5:75:7或或7:57:5。 统计图用不同的线条和颜色表达不同事物或对统计图用不同的线条和颜色表达不同事物或对象的统计量,需要附图例加以说明,图例可放在图象的统计量,需要附图例加以说明,图例可放在图的的右上角或下方中间位置。右上角或下方中间位置。二、常用统计图二、常用统计图1 1。直条图。直条图 直条图用等宽直条的长短表示直条图用等宽直条的长短表示相互独立的相互独立的某统计指标值的大小。某统计指标值的大小。 直条图按直条横放还是竖放分为卧式和立式两种。直条图按直条横放还是
16、竖放分为卧式和立式两种。按对象的分组是单层次和两层次分为按对象的分组是单层次和两层次分为单式和复式单式和复式两种。两种。 直条图的直条尺度必须从直条图的直条尺度必须从0 0开始,各直条等宽,间隔开始,各直条等宽,间隔一般为直条的宽度或其宽度的一半。直条的排列顺序可一般为直条的宽度或其宽度的一半。直条的排列顺序可按指标值的大小排列,也可按分组的自然顺序排列。按指标值的大小排列,也可按分组的自然顺序排列。2 2。圆图和百分条图。圆图和百分条图 圆图是以圆形总面积作为圆图是以圆形总面积作为100%100%,将其分割成若干个,将其分割成若干个扇面表示事物内部各扇面表示事物内部各构成部分所占的比例构成部
17、分所占的比例。 圆图在绘制时以圆形的圆图在绘制时以圆形的360360o o角为角为100%100%,1%1%相当于相当于3 3.6.6o o, ,以统计资料中各构成的百分比乘以以统计资料中各构成的百分比乘以360360o o得到各构成扇面得到各构成扇面的角度。各扇面按大小顺序顺时针方向排列,一般从的角度。各扇面按大小顺序顺时针方向排列,一般从1212点位置开始,将其它项放在最后。点位置开始,将其它项放在最后。 不同的扇面用不同颜色或花纹区别,要用图例说明不同的扇面用不同颜色或花纹区别,要用图例说明各种颜色或花纹代表的类别,条件允许可将各类别标目各种颜色或花纹代表的类别,条件允许可将各类别标目和
18、相应数字标在图上。和相应数字标在图上。图2-10 脱落牙再植效果成功40%良好14%较好26%失败20%成功成功良好良好较好较好失败失败 百分条图(百分条图(构成直条图构成直条图)是以矩形总长度作为)是以矩形总长度作为100%100%,将其分割成不同长度的段表示事物内部各构成,将其分割成不同长度的段表示事物内部各构成部分所占的比例。部分所占的比例。 百分条图在绘制时以以总长度百分条图在绘制时以以总长度L L为为100%100%,将总长度,将总长度L L乘以各类别的构成比得到各构成的长度,按由大到小乘以各类别的构成比得到各构成的长度,按由大到小顺序或类别的自然顺序排列,将其它项放在最后。顺序或类
19、别的自然顺序排列,将其它项放在最后。 不同的段用不同颜色或花纹区别,要用图例说明各不同的段用不同颜色或花纹区别,要用图例说明各种颜色或花纹代表的类别,条件允许可将各类别标目种颜色或花纹代表的类别,条件允许可将各类别标目和相应数字标在图上。和相应数字标在图上。图2-9 两种脱落牙再植效果0%20%40%60%80%100%嵌入性脱位牙脱落牙成功良好较好失败 圆图和百分条图都适用于描述分类变量的各圆图和百分条图都适用于描述分类变量的各类别所占的比例。类别所占的比例。但百分条图特别适用于多个但百分条图特别适用于多个构成比的比较。构成比的比较。将不同组别、不同时期或不同将不同组别、不同时期或不同地区的
20、某分类指标的构成比平行的绘制成多个地区的某分类指标的构成比平行的绘制成多个百分条图,可以方便比较其构成比的差异。百分条图,可以方便比较其构成比的差异。3 3。线图。线图 线图是用线段的升降来表示数值的变化情线图是用线段的升降来表示数值的变化情况,适用于描述某统计量随另一况,适用于描述某统计量随另一连续型数值变量连续型数值变量变变化而变化的趋势,最常用于描述统计量随时间变化化而变化的趋势,最常用于描述统计量随时间变化而变化的趋势。通常横轴是时间或其他连续性变量,而变化的趋势。通常横轴是时间或其他连续性变量,纵轴是统计指标。纵轴是统计指标。 标记直线的连接点时,如果测定值是在某时间标记直线的连接点
21、时,如果测定值是在某时间段或数值段,应标记在段或数值段,应标记在段的中点段的中点;如果测定值是;如果测定值是在某个时间点或确定值的,标记在相应时点或数在某个时间点或确定值的,标记在相应时点或数值上。各标记点要用直线连接,值上。各标记点要用直线连接,不可均匀成光滑不可均匀成光滑的曲线的曲线。 不同指标或组别可用不同的线段表示,并附图不同指标或组别可用不同的线段表示,并附图例说明。例说明。 线图根据横纵轴的尺度可分为线图根据横纵轴的尺度可分为普通线图普通线图和和半对半对数线图数线图。普通线图:横轴和纵轴尺度普通线图:横轴和纵轴尺度都是算术尺度都是算术尺度,其,其纵轴一般以纵轴一般以0 0作为起点,
22、否则需要作特殊标记或说作为起点,否则需要作特殊标记或说明明半对数线图:横轴尺度为算术尺度,半对数线图:横轴尺度为算术尺度,纵轴尺度纵轴尺度为对数尺度为对数尺度,特别是用于作不同指标变化速度,特别是用于作不同指标变化速度(发展速度(发展速度- -相对比)的比较。相对比)的比较。年度痢疾百日咳19751.450.2219800.820.0519850.230.0219900.140.01表4-11 1975-2000年某地百日咳与痢疾死亡率(1/10万)4 4。直方图。直方图 直方图是以直方面积描述各组频数(或直方图是以直方面积描述各组频数(或频率频率)的多少,面积总和相当于各组频数(或频率)的多
23、少,面积总和相当于各组频数(或频率)之和,适合表示数值变量的频数分布。之和,适合表示数值变量的频数分布。 直方图的直方图的横轴横轴尺度是数值变量,纵轴是尺度是数值变量,纵轴是频数频数或或频频率率或或频率密度频率密度,直方的宽为组距。,直方的宽为组距。频率密度频率密度= =频率频率/ /组距组距频数红细胞计数3.204.403.805.005.606.20510152025长方形的高度等于频数长方形的高度等于频数所有长方形面积之和等于1或100%频率密度红细胞计数3.204.403.805.005.606.200.10.20.30.40.5长方形的面积等于频率长方形的面积等于频率(频率/组距)0
24、.70.65 5。统计地图。统计地图 统计地图是用不同颜色和花纹表是统统计地图是用不同颜色和花纹表是统计量的值在地理分布上的变化,适宜描述研究指标计量的值在地理分布上的变化,适宜描述研究指标的地理分布。的地理分布。 统计地图先要绘制按行政区域或地理特征分区的统计地图先要绘制按行政区域或地理特征分区的地图,然后按各区域统计指标值分别标记不同颜色地图,然后按各区域统计指标值分别标记不同颜色或花纹,并加上图例说明不同颜色或花纹的意义。或花纹,并加上图例说明不同颜色或花纹的意义。颜色或花纹选择最好与统计量数值增减趋势一致,颜色或花纹选择最好与统计量数值增减趋势一致,如颜色由浅入深代表统计量值的增加。如
25、颜色由浅入深代表统计量值的增加。图图 我国我国HIVHIV感染者地理分布感染者地理分布( (截止到截止到20072007年年6 6月底月底) )6 6。箱式图。箱式图 箱式图使用箱式图使用5 5个统计量反映原始数据的分个统计量反映原始数据的分布特征,即数据分布的中心位置、分布、偏度、变异布特征,即数据分布的中心位置、分布、偏度、变异范围和异常值。范围和异常值。 箱式图的箱子两端分别是上、下四分位数;中间横箱式图的箱子两端分别是上、下四分位数;中间横线为中位数;两端横线分别是除异常点外的最小值和线为中位数;两端横线分别是除异常点外的最小值和最大值,异常点另外标记。最大值,异常点另外标记。 箱子越
26、长表示数据变异程度越大,箱子越短表示数箱子越长表示数据变异程度越大,箱子越短表示数据变异程度越小;中间的横线在箱子中点,表示分布据变异程度越小;中间的横线在箱子中点,表示分布对称,否则不对称。对称,否则不对称。 箱式图特别适用于多组数据分布的比较箱式图特别适用于多组数据分布的比较 图 两 种剂量治疗2 型糖尿病4 周后 餐后2 小时血糖下降 量的比较组别高剂量组低剂量组血糖下降值(m m o l / L)20151050异常值(离群值)异常值(离群值)大于大于1.5倍四份位数间距倍四份位数间距“触须触须”大于大于3倍四分位数间距称极端值,一般用倍四分位数间距称极端值,一般用“*” 表示表示7
27、7。茎叶图。茎叶图 茎叶图将数据分离成两部分:整数部分和茎叶图将数据分离成两部分:整数部分和尾数部分,整数部分形成图的茎,尾数部分形成图的尾数部分,整数部分形成图的茎,尾数部分形成图的叶。茎叶图的排列方式与频数表有些相似,每一行由叶。茎叶图的排列方式与频数表有些相似,每一行由一个整数的茎和若干叶构成。左边是茎的数值,茎宽一个整数的茎和若干叶构成。左边是茎的数值,茎宽一般标在图的下方。右边是叶,图中显示每个叶的尾一般标在图的下方。右边是叶,图中显示每个叶的尾数值,同样在图的下方标出每个叶代表几个实际观察数值,同样在图的下方标出每个叶代表几个实际观察值。茎叶图可以非常直观的显示数据的分布范围和形值
28、。茎叶图可以非常直观的显示数据的分布范围和形态。态。 频数频数 茎茎 & & 叶叶 1.00 2 . 31.00 2 . 3 .00 2 . .00 2 . 3.00 2 . 677 3.00 2 . 677 1.00 2 . 9 1.00 2 . 9 5.00 3 . 00011 5.00 3 . 00011 7.00 3 . 2222233 7.00 3 . 2222233 10.00 3 . 4555555555 10.00 3 . 4555555555 8.00 3 . 66667777 8.00 3 . 66667777 18.00 3 . 888888999999999999 18
29、.00 3 . 888888999999999999 10.00 4 . 0011111111 10.00 4 . 0011111111 9.00 4 . 222222333 9.00 4 . 222222333 11.00 4 . 44555555555 11.00 4 . 44555555555 4.00 4 . 6777 4.00 4 . 6777 6.00 4 . 888899 6.00 4 . 888899 3.00 5 . 001 3.00 5 . 001 4.00 5 . 2233 4.00 5 . 2233 .00 5 . .00 5 . 1.00 5 . 7 1.00 5 .
30、 7 茎宽茎宽: 1.00: 1.00 每叶每叶: 1 : 1 例例图图10-9 10110-9 101名正常成年女子的血清总胆固醇名正常成年女子的血清总胆固醇(mmol/L)(mmol/L)茎叶图茎叶图8 8。误差条图。误差条图 误差条图是通过样本信息来描述误差条图是通过样本信息来描述总体,估计抽样误差的大小。特别适合比较多个总体,估计抽样误差的大小。特别适合比较多个样本间的差异情况。误差条图可以显示三种不同样本间的差异情况。误差条图可以显示三种不同的区间:的区间: 可信区间、均数可信区间、均数标准差、均数标准差、均数标准误标准误SpssSpss软件中可以定义标准差和标准误的倍数,软件中可以定义标准差和标准误的倍数,默认为默认为2倍倍图图10-10 410-10 4个处理组低密度脂蛋白的均数与个处理组低密度脂蛋白的均数与95%95%可信区间可信区间spss统计图制作1.直条图复式条图2.圆图3.线图4.直方图组中值鼠标双击鼠标双击鼠标双击鼠标双击5.散点图6.误差条图