1、第二十三章第二十三章 统计分析结果的正确表达统计分析结果的正确表达 公共卫生学院流行病与卫生统计学系公共卫生学院流行病与卫生统计学系统计图表2统计表统计表(statistical table)概念概念 统计表就是以表格的形式,表达被研究对象的特征、统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。内部构成及研究项目分组之间的数量关系。统计表的结构统计表的结构 统计表的基本结构包括:标题、标目、线条、数字、统计表的基本结构包括:标题、标目、线条、数字、以及备注。以及备注。统计表的基本结构与要求统计表的基本结构与要求 .横横 标标 目目.纵纵 标标 目目 纵纵 标
2、标 目目横标目的横标目的总总 标标 目目备注:备注:表号表号 标题(包括何时、何地、何事)标题(包括何时、何地、何事)顶线顶线标目线标目线合计线合计线底线底线统计图表4表表1.甲、乙两地甲、乙两地1980年年HbsAg阳性率阳性率地区地区调查数调查数阳性数阳性数阳性率(阳性率(%)甲地甲地 5000110022.0乙地乙地 6000105017.5合计合计11000215019.5统计图表5统计表的绘制原则统计表的绘制原则 总原则:总原则:(1)重点突出:重点突出:一张表一般只包括一个中心内容,一张表一般只包括一个中心内容,不要包不要包罗万象,要使人看过后能明白表格所要表达的主要内容罗万象,要
3、使人看过后能明白表格所要表达的主要内容。(2)层次分明层次分明:标目的安排及分组符合逻辑,便于分析比标目的安排及分组符合逻辑,便于分析比较较。一般地,横标目:主语;一般地,横标目:主语;纵标目纵标目 :宾语。:宾语。(3 3)简单明了:)简单明了:文字、数字和线条都尽量从简。文字、数字和线条都尽量从简。统计图表6标题标题 是表格的总名称,高度概括表的主要内是表格的总名称,高度概括表的主要内容研究的时间、地点和研究内容。如甲、乙容研究的时间、地点和研究内容。如甲、乙两地两地19801980年年HbsAgHbsAg阳性率。阳性率。标目标目 分为横标目和纵标目。分为横标目和纵标目。横标目横标目 一般
4、用来说明被研究事物的主要标志,位于表格的左侧,一般用来说明被研究事物的主要标志,位于表格的左侧,例如表例如表1 1中的中的“甲地、乙地、合计甲地、乙地、合计”一栏;一栏;纵标目纵标目 说明各个统计指标的内容,位于表格的第一横行,例如说明各个统计指标的内容,位于表格的第一横行,例如表表1 1中的中的“调查数、阳性数、阳性率调查数、阳性数、阳性率”。统计表的基本要求统计表的基本要求统计图表7线条线条 线条不易过多,常用线条不易过多,常用3 3条线表示条线表示,谓之谓之“三线图三线图”。顶线、底线、纵标目下横线。顶线、底线、纵标目下横线;数字数字 阿拉伯数字表示阿拉伯数字表示,同一指标小数点位同一指
5、标小数点位数一致,位次对齐数一致,位次对齐;备注备注 是对于表格的文字说明,不是表的必是对于表格的文字说明,不是表的必要内容。要内容。统计表的基本要求统计表的基本要求统计图表8二、统计表的种类二、统计表的种类通常按分组标志多少分为通常按分组标志多少分为简单表简单表与组合表组合表。1.简单表简单表(simple table)统计图表9统计图表102.组合表(组合表(combinative table)统计图表11统计图表12三、统计表的审查和修改三、统计表的审查和修改审查内容审查内容:标题是否简明、清楚标题是否简明、清楚纵横标目位置是否颠倒。纵横标目位置是否颠倒。线条是否不规范、有竖线、斜线。线
6、条是否不规范、有竖线、斜线。标目缺少单位或含义是否清楚。标目缺少单位或含义是否清楚。标目的层次是否太多、排列是否有条理。标目的层次是否太多、排列是否有条理。统计图表14统计图表15统计图表16 统计图统计图(statistical graph)概念:概念:统计图就是用点、线、面等各种几何图形统计图就是用点、线、面等各种几何图形表达统计数据和分析结果。表达统计数据和分析结果。统计图的基本结构统计图的基本结构 标题:标题:高度概括统计图资料的时间、地点和主要高度概括统计图资料的时间、地点和主要内容图的下方;内容图的下方;标目:标目:横标目和纵标目,分别表示横轴和纵轴数横标目和纵标目,分别表示横轴和
7、纵轴数字刻度的意义;字刻度的意义;刻度刻度:指在纵轴和横轴上的坐标;:指在纵轴和横轴上的坐标;图例图例:说明统计图中各种图形所代表的事物。:说明统计图中各种图形所代表的事物。统计图表17统计图的基本格式:统计图的基本格式:图体图体横标目横标目 (单位)(单位)标题标题纵标目(单位)纵标目(单位)0横轴:安排比较的事物(组别)横轴:安排比较的事物(组别)纵轴:安排比较的统计指标纵轴:安排比较的统计指标图图 例例1图图 例例2统计图表18 统计图制作的一般原则统计图制作的一般原则 根据资料性质和分析目的正确选用适当的统计图根据资料性质和分析目的正确选用适当的统计图 一般用直角坐标系的第一象限的位置
8、表示图域一般用直角坐标系的第一象限的位置表示图域(制图制图空间空间)绘制图形应注意准确、美观,给人以清晰的印象绘制图形应注意准确、美观,给人以清晰的印象 统计图表19常用的统计图有:常用的统计图有:1.1.直条图直条图 2.2.圆图圆图 3.3.直方图直方图 4.4.线图线图 5.5.散点图散点图统计图表201.1.直条图直条图(bar chart)(bar chart)1概念:用等宽直条的长短来表示各个相概念:用等宽直条的长短来表示各个相互独立的指标大小的图形。互独立的指标大小的图形。2适用资料:相互独立的资料(资料有明适用资料:相互独立的资料(资料有明确分组,不连续)。确分组,不连续)。3
9、分类:分为单式和复式两种。单式适用分类:分为单式和复式两种。单式适用于只有一组观察资料(见图于只有一组观察资料(见图1),复式适用),复式适用于有若干组观察资料于有若干组观察资料。4应用:相互独立资料间的比较。应用:相互独立资料间的比较。5.制图要求:直条尺度必须从制图要求:直条尺度必须从0开始,且等开始,且等距,否则会改变各对比组间的比例关系。距,否则会改变各对比组间的比例关系。图2.某 地1 9 9 5年 癌 症、心血管疾病死亡率020406080100120癌症心血管疾病死亡率(1/1 0 万)男女图1.三 组标本血清阳性例数012345678甲乙丙组别阳性例数统计图表22图图19.1
10、某地某地1952年与年与1992年三种死因的死亡率比较年三种死因的死亡率比较 该地该地1992年与年与1952年相比,恶性肿瘤、心脏病的死亡率均上升,且恶性肿年相比,恶性肿瘤、心脏病的死亡率均上升,且恶性肿瘤死亡率的上升幅度较心脏病大;肺结核的死亡率则下降。瘤死亡率的上升幅度较心脏病大;肺结核的死亡率则下降。统计图表23图图23.1全国各地区全国各地区1990年、年、2000年人口总数比较年人口总数比较统计图表242.2.直方图直方图(histogram)(histogram)1概念:是以概念:是以直方面积直方面积描述各组频数的多少,面描述各组频数的多少,面积的总和相当于各组频数之和。积的总和
11、相当于各组频数之和。2适用资料:连续变量的频数分布。适用资料:连续变量的频数分布。3绘制要点绘制要点(1)坐标轴:横轴代表变量值,要用相等的距)坐标轴:横轴代表变量值,要用相等的距离表示相等的数量。纵轴坐标要从离表示相等的数量。纵轴坐标要从0开始。开始。(2)各矩形间不留空隙。各矩形间不留空隙。(3)对于组距相等的资料可以直接作图;组距)对于组距相等的资料可以直接作图;组距不等的资料先进行换算,全部转化为组距相等不等的资料先进行换算,全部转化为组距相等的频数,用转化后的频数作图。的频数,用转化后的频数作图。统计图表25 图图4.1 20054.1 2005年某市年某市120120名名9 9岁男
12、孩肺活量频数分布岁男孩肺活量频数分布 统计图表26表表23.62000年某地乙脑病例的年龄分布年某地乙脑病例的年龄分布图图23.62000年某地乙脑病例的年龄分布年某地乙脑病例的年龄分布3.3.百分条图百分条图(percentage bar chart)(percentage bar chart)概念:以长条面积为概念:以长条面积为100%,用长条内各段面,用长条内各段面积所占的百分比来表示各部分在全体中所占的积所占的百分比来表示各部分在全体中所占的比例比例 适用资料:构成比资料。适用资料:构成比资料。应用:描述各部分的百分构成。应用:描述各部分的百分构成。图 3.某 地 5 岁 以下 儿 童
13、死 因分 布0%10%20%30%40%50%60%70%80%90%100%呼吸系疾病传染病先天缺陷其它统计图表29图23.32005年不同性别居民公共场所吸烟构成比较统计图表304.4.圆图圆图(pie chart)(pie chart)概念:以一个圆面积为概念:以一个圆面积为100%,用圆内各扇,用圆内各扇形面积所占的百分比来表示各部分所占的构形面积所占的百分比来表示各部分所占的构成比例成比例 适用资料:构成比资料。适用资料:构成比资料。应用:描述各部分的百分构成。应用:描述各部分的百分构成。统计图表31统计图表327.27%西北8.44%东北11.72%华北15.44%西南28.24%
14、中南28.89%华东图23.22000年各地区人口在全国总人口中的构成比(%)统计图表335.5.普通线图普通线图(line diagram)(line diagram)概念:以线段的上升或下降来表示事物在概念:以线段的上升或下降来表示事物在时间上的发展变化或一种现象随另一种现时间上的发展变化或一种现象随另一种现象变迁的情况象变迁的情况 适用资料:连续性资料。适用资料:连续性资料。应用:反映事物的连续的动态变化规律。应用:反映事物的连续的动态变化规律。统计图表34图图 23.423.41981-19911981-1991年某城市猩红热发病率变化趋势年某城市猩红热发病率变化趋势统计图表356.6
15、.半对数线图半对数线图(semilogarithmic line graphsemilogarithmic line graph)纵轴为对数尺度,横轴为算术尺度,表纵轴为对数尺度,横轴为算术尺度,表示数量之间的相关,描述示数量之间的相关,描述相对变化趋势。相对变化趋势。半对数线图是线图的一种特殊形式,主半对数线图是线图的一种特殊形式,主要用于:要用于:(1)比较所研究指标的比较所研究指标的变化速度变化速度;(2)作对比的多组观察结果)作对比的多组观察结果具有不同数量级。具有不同数量级。统计图表36a纵轴为算术尺度纵轴为算术尺度 b.纵轴为对数尺度纵轴为对数尺度 图图23.519891993年某
16、地痢疾和斑疹伤寒发病率的变化趋势年某地痢疾和斑疹伤寒发病率的变化趋势下降幅度下降幅度下降速度下降速度统计图表397.7.散点图散点图(scatter diagram)(scatter diagram)1概念:以点的密集程度和趋势来表示两种概念:以点的密集程度和趋势来表示两种现象的相关关系。现象的相关关系。2适用资料:双变量资料。适用资料:双变量资料。3.应用:反映两事物间的相关关系,主要用应用:反映两事物间的相关关系,主要用于相关回归分析。于相关回归分析。统计图表41图图4.12 纽芬兰纽芬兰33名妇女年龄与收缩压散点图名妇女年龄与收缩压散点图统计图表428.8.箱式图箱式图 (box plo
17、t)(box plot)箱子上、下两端分别是上四分位数和下四分位箱子上、下两端分别是上四分位数和下四分位数,中间横线是中位数数,中间横线是中位数M,两端连线分别是除,两端连线分别是除异常值外的最小值和最大值异常值外的最小值和最大值,另外还需要标记可另外还需要标记可能的异常值。箱式图通过使用上述能的异常值。箱式图通过使用上述5个统计量个统计量反映原始数据的分布特征。反映原始数据的分布特征。统计图表43图23.7某地不同年龄段男性农民工体重箱式图P75最大值最小值MP25统计图表44 箱式图:反映数据的分布特征;箱式图:反映数据的分布特征;常用于多组数据分布比较。常用于多组数据分布比较。箱子越长:
18、变异越大;箱子越长:变异越大;中间横线(中间横线(M)在箱子中点:对称分布。)在箱子中点:对称分布。统计图表459.9.统计地图统计地图 (statistical map)统计地图是用不同的颜色和花纹表统计地图是用不同的颜色和花纹表示统计量的值在地理分布上的变化,适示统计量的值在地理分布上的变化,适合描述研究指标的地理分布。合描述研究指标的地理分布。统计图表46图图23.82004年四川省乙脑发病率的地区分布年四川省乙脑发病率的地区分布统计图表47统计表统计表统计表掌握其注意事项:统计表掌握其注意事项:1.1.标题是否简明、清楚,是否高度概括表的主要内容;标题是否简明、清楚,是否高度概括表的主
19、要内容;2.2.纵横标目位置是否颠倒纵横标目位置是否颠倒。横标目一般用来说明被研究。横标目一般用来说明被研究事物的主要标志,位于表格的左侧,纵标目说明各个统计事物的主要标志,位于表格的左侧,纵标目说明各个统计指标的内容,位于表格的第一横行,指标的内容,位于表格的第一横行,标目是否缺少单位或标目是否缺少单位或含义是否清楚。含义是否清楚。标目的层次是否太多、排列是否有条理;标目的层次是否太多、排列是否有条理;3.3.线条不宜过多,常用线条不宜过多,常用3 3条线表示条线表示,谓之谓之“三线图三线图”。顶。顶线、底线、纵标目下横线线、底线、纵标目下横线;不能有竖线和斜线;不能有竖线和斜线;4.4.数
20、字:阿拉伯数字表示数字:阿拉伯数字表示 ,同一指标小数点位数一致,同一指标小数点位数一致,位次对齐。位次对齐。统计图统计图统计图掌握什么情况下用什么图:统计图掌握什么情况下用什么图:1.1.相互独立资料间的某个或多个指标的比较相互独立资料间的某个或多个指标的比较-条图条图2.2.连续变量的频数分布连续变量的频数分布-直方图直方图3.3.构成比构成比-圆图或百分条图圆图或百分条图4.4.描述指标的变化趋势描述指标的变化趋势-线图线图5.5.比较指标的变化速度比较指标的变化速度-半对数线图半对数线图6.6.两种现象的相关关系两种现象的相关关系-散点图散点图 统计图表501.1.直条图与直方图比较直
21、条图与直方图比较图2.某 地1 9 9 5年 癌 症、心血管疾病死亡率020406080100120癌症心血管疾病死亡率(1/1 0 万)男女频数年龄0510152025303540455055600510152025 图图5 某地某年乙型病毒性脑炎患者的年龄分布某地某年乙型病毒性脑炎患者的年龄分布 统计图表512.2.百分条图与圆图比较百分条图与圆图比较图3.某 地5 岁以下 儿童死因分布0%10%20%30%40%50%60%70%80%90%100%呼吸系疾病传染病先天缺陷其它统计图表523.3.普通线图与半对数线图比较普通线图与半对数线图比较存在的问题:存在的问题:1.横标目和纵标目倒
22、置;横标目和纵标目倒置;2.比例比例基数未放置在标目中;基数未放置在标目中;3.多余的横竖线条。多余的横竖线条。修改后:统计图表55定量资料统计分析错误辨析定量资料统计分析错误辨析统计图表5657提 问:58某单位调查了某单位调查了4类人员乙型肝炎表面抗体(类人员乙型肝炎表面抗体(HBsAb)的阳性率,想比较的阳性率,想比较3种病人与健康人群的阳性率有无种病人与健康人群的阳性率有无差别。差别。讨论:讨论:(1)若看成一个)若看成一个42列联表资料进行列联表资料进行1次检验,是次检验,是否能达到分析目的?否能达到分析目的?(2)若将每一种病人与健康人群)若将每一种病人与健康人群 HBsAb的检查结的检查结果分别组成四格表,进行果分别组成四格表,进行3次四格表检验,对否?次四格表检验,对否?(3)怎样达到分析目的?)怎样达到分析目的?统计图表61统计图表62统计图表63统计图表64