1、,2020/4/6,1,医学统计学 人民卫生出版社,第四章 统计表与统计图,2020/4/6,2,学习目标 掌握:正确绘制统计表;常用统计图的使用条件和绘制方法。 熟悉:编制统计表的的注意事项;绘制统计图的基本要求。 了解:统计表和统计图的种类。,2020/4/6,3,统计表和统计图是对资料进行统计描述的重要工具。统计表(statistical table)是把统计分析资料及其指标用表格列出,从而代替冗长的文字叙述,便于计算、分析和对比。统计图(statistical graph)是用点、线、面等表达统计资料中数量及其变化趋势,使统计资料形象、易懂,可直观地反映出事物间的数量关系。但由于统计图
2、对数量的表达比较粗略,不便作深入细致的分析,所以一般在绘制统计图时,都应附有统计表。,2020/4/6,4,第一节 统计表 统计表主要有表序、标题、标目、表体和线条等组成,其基本格式如下:,2020/4/6,5,一、制表的基本要求 编制统计表主要的要求是表的中心内容要突出,一张表表达一个中心问题为宜,具体要求是: 1.标题 统计表要有一个简明扼要能概括表中内容的标题,不要过于繁锁,也不要过于简略而不能说明问题,它应包括时间、地点、内容等。标题应写在表顶线的上端中间的位置,必要时应注明资料的来源。如资料有两个以上的统计表时,应在表的左上方编出表序(如表1,表2,)。,2020/4/6,6,表1
3、某地区2004年婚前检查检出疾病情况,* 指定传染病指我国法定的甲、乙、丙三类传染病。,2020/4/6,7,2.标目 用以说明表内数字含义的部分叫标目。 (1)横标目 横标目位于表左侧,是统计表所要叙述的主语,它说明同一横行数字的意义。表1的疾病栏。 (2)纵标目 纵标目位于标目线的上端,是被说明事物的谓语,一般是绝对数或统计指标。表1的病例数和百分比栏。 横纵标目的先后顺序,可按时间的先后、事物的重要性、数字的大小、地理分布等有规则的排列。,2020/4/6,8,3.线条 线条应尽量减少,除顶线、标目线、合计线和底线外,其余线条均可省略。特别是表的左上角的斜线和两侧的边线应一律不用,这样的
4、表既美观又实用。 4.数字 表内的数字一律用阿位伯数字,同一指标个位数要对齐,小数点的位数要一致,一般保留12位小数。无数字的空格用“”表示,暂缺或未记录用“”表示。 5.备注 表内不应有其他文字出现,需要说明的备注用“*”号标出,写在表的底线下面。,2020/4/6,9,二、统计表的种类 1.简单表 只按一个特征或标志分组的统计表称为简单表。如表4-1。,表4-1,2020/4/6,10,2.复合表 按两个或两上以上特征或标志结合起来分组的统计表称复合表或组合表。如表4-2。将病型和病情两个标志结合起来分组,可以分析不同病型和病情者流脑的病死率,表4-2,2020/4/6,11,三、编制统计
5、表应注意的事项 1.简明扼要,重点突出 在科研文章中只要篇幅不限,最好是一张表只表现一个中心内容。但目前的科研文章往往受到篇幅的限制,多用复合表。关键是统计表让人一目了然。如表4-3。 2.合理安排主语和谓语的位置 主语位于横标目,谓语列于纵标目,主语到谓语连起来是完整的一句话。 3.表内数据要准确无误。,2020/4/6,12,表4-3 代谢综合征发生与否两组人群部分基线指标比较,*均数(标准差);#中位数(下-上四分位数); 经常锻炼指每周一次及以上,2020/4/6,13,例4-1 某研究人员欲表述两种方法治疗急性心肌梗塞并发休克的效果,绘制表4-4 。指出表4-4的错误,并作改进。,表
6、4-4,表4-5,2020/4/6,14,表4-6,表4-7,2020/4/6,15,第二节 统计图 统计图有多种,医学研究工作中常用的统计图有:直条图、百分直条图、圆形图、线图、半对数线图、直方图、散点图、箱式图和统计地图等。,2020/4/6,16,一、制图的基本要求 1.根据资料性质和分析的目的,正确选择合适的图型。,2020/4/6,17,2.每图应有标题,其要求与统计表相同,一般放在图下方正中。 3.纵横两轴应有标目并注明单位。横标目一般表示主语,如疾病名称、发病时间、年龄组等,尺度自左向右;纵标目表示谓语,一般表示频数、比或率,尺度自下而上,一般需从零开始,由小到大。在某些情况下可
7、根据具体情况确立起点的数值。纵横两轴长宽比例一般为5:7为宜。 4.若图中用不同颜色或线条代表不同事物,则须在图中用图例加以说明。,2020/4/6,18,二、常用统计图及其绘制方法 1.条图(bar graph) 它是以等宽直条的长短来表示各指标的数值,用来表示各相互独立指标之间的对比关系。直条图有单式直条图(图4-1)、复式直条图(图4-3)两种。其绘制方法如下: (1)一般以横轴为基数表示各独立指标,纵轴表示各项相应的指标数值,可以是绝对数、相对数和平均数。 (2)纵轴尺度必须从0开始,中间不要折断,否则会改变直条长短的比例,使人产生错角。,2020/4/6,19,图4-1-1 北京市居
8、民2011年前四位死因人群死亡率,图4-1-2 北京市居民2011年前四位死因人群死亡率(错图),2020/4/6,20,(3)各直条的宽度应当相等,直条间应有相等的间隙,其宽度一般为直条宽度的1/21。 (4)各直条可按长短或习惯顺序排列。 (5)如果直条的高度是均数,在其均数上下用“”绘以标准差或标准误的范围(图4-2),表示各均数的变异程度,这样更增加图的表现力。,图4-2 正常组和病人组血清胆固醇含量的比较,2020/4/6,21,(6)复式直条图是以组为单位,每组包括两个或多个直条,但最好不超过三条,同一组直条间不留间隙,直条所代表的类别应有图例说明,如图4-3。,图4-3 北京市居
9、民2011年不同性别前四位死因死亡率,2020/4/6,22,2.圆形图(pie graph) 是以圆面积为100%,圆内各扇形面积为各部分所占的百分比,用来表示事物各组成部分的构成比,如图4-4。绘制方法如下:,图4-4 北京市居民2011年主要死因构成,2020/4/6,23,(1)以圆心角所夹的面积大小来表示数量,圆面积的1%相当于3.6,将资料各部分所占的百分数乘以3.6即得各部分应占的度数。 (2)圆内各部分按百分比的大小顺序或按事物自然顺序排列,一般以时钟12点或9点的位置作始点,顺时针方向排列。 (3)以不同的颜色或图案代表不同的部分,在图外适当位置加图说明,也可以在图上简要注明
10、文字和百分比。 (4)如果需要比较总体中各部分所占百分构成,可在同一水平线上绘几个直径相等的圆,并且各部分的排列次序也应一致,以便比较。,2020/4/6,24,3.百分直条图(percent bar graph) 用途和圆形图一样,用于表示事物内部各组成部分所占的比重。它只是以一直条的面积为100%,直条内各段的面积为相应部分所占的百分比。见图4-5。绘制方法如下:,(1)先绘制一直条,长度和宽可任意选择,以全长为100%。可在直条图旁画一与长条平行并等长的标尺,尺度为0100,以助说明。,2020/4/6,25,(2)按各部分所占的百分比,从大到小把直条分成若干段。 (3)各段用简单文字、
11、不同颜色或线条表示,并标出所占的百分比。必要时用图例说明。,图4-5 北京市居民2011年主要死因构成,2020/4/6,26,(4)若比较几个性质类似的百分构成时,可在同一基线上画几个相同长度、宽度的平行直条,但每一直条内各段的排列顺序应相同,各直条间留适当的空隙。,图4-6 2009年我国城乡前五位主要疾病死因构成,2020/4/6,27,4.线图(line graph) 它是用线段的上升、下降来说明某事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。适用于连续性资料。绘制方法如下: (1)纵轴一般表示数量如比、率、频率等,其尺度一般从零开始,也可不从零开始。横轴表示时间、年龄、
12、其他数量或组段,应以同样的距离表示相等的时期或数量。 (2)纵、横轴长度的比例一般约5:7为宜。同一图内线条不宜太多,一般不要超过45条。有两条或两条以上的线条时,要用不同颜色或线段加以区别,并用图例说明。,2020/4/6,28,图4-7 某市市区人口各年度出生率()、死亡率()、自然增加率(),2020/4/6,29,(3)绘图时,各点应当点在组段的中心,相邻两点用直线连接,切忽任意修匀成光滑曲线。 5.半对数线图(semi-logarithmic line graph) 它是纵轴为对数尺度,横轴为算术尺度的线图。由于同样的增长速度在对数尺度上的距离是相等的,因此便于两事物或两种以上事物在
13、发展速度上的对比。,2020/4/6,30,表4-8 某地19501966年伤寒与结核病的死亡率(1/10万),半对数线图其横轴位算术尺度,纵轴为对数尺度。表4资料看,从1950到1966年,伤寒的死亡率从31.3/10万下降为0.3/10万,下降的绝对差为31.3-0.3=31 /10万,而相对比为31.3/0.3=104.33 ,对数差为lg31.3-lg0.3=2.02。,2020/4/6,31,结核的死亡率从174.5/10万下降为37.5/10万,下降的绝对差为174.5-37.5=137/10万,而相对比为174.5/37.5=4.65,对数差为lg174.5-lg37.5=0.6
14、7。,图4-8-1 某地19501966年伤寒和结核病的死亡率变化情况(线图),2020/4/6,32,图4-8-2 某地19501966年伤寒和结核病的死亡率变化情况(半对数线图),2020/4/6,33,6.直方图(histogram) 直方图常用于表示连续型变量资料的频数或频率分布。是以各矩形的面积表示各组段的频数或频率,各矩形面积的总和为总频数或总频率,其绘制方法如下: (1)横轴尺度表示被观察变量的组段,纵轴表示频数或频率,纵轴尺度应从零开始。 (2)各直条间不留空隙,当组距相等时,矩形的高与频数或频率呈正比例,故可直接按纵轴尺度绘出相应的矩面积。如果组距不相等,要折合成等距离,直条
15、的高度=频数/组距;或直条的高度=频率/组距,即为概率密度。,2020/4/6,34,图4-9 120名健康成年男子血清铁含量(mol/L)分布,2020/4/6,35,图4-10 120名健康成年男子血清铁含量(mol/L)分布,2020/4/6,36,表4-9 某市某年乙脑患者的年龄分布,2020/4/6,37,图4-11 某市某年乙脑患者的年龄分布(正确图),2020/4/6,38,图4-12某市某年乙脑患者的年龄分布(错图),2020/4/6,39,图4-13 14例中老年健康女性基础代谢与体重的散点图,7.散点图(scatter diagram) 散点图是用点的密集程度和趋势表示两现
16、象间的相关关系。,2020/4/6,40,8.箱式图(box plot) 常用于反映几组数据的变化情况并进行直观比较分析。以“箱子”上端为P75, 下端为P25,中间以横线示P50(即中位数),最大值、最小值为“箱子”上下两个柄,用于数据直观比较分析。如果中位数的线条不在箱体的中部,说明变量的分布是有偏性的。,2020/4/6,41,图4-14 抑肿瘤药不同剂量组与对照组用药后小白鼠肿瘤重量的比较,2020/4/6,42,9.统计地图(statistical map) 统计地图是用点、线、颜色、形象或其他符号绘制于地图上,以表示某种事物的地理分布情况。 绘制方法:先给一张地图,然后把资料按等级
17、数据或不同性质在地图的相应位置上分别用各种符号表达出来,以清晰地反映出不同疾病在不同地域的发病率、死亡率等情况,有助于从生态学研究方面提出或建立病因假说。见图4-15。,2020/4/6,43,图4-15 2009年5月27日中国甲型H1N1流感疫情图,2020/4/6,44,学习小结 1.统计图和统计表是统计描述的重要方法。统计表通常由标题、标目、线条、数字四部分组成,要求简明扼要,重点突出;应合理安排表达事物的主语和谓语,主语位于横标目,谓语列于纵标目;表内数据要求准确无误。 2.统计图通常由标题、标目、刻度、图例四部分组成,要根据资料性质和分析的目的,正确选择合适的图型;每图应有标题,其要求与统计表相同,一般放在图形下方正中;纵横两轴应有标目并注明单位;若图中用不同颜色或线条代表不同事物,则须在图中加以说明。常用统计图有条图、圆形图、百分直条图、线图、半对数线图、直方图、散点图、箱式图和统计地图等。,2020/4/6,45,Thank You !,