1、第五章第五章 计数资料的统计描述计数资料的统计描述 Description of Enumeration data Content?Rate、constituent ratio and ratio?Application of relative measurement?Standardization rate?Dynamic series 第五章 计数资料的统计描述?常用的相对数:?一、率。?二、构成比?三、相对比 第五章 计数资料的统计描述?计数资料常见的数据形式是绝对数,如某病的出院人数、治愈人数、死亡人数等。?但绝对数通常不具有可比性:?1、如甲、乙两个医院某病出院人数不同时,比较两医院
2、该病的死亡人数没有意义?2、如00级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义?因此需要在绝对数的基础上计算相对数。第一节 常用相对数 一、率 率:说明某现象发生的频率或强度。常以百分率(%)、千分率()、万分率(1/万)、十万分率(1/10万)等表示,计算公式为:?某时期内发生某现象的观察单位数率比例基数 同期可能发生某现象的观察单位总数第一节 常用相对数?式中比例基数,可以取100%、1000、10万/10万等。?比例基数的选择主要根据习惯用法和使计算的结果能保留12位整数,以便阅读。例如患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以十万分率表示。第一节 常
3、用相对数?例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。?高血压患病率为:?2823/8589?100%=32.87%。第一节 常用相对数?二、构成比?构成比:表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。?通常以100%为比例基数。其计算公式为 100%(5-2)?某一组成部分的观察单位数构成比 同一事物各组成部分的观察单位总数第一节 常用相对数?设某事物个体数的合计由A1,A2,Ak个部分组成,构成比的计算为:.100%kAA AA?112构成比1 +100%kAAAA?21
4、2构成比2 +100%kkAkAAA?12构成比 +第一节 常用相对数 例5-2 某医院1990年和1998年住院病人死于五种疾病的人数见表 5-1。1990年因五种疾病死亡的人数共190人,其中死于恶性肿瘤者58人,恶性肿瘤死亡人数占五种疾病死亡人数的构成比为58/190100%=30.53%。同理可分别计算出1990年和1998年循环系统疾病、呼吸系统疾病等死亡占五种疾病死亡人数的构成比,结果见表 5-1。第一节 常用相对数 表 5-1 某医院1990年和1998年住院病人五种疾病死亡人数和构成比 疾病 构成 1990年 1998年 死亡人数 构成比(%)死亡人数 构成比(%)恶性肿瘤 5
5、8 30.53 40 26.85 循环系统 疾病 44 23.16 44 29.53 呼吸系统疾病 37 19.47 29 19.46 消化系统 疾病 19 10.00 18 12.08 传染病 32 16.84 18 12.08 合 计 190 100.00 149 100.00 第一节 常用相对数?从表5-1可以看出该医院 1990和1998两年五种疾病死亡构成比的排序不同。1990年五种疾病死亡人数中 恶性肿瘤 所占比重最大,其次为循环系统疾病,消化系统疾病死亡占的比重最小;?1998年循环系统疾病占五种疾病死亡人数的比重最大,其次为恶性肿瘤,消化系统疾病、传染病死亡则占比重最小。第一节
6、 常用相对数?构成比有两个特点:?(1)说明同一事物的k个构成比的总和应等于100%,即各个分子的总和等于分母。?(2)各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响。其一是这个部分自身数值的变化,其二是受其它部分数值变化的影响。第一节 常用相对数?表5-1中,1990与1998年住院病人五种疾病死因构成的总和均为 100%。?1998年呼吸系统疾病死亡人数比1990年少,但构成比却比较接近;再看两年的循环系统疾病死亡人数相同,而1998年的构成比却较1990年高,这不能说明1998年循环系统疾病的病死严重程度较1990年高。?死因构成比只能说明某病死亡人数在总死亡人数中所
7、占比重,如需要比较其病死的严重程度,则要计算病死率。第一节 常用相对数?三、相对比?相对比简称比(ratio),是两个有关指标之比,说明两指标间的比例关系。?两个指标 可以是 性质相同,如不同时期发病数之比;也可以性质不同,如医院的门诊人次与病床数之比。通常以倍数或百分数(%)表示。第一节 常用相对数?计算公式为?式中两指标可以是绝对数、相对数或平均数。=(100%)?甲指标相对比乙指标第一节 常用相对数?例5-3 某年某医院出生婴儿中,男性婴儿为370人,女性婴儿为358人,则出生婴儿性别比例为370/358100=103,说明该医院该年每出生100名女婴儿,就有103名男性婴儿出生,它反映
8、了男性婴儿与女性婴儿出生的对比水平。?据大量观察,出生婴儿男多于女,出生性别比一般在104107之间。这个医院的出生性别比为103,说明该年该医院出生女婴相对较多。第二节 应用相对数的注意事项?1、计算相对数应有足够数量即分母不宜太小。?如果例数较少会使相对数波动较大。如某种疗法治疗5例病人 5例全部治愈,则计算治愈率为55100%=100%,若4例治愈,则治愈率为45100%=80%,由100%至80%波动幅度较大,但实际上只有1例的变化。在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示。第二节 应用相对数的注意事项?但动物实验时,
9、可以通过周密设计,严格控制实验条件,例如毒理实验,每组用10只纯种小鼠也可以了。?分母到底多大才可以呢??要根据研究目的、研究指标而定!第二节 应用相对数的注意事项?2、不能以构成比代替率?构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误例如表5-2研究已婚育龄妇女在不同情况下放置避孕环与失败率的关系。第二节 应用相对数的注意事项 表 5-2 已婚育龄妇女不同情况下放环失败率的比较 放环情况(1)放环人数 (2)失败人数(3)失败人数比(%)(4)失败率(%)(5)人工流产后 255 78 61.9 30.
10、6 月经后 87 39 31.0 44.8 哺乳期 17 9 7.1 52.9 合 计 3 59 126 100.0 35.1 第二节 应用相对数的注意事项?临床工作者常常用门诊或住院病人的资料来分析疾病与年龄、性别、职业等因素的关系。但值得注意的是所计算的相对数一般都是构成比,不能当作率来分析。第二节 应用相对数的注意事项?例如,某医师对口腔门诊不同年龄龋齿患病情况(表 5-3)进行了分析,得出4049岁组患病率高,09岁组和70岁及以上组患病率低的错误结论。?第二节 应用相对数的注意事项 表 5-3 口腔门诊龋齿患 者年龄构成 年龄组(岁)患者人数 患者构成比(%)0 9 3.8 10 3
11、6 15.3 20 34 14.4 30 37 15.7 40 45 19.1 50 39 16.5 60 21 8.9 70 15 6.3 合 计 236 100.0 第二节 应用相对数的注意事项?表5-3资料仅能说明该病门诊龋齿患者中各年龄组病人所占比重,只能计算构成比指标,不能反映各年龄组的患病水平,因此不能根据此资料认为 4049岁组患病率高,而老年组和少年组低。因为各年龄组人口数、就诊机会等因素,都会影响就诊病人的年龄构成。仅通过门诊记录是不能够得到各年龄组人口数和全部现患病例数的,所以不能分析年龄因素与患病水平的关系。第二节 应用相对数的注意事项?了解不同年龄龋齿患病情况,需要通过
12、人群的抽样调查,了解各年龄组的调查人数及所有现患病例数,才能分别计算年龄别患病率,从而分析龋齿患病水平与年龄大小的关系。第二节 应用相对数的注意事项?3.正确计算合计率?对分组资料计算合计率或称平均率时,不能简单地由各组率相加或平均而得,而应用合计的有关实际数字进行计算。例如用某疗法治疗肝炎,甲医院治疗150人,治愈30人,治愈率为20%;乙医院治疗100人,治愈30人,治愈率为 30%。两个医 院合计治愈 率应该是(30+30)/(150+100)100%=24%。若 算 为20%+30%=50%或(20%+30%)/2=25%,则是错的。第二节 应用相对数的注意事项?4.注意资料的可比性
13、在比较相对数时,除了要对比的因素(如不同的药物),其余的影响因素应尽可能相同或相近。在临床研究和动物实验时,应遵循随机抽样原则进行分组。第二节 应用相对数的注意事项?下列因素可能影响对比组之间的可比性:?(1)观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。?(2)观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同,可以分别进行同年龄别、同性别的小组率比较或对总率(合计率)进行标准化后再作比较(见本章第三节)。第二节 应用相对数的注意事项?5.对比不同时期资料应注意客观条件是否相同 例如,疾病报告制度完善和资料完整的地区或年
14、份,发病率可以“升高”;居民因医疗普及,就诊机会增加,或诊断技术提高,也会引起发病率“升高”。因此在分析讨论时,应根据各方面情形全面考虑,慎重对待。?6.样本率(或构成比)的比较应做样本率(或构成比)假设检验。第三节 率的标准化法?一、标准化法的意义和基本思想?当比较的两组或多组资料,其内部各小组率明显不同,且各小组观察例数的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等也明显不同时,直接比较两个或多个合计率是不合理的。因为其内部构成不同,往往影响合计率大小。第三节 率的标准化法?例如表5-4两种疗法的治愈率比较。表5-4 甲、乙两种疗法治疗某病的治愈率比较 甲疗法 乙疗法 病 型 病人
15、数 治愈数 治愈率(%)病人数 治愈数 治愈率(%)普通型 300 180 60.0 100 65 65.0 重 型 100 35 35.0 300 125 41.7 合 计 400 215 53.8 400 190 47.5 第三节 率的标准化法?要正确比较两种疗法的合计治愈率,必须先将两组治疗对象的病型构成按照统一标准进行校正,然后计算出校正后的标准化病死率再进行比较。这种用统一的内部构成,然后计算标准化率的方法,称为标准化法。?标准化法的基本思想 是:采用某影响因素的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。第三节 率的标准化法?二、标准化率的计算
16、?(一)标准化方法?1、直接法?2、间接法?根据已有资料的条件,采用不同的方法计算标准化率。?如对死亡率的年龄构成标准化,若已知年龄别死亡率,可采用直接法;?若只有总死亡数和年龄别人口数而缺乏年龄别死亡率时,或各年龄组人口数较小,年龄别死亡率不稳定时,宜用间接法。第三节 率的标准化法?标准化法计算的关键是选择统一的标准构成。选择标准构成的方法通常有三种:?1.两组资料中任选一组资料的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。?2.两组资料各部分人口之和组成的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。?3.另外选用一个 通用的或便于比较的标准作为两
17、者的“共同标准”,如采用全国、全省或全地区的数据作为标准。第三节 率的标准化法?(二)计算标准化率?计算标准化率的步骤可归纳为:?1.根据对比资料所具备的条件选用直接法或间接法。?2.选定标准构成。?3.选择公式(5-4)、(5-5)或(5-6)计算标准化率,现以死亡率的年龄构成标准化为例说明标准化率的计算。第三节 率的标准化法?(1)直接法的计算:?选择年龄别人口数作标准时,直接法标准化率的计算公式为:(5-4)Ni为标准年龄别人口数,为实际年龄别死亡率 N为标准人口总数。是预期死亡数,它除以标准人口总数N即得直接法的标准化死亡率。iiNppN?iiNp?第三节 率的标准化法?选择年龄别人口
18、构成比作标准时,直接法标准化率的计算公式为:?Ni/N为标准年龄别人口构成比,乘以实际年龄别死亡率,其乘积和也是直接法的标准化死亡率。iiNppN?第三节 率的标准化法?(2)间接法的计算:?选择年龄别死亡率作标准,间接法标准化率的计算公式为:iirpPPSMRn P?P为标准总死亡率,r为实际总死亡数,in为实际年龄别人口数,iP为标准年龄别死亡率,in与iP的乘积和iinP?为预期死亡数,riinP?为标准化死亡比(standard mortality ratio,SMR),用SMR 表示。第三节 率的标准化法?标准总死亡率与SMR的乘积即得间接法的标准化死亡率。?需要说明的是,SMR这个
19、指标在流行病学中用的较多,?若SMR 1,表示被标化人群的死亡率高于标准组;?反之,若SMR 1,表示被标化人群的死亡率低于标准组。?但样本的SMR有抽样误差,在单独使用SMR这个指标时,还需作总体SMR是否为1的假设检验。第三节 率的标准化法?(三)标准化率的计算步骤 1.直接标准化(1)用标准人口数计算:例5-4 对表5-4资料,求甲、乙两种疗法标准化治愈率。第三节 率的标准化法 表5-4 甲、乙两种疗法治疗某病的治愈率比较 甲疗法 乙疗法 病 型 病人数 治愈数 治愈率(%)病人数 治愈数 治愈率(%)普通型 300 180 60.0 100 6 5 65.0 重 型 100 35 35
20、.0 300 125 41.7 合 计 400 215 53.8 400 190 47.5 第三节 率的标准化法?其步骤如下:?1)已知甲、乙两种疗法各病型的治愈率,宜采用直接法。?2)选定甲、乙 两种疗法各病型的 治疗人数之和作标准,见表5-5第(2)栏。?3)求预期治愈人数。将各组标准治疗人数分别乘甲、乙两种疗?法的原治愈率,即得不同病型的甲、乙两种疗法预期治愈人数,见表5-5第(4)、(6)栏。?4)计算甲、乙两种疗法的 标准化治愈率。第三节 率的标准化法 表5-5 按式(5-10)用直接法计算标准化治愈 率(%)甲疗法 乙疗法 病型 (1)标准治 疗人数(Ni)(2)原治愈率 预期治愈
21、数(pi)(Nipi)(3)(4)=(2)(3)原治愈率 预期治愈数 (pi)(Nipi)(5)(6)=(2)(5)普通型 400 60.0 240 65.0 260 重 型 400 35.0 140 41.7 167 合计 800(N)380Nipi 427Nipi 第三节 率的标准化法 经标准化后,乙疗法治愈率高于甲疗法,与分组比较的治愈率结论一致,校正了标准化前甲疗法治愈率高于乙疗法的不妥结论。380100%47.5%800p?甲疗法标准化治愈率427100%53.4%800p?乙疗法标准化治愈率第三节 率的标准化法?(2)用标准人口构成比计算 表5-6 按 式(5-11)用直接法计算标
22、准化治愈率(%)甲疗法 乙疗法 病型 (1)标准人 口构成(Ni/N)(2)原治愈率 分配治愈率(pi)(Ni/N)pi(3)(4)=(2)(3)原治愈率 分配治愈率(pi)(Ni/N)pi (5)(6)=(2)(5)普通型 0.5 60.0 30.0 65.0 32.5 重 型 0.5 35.0 17.5 41.7 20.9 合 计 1.0 53.8 47.5(p?)47.5 53.4(p?)第三节 率的标准化法?2.间接标准化法?例5-6 经研究表明,女性原发性骨质疏松随年龄增长患病率增高。1998年某省在城市和农村分别抽样调查了50岁以上的老年妇女776例和789例,这些人中患有原发性骨
23、质疏松症者城市为322例,农村为 335例,总患病率分别为41.5%和42.5%。?由于本次调查的城乡老年妇女年龄构成不同,如表5-7第2栏和第5栏,需对两个总患病率进行标准化后方可比较。第三节 率的标准化法 表5-7 1998年某省城乡女性原发性骨质疏松 症患病率比较 城市 农村 年龄组(岁)(1)调查人数(2)患病人数(3)患病率(%)(4)调查人数(5)患病人数(6)患病率(%)(7)50 354 241 60 251 315 70 130 175 80及以上 41 58 合计 776 322 41.5 789 335 42.5 第三节 率的标准化法 表 5-8 按式(5-12)用间接法
24、计算标准化患病率(%)城市 农村 年龄组 (岁)(1)标准患病率 iP(2)人口数 in(3)预期患病人数 iinP(4)=(2)(3)人口数 in (5)预期患病人数 iin P(6)=(2)(5)50 21.3 354 75 241 51 60 46.1 251 116 315 145 70 65.5 130 85 175 115 80及以上 71.7 41 29 58 42 合计 42.1 776 305 789 353 第三节 率的标准化法 3221.05305SMR?城市原发性骨质疏松症标准化患病比42.1%1.0544.2%p?城市原发性骨质疏松症标准化患病率3350.95353S
25、MR?农村原发性骨质疏松症标准化患病比42.1%0.9540.0%p?农村原发性骨质疏松症标准化患病率经标准化后,城市原发性骨质疏松症标准化患病率高于农村。第三节 率的标准化法?三、应用标准化时的注意事项?1.标准化法只适用于某因素两组内部构成不同,并有可能影响两组总率比较的情况。对于因其它条件不同而产生的不具可比性问题,标准化法不能解决。?2.由于选择的标准人口不同,算出的标准化率也不同。因此,当比较几个标准化率时,应采用同一标准人口。第三节 率的标准化法?3.标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。如比较城乡女性原发性骨质疏松症患病率时,经
26、过标准化后的患病率,已不是两地当时实际原发性骨质疏松症患病水平,但它能够说明在共同标准下,城市和农村女性原发性骨质疏松症患病水平相比较,谁高谁低。?4.两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,当样本含量较小时,还应作假设检验。第四节 动态数列及其分析指标?动态数列(dynamic series):是一系列按时间顺序排列起来的统计指标(可以为绝对数,相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。?常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。动态数列的两个要素:时点或时期:统计指标:基期 报告期 末期 012,intt
27、ttt012,inaa aaa 例5-7 某医院1991-1999 年日门诊量的统计数据见表5-9第(1)、(3)栏,试作动态分析。绝对增长量 发展速度%增长速度%年份 指标 符号 日门诊 人次 累计 逐年 定基比 环比 定基比 环比(1)(2)(3)(4)(5)(6)(7)(8)(9)1991 0a 1200 100.0 100.0 1992 1a 1500 300 300 125.0 125.0 25.0 25.0 1993 2a 1600 400 100 133.3 106.7 33.3 6.7 1994 3a 1670 470 70 139.2 104.4 39.2 4.4 1995
28、4a 1750 550 80 145.8 104.8 45.8 4.8 1996 5a 1820 620 70 151.7 104.0 51.7 4.0 1997 6a 2210 1010 390 184.2 121.4 84.2 21.4 1998 7a 2680 1480 470 223.3 121.3 123.3 21.3 1999 8a 3450 2250 770 287.5 128.7 187.5 28.7 表5-9 某医院1991-1999 年日门诊量动态变化 一、绝对增长量一、绝对增长量 累计增长量(),即报告期指标与基期指标之差。逐年增长量(),即报告期指标与前一期指标之差。绝
29、对增长量是说明事物在一定时期增长的绝对值。0iaa?1iiaa?二、发展速度与增长速度二、发展速度与增长速度 定基比,即报告期指标与基期指标之比,用符号表达为 :a1/a0,a2/a0,.,an/a0。环比,即报告期指标与其前一期指标之比,用符号表达为 :a1/a0,a2/a1,.,an/an-1。增长速度表示的是净增加速度。增长速度=发展速度1(100%)。均为相对比,说明事物在一定时期的速度变化。发展速度表示报告期指标的水平相当于基期水平的百分之多少或若干倍,0/iaa1/iiaa?三、平均发展速度和平均增长速度?平均发展速度是各环比发展速度的几何平均数,说明某事物在一个较长时期中逐期(如
30、逐年)平均发展的程度。?平均增长速度是各环比增长速度的平均数,说明某事物在一个较长时期中逐期平均增长的程度。其计算公式为 式中a0为基期指标;an为第n期指标。平均增长速度=平均发展速度?1 0/nnaa?平均发展速度对例5-7计算平均发展速度与平均增长速度:平均增长速度=1.14110.141(14.1%)?平均发展速度=%)1.141(141.1 3450/12008?动态数列分析还可以进行预测预测,即根据平均发展速度公式(5-7)计算几年后达到的指标。如根据表5-9资料预测2001年的日门诊量,本例2001年相当于 ,将已知数据代入公式(5-7)a10=1.14110?1200=4488(人次)即根据该医院1991-1999年的平均发展速度,预计到2001 年该医院的日门诊量可达4488人次。10101.141/1200a?10a练习题 110 一、最佳选择题 全做 三、计算分析题 4,5