1、计数资料的统计描述计数资料的统计描述抽样与抽样误差抽样与抽样误差总体率的参数估计总体率的参数估计检验检验1243 32例例 甲地甲地 麻疹发病人数麻疹发病人数3030人人 乙地乙地 麻疹发病人数麻疹发病人数2525人人 地区地区 麻疹发病人数麻疹发病人数 易感儿童数易感儿童数 麻疹发病(麻疹发病(%) 甲地甲地 30 3000 1 乙地乙地 25 1000 2.5 常见的数据形式:绝对数 相对数但绝对数通常不具有可比性。 v 常用的相对数指标:说明某现象或某事物发生的频率或强度,又称为率(rate)。可用100%(百分率)、1000(千分率)、10000 (万分率)、100000 (十万分率)
2、来表示。 万0万100(一)强度相对数比例基数单位总数可能发生该现象的观察单位数实际发生某现象的观察率 比例基数的选用一般依据习惯,使计算出来的率的结果保留1-2位整数。 例1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例,求高血压的患病率。例2 1999年某幼儿园有36名儿童患了腮腺炎,该幼儿园共有200名儿童(其中25名儿童以前患过),求该幼儿园1999年腮腺炎的发病率。(二)结构相对数12345表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,又称为构成比(constituent rat
3、io)。通常以100%为比例基数。%100单位总数同一事物各组分的观察某组分的观察单位数构成比例1 本班有学生40名,其中男生15名,女生25名。性别构成比:男生性别构成比:15/40100%=37.5%;女生性别构成比:25/40100%=62.5% 例2 1979年昌都5县14个农牧区40岁以上的1468人进行了老年性白内障抽样调查,各年龄组的构成比和患病率见表。 表1 老年人白内障的年龄分布及患病率年龄组(1) 受检人数(2) 白内障例数(3)患者年龄构成比/%(4) 患病率/%(5) 405606815.1812.145044112928.7929.256029613530.1345.
4、61701499721.6565.108022194.2486.36合计1468448100.0030.52 白细胞分类计数白细胞分类计数 白细胞白细胞f构成比构成比(%)嗜中性白细胞嗜中性白细胞14070.0淋巴白细胞淋巴白细胞5025.0单核百细胞单核百细胞 5 2.5嗜酸性白细胞嗜酸性白细胞 4 2.0嗜碱性白细胞嗜碱性白细胞 1 0.5构成比的特点和意义构成比的特点和意义特点:特点:(1)各部分构成比的合计为)各部分构成比的合计为100%。(2)事物内部某一部分的构成比发生变化,其他部分构成也发生变化。)事物内部某一部分的构成比发生变化,其他部分构成也发生变化。意义:意义: (1)研究
5、事物按一个特征分类,构成比反映事物内部组成的结构特)研究事物按一个特征分类,构成比反映事物内部组成的结构特 征,指出工作重点。征,指出工作重点。 (2)事物按两个特征分类,构成比反映事物与两个特征的关联关系。)事物按两个特征分类,构成比反映事物与两个特征的关联关系。表表 某医院某医院1990年和年和1998年住院病人五种疾病死亡人数和构成比年住院病人五种疾病死亡人数和构成比疾病疾病 分类分类 1990年年 1998年年 死亡死亡 人数人数 构成比构成比 (%) 死亡死亡 人数人数 构成比构成比 (%)恶性肿瘤恶性肿瘤58 30.5340 26.85循环系统疾病循环系统疾病44 23.1644
6、29.53呼吸系统疾病呼吸系统疾病37 19.4729 19.46消化系统疾病消化系统疾病19 10.0018 12.08传染病传染病32 16.8418 12.08合计合计190 100.00 149 100.00(三)相对比(relative ratio) 是两个相关联的指标之比。说明:(1)式中甲乙两指标可以是绝对数、平均数或相对数;(2)式中甲乙两指标的性质可以相同,也可以是性质不同。)(或乙指标甲指标相对比%100 例1 某地某年出生的婴儿中,男性婴儿为484人,女性婴儿为460人,求出生婴儿的性别比。 出生婴儿的性别比例为484/460=1.052(或105:100)(四)应用相对
7、数的注意事项(1)正确区分率和构成比,不能用构成比代替率。(2)观察单位数应足够多正确的计算合并率应将分子的合计除以分母的合计。(3)正确计算合并率(4)注意资料的可比性。(5)对相对数进行统计推断 例2 1979年昌都5县14个农牧区40岁以上的1468人进行了老年性白内障抽样调查,各年龄组的构成比和患病率见表。 表1 老年人白内障的年龄分布及患病率年龄组(1) 受检人数(2) 白内障例数(3)患者年龄构成比/%(4) 患病率/%(5) 405606815.1812.145044112928.7929.256029613530.1345.61701499721.6565.108022194.
8、2486.36合计1468448100.0030.52(四)应用相对数的注意事项(1)正确区分率和构成比,不能用构成比代替率。(2)观察单位数应足够多正确的计算合并率应将分子的合计除以分母的合计。(3)正确计算合并率(4)注意资料的可比性。(5)对相对数进行统计推断你会选择哪一个医院?摩西医院摩西医院阿波罗医院阿波罗医院2,1002,100外科病人6363死亡人数3%3%死亡率800800外科病人1616死亡人数2%2%死亡率你会选择哪一个医院?摩西医院摩西医院阿波罗医院阿波罗医院2,1002,100外科病人6363死亡人数3%3%死亡率800800外科病人1616死亡人数2%2%死亡率600
9、 600 在状况良好时1,5001,500在状况不佳时6 6死亡人数5757死亡人数1%1%死亡率3.8%3.8%死亡率600 600 在状况良好时200200在状况不佳时8 8死亡人数8 8死亡人数1.3%1.3%死亡率4%4%死亡率但是但是但是但是 年龄组年龄组(岁)(岁)甲地甲地乙地乙地人口数人口数人口人口构成构成发病发病数数发病率发病率()人口人口数数人口人口构成构成发病发病数数发病率发病率 ()()1 1254225420.12190.1219316316124.31124.31101410140.25920.2592117117115.38115.385 5428542850.20
10、540.205416816839.2139.21190519050.48700.487016168.408.401010121214029140290.67270.67271201208.558.559929920.25380.25384 44.034.03合计合计20856208561.00001.000060460428.9628.96391139111.00001.000013713735.0335.03表表 某年甲、乙两地儿童传染病发病率某年甲、乙两地儿童传染病发病率(四)应用相对数的注意事项(1)正确区分率和构成比,不能用构成比代替率。(2)观察单位数应足够多正确的计算合并率应将分子
11、的合计除以分母的合计。(3)正确计算合并率(4)注意资料的可比性。(5)对相对数进行统计推断医学中常用的相对数指标n发病率n患病率n病死率n死亡率n死因构成n治愈率总体总体样本样本总体参数总体参数样本统计量样本统计量抽样抽样统计推断统计推断参数估计参数估计假设检验假设检验抽样与样本率的抽样误差n在同一个总体中随机抽取样本含量一定在同一个总体中随机抽取样本含量一定的若干样本,计算样本率,各样本率之的若干样本,计算样本率,各样本率之间往往是不同的,且样本率与总体率之间往往是不同的,且样本率与总体率之间也有一定的误差,这种由于抽样所造间也有一定的误差,这种由于抽样所造成的样本率之间以及样本率与总体率
12、之成的样本率之间以及样本率与总体率之间的差别称为样本率的抽样误差。间的差别称为样本率的抽样误差。 样本率的标准误与样本含量n的平方根成反比,增加样本含量n可减小样本率的抽样误差。 总体率未知,用样本率P作为估计值,即得到样本率标准误的估计值。 的估计值。n1PnP1PSPPPS为 样本率的抽样误差用样本率的标准误来度量。计算公式:例 7.6总体率的参数估计n点估计n区间估计总体率的区间估计总体率的区间估计n(1)查表法,在样本例数较小,且样本率接近于1或0时,可按照二项分布原理确定总体率的可信区间,但计算繁琐,为方便应用,统计学家根据二项分布原理编制了相应得统计用表,确定总体率的置信区间。n(
13、2)正态近似法,当n足够大时,且nP和n(1-P)均大于5时,P的抽样分布近似正态分布。n总体率的可信区间 PPSuPSuP22, 例 7.6 7.7总体率的假设检验计量资料:计量资料:t t检验检验计数资料:计数资料: 检验检验检验检验(chi-square test)chi-square test)22n 检验是一种适用范围非常广泛的检验是一种适用范围非常广泛的假设检验方法,在计数资料分析中假设检验方法,在计数资料分析中可用可用于两个或两个以上样本率(或构成比)于两个或两个以上样本率(或构成比)的比较、配对资料的比较的比较、配对资料的比较以及频数分布以及频数分布资料的拟合优度检验等,在医学
14、科研数资料的拟合优度检验等,在医学科研数据的处理中具有重要的应用价值。据的处理中具有重要的应用价值。2n例 某医生用两种疗法治疗前列腺癌,出院后随访三年。甲疗法治疗86例,乙疗法治疗95例,结果见表1。问两种疗法治疗前列腺癌病人的三年生存率是否相同?一、 检验的基本思想2表1 甲乙两种疗法治疗前列腺癌的三年生存率比较处理处理生存生存死亡死亡合计合计生存率生存率()()甲疗法甲疗法52523434868660.4760.47乙疗法乙疗法45455050959547.3747.37合计合计9797848418118153.5953.59n 表表1 1中四个格子的数据中四个格子的数据 是是 基本数据
15、,其余的数据都是从这四个数据基本数据,其余的数据都是从这四个数据计算出来的。计算出来的。 这种资料称为这种资料称为四格表资料四格表资料(fourfold fourfold tabletable)。(又称)。(又称2 22 2表)表) 52344550nH0:1 12 2nH1: 1 12 2n0.050.052121nnxxn 检验的基本公式为:n式中 A为实际频数,T为理论频数 TTAx222表1 甲乙两种疗法治疗前列腺癌的三年生存率比较处理处理生存生存死亡死亡合计合计生存率生存率()()甲疗法甲疗法 52 52 34 34 86 8660.4760.47乙疗法乙疗法 45 45 50 50
16、959547.3747.37合计合计 97 97848418118153.5953.59(46.0946.09)(39.9139.91)(50.1950.19)(44.0944.09)(46.0946.09)n理论频数T的计算公式为:n式中TRC为第R行第C列格子的理论数,nR为第R行的合计频数,nC为第C列的合计频数,n为总例数nnnTCRRC) 1)(1(,22CRTTAxn 检验的基本公式为: 查 界值表,若 0.05(v),P0.05,按0.05水准不拒绝H0,差异无统计学意义。222222二、两独立样本率比较的四格表x2检验 (一般四格表)n(一)基本步骤 以前例为例说明:1、建立检
17、验假设,确定检验水准 H0: 1=2, H1:12, 0.05n2、计算理论数和 统计量11. 309.44)09.4450(91.5091.504591.3991.393409.4609.46522222222xTTAx1) 1)(1(CRv2表1 甲乙两种疗法治疗前列腺癌的三年生存率比较处理处理生存生存死亡死亡合计合计生存率生存率()()甲疗法甲疗法 52 52 34 34 86 8660.4760.47乙疗法乙疗法 45 45 50 50959547.3747.37合计合计 97 97848418118153.5953.59(46.09)(39.91)(50.19)(44.09)n3、确
18、定P值,下结论 查 界值表, 0.05(1)=3.84 =3.110.05,按0.05水准,不拒绝H0,差异无统计学意义,故尚不能认为甲乙两种疗法治疗前列腺癌的3年生存率有差别。222n(二)四格表专用公式dbcadcbanbcadx)()(22处理组阳性阴性合计甲aba+b乙cdc+d合计a+cb+dn表2 四格表资料的一般形式11. 3849795861814534505222x处理生存死亡合计生存率()甲疗法52(a)34(b)8660.47乙疗法45(c)50(d)9547.37合计978418153.59表表1 1 甲乙两种疗法治疗前列腺癌的三年生存率比较甲乙两种疗法治疗前列腺癌的三
19、年生存率比较(三)四格表资料 检验的运用条件nn 40,T52n(四)不符合 检验的两种情况n 1、 当n40, 1T5,计算校正x2值。TTAx225.0dbcadcbannbcadx222/2n例(见书)n三、配对四格表资料的三、配对四格表资料的 检验检验 配对四格表资料的配对四格表资料的 检验(检验( test test for paired data of fourfold table)for paired data of fourfold table)是对配对设计研究所获得的计数资料进是对配对设计研究所获得的计数资料进行比较。行比较。 222 甲甲 乙乙1 1 a a2 2 b b3
20、 3 c cN N d d甲法乙法合计aba+bcdc+d合计a+cb+dn表3 两种方法检验结果n 例例 某研究室用甲乙两种血清学方法某研究室用甲乙两种血清学方法检查检查410410例确诊的鼻炎癌患者,结果如表例确诊的鼻炎癌患者,结果如表3 3,问两种检验结果之间有无差别?问两种检验结果之间有无差别?甲法乙法合计261(a)110(b)3718(c)31(d)39合计269141410表4 两种血清学检验结果n配对资料x2检验的公式: 1,22vcbcbxn1、建立假设 H0:B=C,H1:BC,0.05n2、计算 值 1,17.888110811022vx3、确定P值,下结论。 2222若
21、若b bc40c40,用校正公式,用校正公式1,122vcbcbxn四、行四、行列表资料的列表资料的 检验检验 行行列表资料(列表资料(data of Rdata of RC C tabletable)指有两个或两个以上比较的组,记)指有两个或两个以上比较的组,记录的观察结果也有两个或两个以上。如多录的观察结果也有两个或两个以上。如多个样本率的比较,两组或多组构成比的比个样本率的比较,两组或多组构成比的比较。较。2) 1)(1(,22CRTTAx(一)公式和检验步骤(一)公式和检验步骤) 1)(1(,122CRvnnAnxCR n n为总例数,为总例数,A A为每个格子里的实际频数,为每个格子里的实际频数,n nR R和和n nC C为与为与A A值相应的行和列合计的例数。值相应的行和列合计的例数。n例1010n(二)行列表资料进行x2检验的条件 一般认为不能有1/5以上的格子理论频数小于5,或者不能有一个格子的理论数小于1,否则易导致分析偏性。出现这些情况可采取的措施:(1)在可能的情况下增加样本含量;(2)删去上述理论频数太小的行和列;(3)从专业上如果允许,可将太小的理论频数所在的行或列的实际数与性质相近的邻行或邻列中的实际数合并。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。