1、分类资料的统计推断Statistical Inference for Categorical Datao 检验检验 o Fisher精确概率法精确概率法(Fishers Exact Test)2主要内容主要内容 两个率的比较两个率的比较 配对设计两个率的比较配对设计两个率的比较 R RC C列联表的分析列联表的分析 正确应用正确应用Chi-square Test问题的提出p Karl Pearson 1857-19361857-1936 p 描述统计学派的代表人物,现代统计科学的创立者。p 始于数学,继之哲学和法律学,进而生物学和遗传学,集大成于统计学。p 坚决的反对推断统计学派 p 统计分布
2、,Pearson分布曲线2p 理论分布和实际分布间总存在差异p1900年,Karl Pearson提出 检验.随机误差?本质性差异?WhyWhy问题的提出四格表资料2检验例例7.2(page75)7.2(page75)某医院肿瘤科某医院肿瘤科3 3年来共治疗乳腺癌年来共治疗乳腺癌患者患者n n=131=131例,每例均观察满例,每例均观察满5 5年,其中单纯手术年,其中单纯手术治疗组观察治疗组观察n n1 1=84=84例,存活例,存活x x1 1=57=57例,存活率例,存活率p p1 1=67.9=67.9,联合治疗,联合治疗(手术手术+术后化疗术后化疗)组观察组观察n n2 2=47=4
3、7例,存活例,存活x x2 2=39=39例,存活例,存活p p2 2=83.0=83.0,问两组,问两组存活率有无差别?存活率有无差别?p two samples.Population AunknownPopulation BunknownSamplesknownPopulationsunknown四格表资料2检验处理存活数 死亡数 合计存活率(%)联合治疗4783.0单纯治疗8467.9合计963513173.339 857 27表表7-1 两组存活率的比较两组存活率的比较四格表四格表(fourfold table)四格表资料四格表资料(fourfold table)When the va
4、riables are independent,the proportion in both groups is close to the same size as the proportion for the total sample.When group membership makes a difference,the dependent relationship is indicated by one group having a higher proportion than the proportion for the total sample.四格表资料2检验理论频数理论频数(th
5、eoretical frequence)o 如果两个样本来自同一总体,则两组存活率如果两个样本来自同一总体,则两组存活率相同,则用相同,则用合计的存活率合计的存活率作为总体存活率的作为总体存活率的点估计值。点估计值。o 在这样的假设前提下,可以计算各组理论存在这样的假设前提下,可以计算各组理论存活人数和理论死亡人数。活人数和理论死亡人数。o 根据检验假设根据检验假设H H0 0计算出来的数称作理论频数计算出来的数称作理论频数(theoretical frequency)T(theoretical frequency)T。处理存活数 死亡数合计存活率(%)联合治疗39847单纯治疗572784合
6、计963513173.373.3 理论理论频数频数34.44理论频数的计算理论频数的计算(theoretical frequence)理论理论频数频数12.56理论频数4773.3%理论频数8473.3%rcrcn nTn73.3 61.5622.442检验的基本思想检验的基本思想(1)通过构造通过构造A A与与T T吻合程度的统计量吻合程度的统计量来反来反映两样本率的差别映两样本率的差别!3985727实际数实际数A 理论数理论数T34.44 12.5661.56 22.44o 如果如果H0假设成立,则实际频数与理论频数应该比假设成立,则实际频数与理论频数应该比较接近。差值较接近。差值 属于
7、随机误差,用属于随机误差,用2 统计量表统计量表示:示:A T222()A TT分布H H0 0成立时,实际数与理论数的差别不会很大,出现较大成立时,实际数与理论数的差别不会很大,出现较大2 2 值概率很小。值概率很小。若若P P,则拒绝,则拒绝H H0 0;若若P P,则尚无理由拒绝它。,则尚无理由拒绝它。2检验的基本思想检验的基本思想(2)(1)假设两总体率相等)假设两总体率相等o H0:两组总体存活率相同,即:两组总体存活率相同,即1=2;o H1:两组总体存活率不同,即:两组总体存活率不同,即12;0.05。2检验的步骤检验的步骤(1)(2)实际数与理论数的差值服从)实际数与理论数的差
8、值服从2分布分布112212检验的步骤检验的步骤(2)22iiii2222ATT(3934.44)(812.56)(5761.56)(2722.44)34.4412.5661.5622.443.52自由度为1的2分布界值自由度为1的2分布界值0.00.10.20.30.40.53.840.05Reject H023.52 with d.f.1Do not reject H0(3)查)查2分布界值表确定分布界值表确定P值并作出推论值并作出推论p按=(2-1)(2-1)=1查附表3,2界值表,得P0.05。p按=0.05水准不拒绝H0,差别无统计学意义。p故尚不能认为单纯手术疗法与联合疗法对乳腺癌
9、患者治疗效果有差别。2检验的步骤检验的步骤(3)总结总结o 比较两个样本率所代表的总体率是否有差别,实质是考察现有的样本频数分布是否与假设下的理论频数分布间差异到底是否包含了本质上的差异。o 2 统计量代表了实际数与理论数吻合的程度。Reject H0 if22()iiiATT220 2Reject H0Do not reject H0 (with k 1 degrees of freedom)2总结总结2检验相关问题 2分布0.00.10.20.30.40.52分布与自由度有关分布与自由度有关请看演示请看演示 2 2 分布分布o 四格表及行列表的自由度 在表中周边合计数不变的前提下,基本数据
10、可以自由变动的格子数。3947849635131827571 行数列数12检验相关问题 自由度(四格表专用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA2检验相关问题四格表专用公式a bcd 2=2()()nabcdacbdad bca,b,c,d分别为四格表的四个实际频数;n=a+b+c+d。2检验相关问题四格表专用公式p2分布是连续性分布;p 定性资料;p 实际数过小,增加了第一类错误。校正公式:TTAC22)5.0()()()
11、()2/(22dbcadcbanncbdaC2检验相关问题2值的校正nn 40,T 5,用2检验;nn40,但1 T 5,用校正2。nn 40,或T 1,用确切概率法。2检验相关问题应用条件o 某矿石粉厂当生产一种矿石粉石时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取15名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病率,结果如表,问两组工人的皮肤炎患病率有无差别?2检验相关问题应用条件2检验相关问题应用条件 H0:两组工人的皮肤炎患病率无差别,即:两组工人的皮肤炎患病率无差别,即1=2;H1:两组工人的皮肤炎患病率有差别,即:两组工人
12、的皮肤炎患病率有差别,即12;=0.05。最小的理论频数最小的理论频数T11=1511/43=3.84,1T1140,所以宜用,所以宜用2检验的校正公式。检验的校正公式。查附表查附表 2界值表得界值表得0.05 P 0.10,按,按 =0.05水平不水平不拒绝拒绝H0,差别无统计学意义。尚不能认为穿不同防护服的,差别无统计学意义。尚不能认为穿不同防护服的皮肤炎患病率有差别。皮肤炎患病率有差别。94.2321128152/43101418143222检验相关问题应用条件3.840.050.0250.0251.96-1.962检验相关问题与正态分布的关系o 检验检验 o FisherFisher精
13、确概率法精确概率法 2主要内容主要内容 两个率的比较两个率的比较 配对设计两个率的比较配对设计两个率的比较 R RC C列联表的分析列联表的分析 正确应用正确应用配对四格表资料的2检验o McNemar检验(检验(McNemars test)o 目的目的 通过对单一样本数据的分析,推断两种处理的结果有通过对单一样本数据的分析,推断两种处理的结果有无差别。无差别。o 用途用途 比较两种检验方法、两种培养方法、两种提取方法等比较两种检验方法、两种培养方法、两种提取方法等的差别。的差别。例例7.8(page81)用两种检验方法对用两种检验方法对某食品作沙门氏菌检验,结果如表某食品作沙门氏菌检验,结果
14、如表7.9,试比较两种方法的阳性结果是否有差试比较两种方法的阳性结果是否有差别。别。配对四格表资料的2检验两种检验方法阳性率结果两种检验方法阳性率结果可能的结果可能的结果甲甲乙乙频数频数1 1a a2 2b b3 3c c4 4d d配对四格表资料的2检验两种检验方法结果比较两种检验方法结果比较荧光抗体法荧光抗体法 常规培养法常规培养法 合计合计160(a)26(b)1865(c)48(d)53合计合计16574239配对四格表资料的2检验配对四格表资料的实际数与理论数26(b)5(c)15.5 15.5 iiiTTA22)(实际数实际数理论数理论数=1 2222()()()2222)bcbc
15、bcbcbcbcbc连续性校正 iiiCTTA22)5.0(2222Cbcbc(b0.5)(c0.5)22bcbc2(bc1)(bc2)当当20b+c40时时,需要校正:需要校正:配对四格表资料的o H0:两种检验方法阳性率相同,总体BC;H1:两种检验方法阳性率不同,总体BC。0.05。o计算统计量:,=1。oP0.05o按0.05水准,拒绝H0,接受H1,差别有统计学意义。o可以认为两法检验结果不一样,荧光抗体法阳性结果高于常规培养法。22265112.90265o 检验检验 o FisherFisher精确概率法精确概率法 2主要内容主要内容 两个率的比较两个率的比较 配对设计两个率的比
16、较配对设计两个率的比较 R RC C列联表的分析列联表的分析 正确应用正确应用多组率或构成比比较时,由于行数或列数超出了多组率或构成比比较时,由于行数或列数超出了2,我们,我们把这样的资料称为行把这样的资料称为行列表资料。列表资料。行行列表的列表的2检验统计量:检验统计量:iCRiiinnAnTTA1222地区检验的样品合计污染率(%)未污染污染甲 6 232979.3乙30144431.8丙 8 31127.3合计44408447.6某省三个地区花生的黄曲酶毒素B1污染率比较多个率比较的理论数的计算15.213.823.021.0 5.85.2实际数A 理论数T 62329301444 8
17、311 44(52.4%)40(47.6%)84NnnNnnTCRCR 15.213.823.021.0 5.85.2 实际数A 理论数T 6233014 8 3 iiiTTA22)(91.172.5)2.53(8.5)8.58(0.21)0.2114(0.23)0.2330(8.13)8.1323(2.15)2.156(2222222 iiiTTA22)(62329301444 8 311 44 408491171441134411844441444443040292344296842222222.122CRnnAn 自由度为2的0.00.10.20.30.40.55.99 0.053个率比
18、较的一H0:1=2=3H1:1,2,3不等或不全相等0.05。二计算统计量:17.91,v=2。三P0.0001四按0.05水准,拒绝H0,接受H1。认为三个地区花生中黄曲酶毒素B1污染率不等或不全相等。例例7.4(page78)7.4(page78)某地调查了某地调查了1995199519981998四个年度四个年度中小学女生的贫血状况,见表中小学女生的贫血状况,见表7.47.4,问各年度间学,问各年度间学生贫血率有无差别?生贫血率有无差别?多个率比较的H0:四个年度学生的贫血检出率相等,即1=2=3=4;H1:四个年度学生的贫血检出率不等或不全相等。0.05。计算统计量:v=2 281.6
19、263 )1131514983419917014983784131512528216117012528367 131512360208917012360271131514981470217014981279(14852222222222 =(4-1)(2-1)=3。查附表查附表3,2界值表,得界值表,得P0.005。按。按 =0.05水准拒绝水准拒绝H0,接受,接受H1,差异有统计,差异有统计学意义。学意义。故可认为该地四个年份中小学女生贫血检出故可认为该地四个年份中小学女生贫血检出率不相等。率不相等。多个率比较的构成比的比较美国、中国、挪威三种不同国籍者的ABO血型分布国籍OABAB合计美国
20、450410100 401000挪威190250 40 20 500中国3002503501001000合计940910490160 250构成比的比较美国、中国、挪威三种不同国籍者的ABO血型分布国籍OABAB合计美国450(45.0)410(41.0)100(10.0)40(4.0)1000挪威190(38.0)250(50.0)40(8.0)20(4.0)500中国300(30.0)250(25.0)350(35.0)100(10.0)1000合计940(37.6)910(36.4)490(19.6)160(6.4)250450 410 100 40190 250 40 20300 25
21、0 350 100376 364 19664158 182 9832376 364 19664 iiiTTA22)(122CRnnAn 实际数A 理论数T9668.332)116010001004901000350910100025094010003001605002049050040910500250940500190160100040490100010091010004109401000450(25002222222222222 -450410100 40 1000190250 40 20 500300250350100 1000940910490160 25003个构成比比较的一H0:三
22、种国籍国民的血型构成相同;H1:三种国籍国民的血型构成不同或不全相同。0.05。二 计算统计量:2332.9668,v=6。三三P5,用2;nn 40,但1 T 5,用校正2。nn 40,或T 40;n20b+c40用校正2。nb+c20,二项分布直接计算概率。oRC表的分析方法选择条件:表的分析方法选择条件:n理论数不能小于理论数不能小于1;n理论数大于等于理论数大于等于1小于小于5的格子数不超过的格子数不超过总格子数的总格子数的1/5。n否则用否则用Fisher确切概率确切概率;n或似然比检验或似然比检验(likelihood ratio test)o 如果以上条件不能满足,可采用:如果以
23、上条件不能满足,可采用:增加样本含量增加样本含量 删去某行或某列删去某行或某列 合理地合并部分行或列合理地合并部分行或列 Fisher精确概率法精确概率法p 多个率或构成比比较的多个率或构成比比较的2检验,结论为拒绝检验,结论为拒绝H0时,仅表示几组有差别,并非任时,仅表示几组有差别,并非任2组之间组之间都有差别。若要了解之,可进行多重比较:都有差别。若要了解之,可进行多重比较:2表的分割或率的可信区间法表的分割或率的可信区间法.o 对于有序的分类变量,采用卡方检验方法不能对于有序的分类变量,采用卡方检验方法不能考虑数据的有序性质。为此,对于单向有序可考虑数据的有序性质。为此,对于单向有序可采
24、用秩和检验、采用秩和检验、Ridit分析,双向有序可采用分析,双向有序可采用趋势检验等。趋势检验等。o 检验检验 o FisherFisher精确概率法精确概率法 2主要内容主要内容 两个率的比较两个率的比较 配对设计两个率的比较配对设计两个率的比较 R RC C列联表的分析列联表的分析 正确应用正确应用四格表的确切概率(四格表的确切概率(page83)(Fishers exact probability in 22 table)大脑左半球与右半球的恶性肿瘤作占比例大脑左半球与右半球的恶性肿瘤作占比例组别组别良性良性恶性恶性合计合计恶性肿瘤所占恶性肿瘤所占比例率比例率(%)左左 半半 球球13
25、31618.75右右 半半 球球761346.15合计合计20929四格表周边合计不变四格表周边合计不变xa+b-xa+ba+c-xd-a+xc+da+cb+dnxmin(a,b,c,d)x=0,1,min(a+c,a+b)四格表四格表(周边合计不变时周边合计不变时)所有可能的排列所有可能的排列(1)(2)(3)(4)(5)79 88 97106116130121112103 94|A-T|:4.0345 3.0345 2.0345 1.0345 0.0345(6)(7)(8)(9)(10)124133142151160 85 76 67 58 49|A-T|:0.9655 1.9655 2.
26、9655 3.9655 4.9655每一种组合的概率每一种组合的概率aba+bcdc+da+cb+dn()!()!()!()!iabcdacbdPa b c d n 超几何分布(hypergeometric distribution)四格表所有可能排列的概率四格表所有可能排列的概率(1)(2)(3)(4)(5)79 88 97106116130121112103 94|A-T|:4.03453.03452.03451.03450.0345Pi0.001142 0.0167060.0890980.2286860.311844(6)(7)(8)(9)(10)124133142151160 85 7
27、6 67 58 49|A-T|:0.96551.96552.96553.96554.9655Pi 0.2338830.095952 0.020561 0.0020560.000071P 值值:A-T值大于等于现有样本差别的各组合值大于等于现有样本差别的各组合概率之和。概率之和。(1)(2)(3)(4)(5)79 88 97106116130121112103 94|A-T|:4.03453.03452.03451.03450.0345Pi0.001142 0.0167060.089098(6)(7)(8)(9)(10)124133142151160 85 76 67 58 49|A-T|:0.
28、96551.96552.96553.96554.9655Pi 0.095952 0.0205610.0020560.000071P=0.225586总结总结o 是否需要是否需要Fishers精确概率法?精确概率法?o 周边合计不变情况下有多少种组合?周边合计不变情况下有多少种组合?o 每一种组合的概率及每一种组合的概率及A-T值?值?o 多少种组合的多少种组合的A-T值大于等于现有样本值大于等于现有样本差别?差别?o 确定确定P值。值。o 检验检验 o FisherFisher精确概率法精确概率法 2总结总结 两个率的比较两个率的比较 配对设计两个率的比较配对设计两个率的比较 R RC C列联表的分析列联表的分析 正确应用正确应用22()ATT22()()bcbc221RCAnn n敬请关注o o 医学统计学教学资料o Stata软件视频课程练习练习 为研究某种新药对尿路疼痛的止痛效果,将有尿路疼痛的患者144例随机分为两组,每组72例,一组服该新药(治疗组),另一组服安慰剂(对照组)。两组患者尿路疼痛的原因见表,问两组患者尿路疼痛原因的构成有无差异?x2=1.018练习练习