1、第七章第七章 2 2检验检验 某医师为比较中药和西药治疗胃炎的疗效,某医师为比较中药和西药治疗胃炎的疗效,随机抽取随机抽取140例胃炎患者分成中药组和西药组,例胃炎患者分成中药组和西药组,结果中药组治疗结果中药组治疗80例,有效例,有效64例,西药组治例,西药组治疗疗60例,有效例,有效35例。该医师采用成组例。该医师采用成组t检验进检验进行假设检验,结果行假设检验,结果t=-2.848,p=0.005,差异有统差异有统计学意义,故认为中西药治疗胃炎的疗效有差计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。别,中药疗效高于西药。1.资料的类型资料的类型 2.属于何种设计属于何种设
2、计 3.统计方法统计方法是否正确是否正确 第一节第一节 四格表资料的四格表资料的x2检验检验一、一、x2检验的基本思想检验的基本思想1.x2分布分布(1)x2分布是一种连续型分布:分布是一种连续型分布:x2分布只有一个参数:自由度分布只有一个参数:自由度 自由度自由度2时,曲线呈时,曲线呈L形形 随着自由度的增加,曲线随着自由度的增加,曲线 逐渐趋于对称逐渐趋于对称 当自由度接近于当自由度接近于时,分布时,分布 趋近于正态分布趋近于正态分布(2)x2分布的一个基本性质是它的可加性分布的一个基本性质是它的可加性(3)x2分布的界值:分布的界值:当自由度当自由度v确定后,确定后,x2分布曲线下右侧
3、尾分布曲线下右侧尾部的面积为部的面积为时,横轴上相应的时,横轴上相应的x2值。值。目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别 (和(和u u检验等价)检验等价)要求:要求:两样本的两分类个体数排列成四两样本的两分类个体数排列成四 格表资料格表资料 例例7-1 某院欲比较异梨醇口服液(试验组)和氢某院欲比较异梨醇口服液(试验组)和氢氯噻嗪氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?。问两
4、组降低颅内压的总体有效率有无差别?表表7-1 两组降低颅内压有效率的比较两组降低颅内压有效率的比较各组样本例各组样本例数是固定的数是固定的a99a99b5b5C75C75d21d21(73)RcRCn nTn)()(列数行数27111722-()()(vTTAx表表 7-1的理论数计算如下:的理论数计算如下:四格表中,因周边合计是固定的,用公四格表中,因周边合计是固定的,用公式式7-3求出其中一个格子的理论频数后,求出其中一个格子的理论频数后,其余三个可通过行合计数和列合计数相减其余三个可通过行合计数和列合计数相减求出。如求出。如1112212210410490.4813.5220020096
5、9683.5212.48200200TTTT1112212290.4810490.4813.5217490.4883.5226 13.5212.48TTTTX2检验的步骤检验的步骤 例例7-11.建立假设,确定检验水准建立假设,确定检验水准 H0:1=2,H1:1 2 2 =0.052.计量统计量计量统计量 T11=90.48 T12=13.52 T21=83.52 T22=12.48 TTAx22)(86.1248.12)48.1221(52.83)52.8375(52.13)52.135(48.90)48.9099(22222x3、自由度、自由度v=(2-1)(2-1)=1 X2(0.05
6、,1)=3.84 12.863.84 P0.05可以认为异山梨醇口服液降低颅内压的有效可以认为异山梨醇口服液降低颅内压的有效率高于氢氯噻嗪率高于氢氯噻嗪+地塞米松的有效率。地塞米松的有效率。)47()()()()(22dbcadcbanbcadx86.122617496104200)7552199(22x二、四个表资料二、四个表资料x x2 2检验的专用公式检验的专用公式1、T5,且且N 40时,用不校正公式计算时,用不校正公式计算x2值。值。2、1 T5,且且N 40时,用连续性校正时,用连续性校正x2检验。检验。3、T1或或N40或或x2检验后所得概率检验后所得概率P接近检验接近检验 水准
7、水准,用用Fisher 精确概率法。精确概率法。2 222(|0.5)ATT22(|/2)()()()()adbcnna b c d a d b d校正专用公式校正专用公式校正基本公式校正基本公式三、四格表资料三、四格表资料2 2检验校正检验校正 例例7-2 某医师欲比较胞磷胆碱与神经节苷某医师欲比较胞磷胆碱与神经节苷治疗脑血管疾病的疗效,将治疗脑血管疾病的疗效,将78例脑血管疾病例脑血管疾病患者随机分为两组,结果见表患者随机分为两组,结果见表7-2。问两种药。问两种药物治疗脑血管疾病的有效率是否相等?物治疗脑血管疾病的有效率是否相等?表表 7-2 7-2 两种药物治疗脑血管疾病有效率的比较两
8、种药物治疗脑血管疾病有效率的比较组别组别有效有效无效无效合计合计有效率(有效率(%)胞磷胆碱组胞磷胆碱组46466 6525288.4688.46神经节苷酯酶神经节苷酯酶18188 8232369.2369.23合计合计64641414787882.0582.051.建立假设,确定检验水准建立假设,确定检验水准 H0:1=2,H1:1 2 2 =0.052.T最小最小=26 14/78=3.14,n=78 x2=(46 8-6 8-78/2)2/78 64 14 52 26=3.14不校正:不校正:x2=4.353.x2(0.05,1)=3.84 3.140.05 尚不能认为药物尚不能认为药物
9、治疗脑血管疾病的有效率不等治疗脑血管疾病的有效率不等 第二节第二节 配对四格表资料的配对四格表资料的2 2检验检验u用途用途 常用于比较常用于比较两种检验方法两种检验方法或或两种培养基的阳两种培养基的阳性率性率是否有差别。是否有差别。u特点:对特点:对同一观察对象分别同一观察对象分别用用两种方法处理两种方法处理,观察其阳性与阴性结果。观察其阳性与阴性结果。u资料整理为配对四格表形式资料整理为配对四格表形式.例例7-3:某实验室采用两种方法对:某实验室采用两种方法对58名可疑名可疑红斑狼疮患者的血清抗体进行测定,问:两红斑狼疮患者的血清抗体进行测定,问:两方法测定结果阳性检出率是否有差别?方法测
10、定结果阳性检出率是否有差别?免疫荧光法免疫荧光法乳胶凝集法乳胶凝集法合计合计11(a)12(b)232(c)33(d)35合计合计134558表表7-3 两种方法的检测结果两种方法的检测结果+公式:公式:)(,)|(|)(,)(871140771402222vcbcbxcbvcbcbxcb1.建立检验的假设,确定检验水准建立检验的假设,确定检验水准 H0:b=c;H1:b c =0.052.计算计算 2 统计量统计量 b+c=2+12=143.84,P0.05,可以认为两种方法可以认为两种方法的检测结果不同,免疫荧光法的检测率较的检测结果不同,免疫荧光法的检测率较高。高。5.792121)|2
11、12(|cb1)|cb(|x222注意:注意:本法一般用于本法一般用于样本含量不太大样本含量不太大的资料。因的资料。因为它仅考虑了两法结果不一致的两种情况为它仅考虑了两法结果不一致的两种情况(b,c),而未考虑样本含量而未考虑样本含量n和两法结果一致的两种情和两法结果一致的两种情况况(a,d)。所以,当。所以,当n很大且很大且a与与d的数值很大的数值很大(即两法的一致率较高),(即两法的一致率较高),b与与c的数值相对较的数值相对较小时,即便是检验结果有统计学意义,其实际小时,即便是检验结果有统计学意义,其实际意义往往也不大。意义往往也不大。第三节第三节 四格表资料的四格表资料的Fisher
12、Fisher 确切概率法确切概率法1.T1 或或2.N2,则,则P单侧单侧=PR;若若H1为为12,则,则P单侧单侧=PL2.双侧检验:双侧检验:计算满足计算满足Pi P*条件下的各种组合之四格表条件下的各种组合之四格表的累计概率。的累计概率。n=330.05,不拒绝不拒绝H0,尚不能认为两组新生儿尚不能认为两组新生儿HBV的总体感染率不等。的总体感染率不等。例例7-5 某单位研究胆囊腺癌、胆囊腺瘤的某单位研究胆囊腺癌、胆囊腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、基因表达,对同期手术切除的胆囊腺癌、胆囊腺瘤标本各胆囊腺瘤标本各10份,用免疫组化法检测份,用免疫组化法检测P53基因,资料
13、见下表。问胆囊腺癌和胆囊腺瘤基因,资料见下表。问胆囊腺癌和胆囊腺瘤的的P53基因表达阳性率有无差别?基因表达阳性率有无差别?表表7-6 7-6 胆囊腺癌和胆囊腺瘤胆囊腺癌和胆囊腺瘤P P53基因表达基因表达阳性率的比较阳性率的比较病种病种阳性阳性阴性阴性合计合计胆囊腺癌胆囊腺癌 6 6(3.53.5)4(6.5)4(6.5)1010胆囊腺瘤胆囊腺瘤 1 1(3.53.5)9(6.5)9(6.5)1010合计合计7 713132020N=200.05,按按=0.05水准,不拒绝水准,不拒绝H0,尚不能认为胆囊腺癌与胆囊腺瘤的尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表基因表达阳性率不等达阳性率不等
14、第四节第四节 行行列表资料的列表资料的x x2 2检验检验1)-1)(-(10)-(7)1(22列数行数vnnAnxcR 例例7-6 某医师研究物理疗法、药物治疗某医师研究物理疗法、药物治疗和外用膏药三种治疗方法治疗周围性面神经和外用膏药三种治疗方法治疗周围性面神经麻痹的疗效,资料见表麻痹的疗效,资料见表7-8.问三种疗法的有问三种疗法的有效率有无差别?效率有无差别?表表7-8 7-8 三种疗法有效率的比较三种疗法有效率的比较疗法疗法有效有效无效无效合计合计有效率(有效率(%)物理疗法组物理疗法组1991997 720620696.6096.60药物治疗组药物治疗组16416418181821
15、8290.1190.11外用膏药组外用膏药组118118262614414481.9481.94合计合计481481515153253290.4190.41一、多个样本率的比较一、多个样本率的比较1.建立假设,确定检验水准建立假设,确定检验水准 H0:1=2=3,H1:三种疗法的有效率不全相等:三种疗法的有效率不全相等 =0.052.计算统计量计算统计量3.X20.05,2=5.99,21.045.99,p5.99,p12.59,p0.05,可以可以认为两种血型系统间有关联。认为两种血型系统间有关联。16.213)1268434832.1666182349014511823431(5801)1
16、(22222cRnnAnx1883.016.213580116.21322xnxC1、进行、进行RC表资料表资料2 检验时,要求不能有检验时,要求不能有1/5以上的格子理论数小于以上的格子理论数小于5,或者不能有任,或者不能有任意一个格子的意一个格子的理论数小于理论数小于1,否则易导致分析,否则易导致分析的偏性。的偏性。RC表资料的表资料的Fisher确切确切概率法概率法四、行四、行列表资料列表资料2 2注意事项注意事项 2005年某医师在研究中药治疗流感的疗效中,采用热毒清、年某医师在研究中药治疗流感的疗效中,采用热毒清、板蓝根、复方板蓝根治疗流感患者板蓝根、复方板蓝根治疗流感患者180例,
17、结果见表。该医例,结果见表。该医师采用行师采用行列表资料的列表资料的x2检验比较检验比较3种中药治疗流感的有效种中药治疗流感的有效率,得率,得x2=11.822,p=0.003,差异有统计学差异有统计学 意义,故认为意义,故认为3种种中药治疗流感的疗效都不相同,热毒清最好,复方板蓝根次中药治疗流感的疗效都不相同,热毒清最好,复方板蓝根次之,板蓝根最差。之,板蓝根最差。表表1 31 3种中药治疗流感的疗效比较种中药治疗流感的疗效比较组别组别有效有效无效无效有效率(有效率(%)热毒清热毒清58582 296.796.7复方板蓝根复方板蓝根57573 395.095.0板蓝根板蓝根484812128
18、0.080.0合计合计163163171790.690.61、资料的类型、资料的类型 2、研究设计、研究设计 3、统计分析、统计分析目的目的 4、统计方法是否正确、统计方法是否正确第四节第四节 多个样本率间的多重比较多个样本率间的多重比较一、基本思想一、基本思想 多个样本率比较时,若不经任何处理,多个样本率比较时,若不经任何处理,而直接用分割法把而直接用分割法把2K表表2分成多个独立分成多个独立的四格表的四格表2进行两两比较,进行两两比较,必须重新规定检必须重新规定检验水准验水准,其目的是为保证检验假设中,其目的是为保证检验假设中I型错型错误误的概率不变。的概率不变。1.多个实验组间的两两比较
19、多个实验组间的两两比较 分析目的为分析目的为K个实验组间,任两个率均进行个实验组间,任两个率均进行比较。比较。12=k+2.实验组与同一个对照组的比较实验组与同一个对照组的比较 分析目的为实验组与同一个对照组的比较,分析目的为实验组与同一个对照组的比较,而各实验组间不须比较。而各实验组间不须比较。2(1)k第六节第六节 有序分组资料的有序分组资料的线性趋势检验线性趋势检验一、一、R RC C表资料的分类及其检验方表资料的分类及其检验方法的选择法的选择1.双向无序双向无序RC表资料表资料 1)若研究目的为多个样本率(或构成比)若研究目的为多个样本率(或构成比)的比较,可用行的比较,可用行列表资料
20、的列表资料的2检验。检验。2)若研究目的为分析两个分类变量之间有)若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用无关联性以及关系的密切程度时,可用行行列表资料的列表资料的2检验及检验及Pearson列联系数进行列联系数进行分析。分析。2.单向有序单向有序RC表资料表资料 1)RC表资料中表资料中分组变量分组变量(年龄)是(年龄)是有序有序的,而的,而指标变量指标变量(传染病)(传染病)是是无序无序的。的。研究目的通常是分析不同年龄组各种传染病研究目的通常是分析不同年龄组各种传染病的构成情况,此种单向有序的构成情况,此种单向有序RC表资料可用表资料可用行行列表资料列表资料2
21、检验进行分析。检验进行分析。2)RC表资料资料中表资料资料中分组变量分组变量(疗法)是(疗法)是无序无序的,而的,而指标变量指标变量是(疗效)是(疗效)有序有序的。的。目的为比较不同疗法的疗效,此种单向有序目的为比较不同疗法的疗效,此种单向有序RC表资料宜用秩转换的非参数检验进行分表资料宜用秩转换的非参数检验进行分析。析。3.双向有序属性相同的双向有序属性相同的RC表资料表资料 两种方法同时对同一批样品的测定结果。两种方法同时对同一批样品的测定结果。研究目的分析两种检测方法的一致性,此时研究目的分析两种检测方法的一致性,此时宜用一致性检验或称宜用一致性检验或称Kappa检验。检验。4.双向有序
22、属性不同的双向有序属性不同的RC表资料表资料 1)研究目的为分析不同年龄组患者疗效之间)研究目的为分析不同年龄组患者疗效之间有无差别时,可把它视为单向有序有无差别时,可把它视为单向有序RC表资料,表资料,宜选用秩转换的非参数检验。宜选用秩转换的非参数检验。2)若研究目的为分析两个有序变量间是否存)若研究目的为分析两个有序变量间是否存在相关关系,宜用等级相关分析或在相关关系,宜用等级相关分析或Pearson积积 差相关分析。差相关分析。3)若研究目的为分析两个有序分类变量间若研究目的为分析两个有序分类变量间是否存在线性变化趋势,宜用有序分组资料是否存在线性变化趋势,宜用有序分组资料的的 线性趋势
23、检验(线性趋势检验(test of liner trend)。)。二、有序分组资料的线性趋势检验二、有序分组资料的线性趋势检验基本思想:基本思想:1)首先计算)首先计算R C表资料的表资料的x2值,然后将总值,然后将总的的x2值分解成线性回归分量与偏离线性回归值分解成线性回归分量与偏离线性回归分量分量2)若线性回归分量与偏离线性回归分量)若线性回归分量与偏离线性回归分量均均有统计学意义时有统计学意义时,说明两个分量变量存在相,说明两个分量变量存在相关关系,但关系关关系,但关系不是简单的直线关系不是简单的直线关系3)若线性回归分量有统计学意义,偏离线)若线性回归分量有统计学意义,偏离线性回归分量
24、无统计学意义时,说明两个分类性回归分量无统计学意义时,说明两个分类变量存在相关关系,而且是直线关系。变量存在相关关系,而且是直线关系。计算步骤计算步骤1.计算总计算总x2值值2.计算线性回归分量计算线性回归分量x2回归回归 )(回归回归14-7,1222vSbxb)15-7(XXXYllb)16-7(2XXYYbnllS的方差为为回归系数,bbb2S)17-7()(-22ffxfXlXX)18-7()(-22ffYfYlYY)19-7()(-ffYfXfXYlXY3.计算偏离线性回归分量计算偏离线性回归分量x2偏偏 )(回归总偏回归总偏20-7-222vvvxxx 例例7-11某研究者欲研究年
25、龄欲冠状动脉某研究者欲研究年龄欲冠状动脉硬化等级之间的关系,将硬化等级之间的关系,将278例尸解资料整例尸解资料整理成表,问年龄与冠状动脉硬化等级之间是理成表,问年龄与冠状动脉硬化等级之间是否存在线性变化趋势?否存在线性变化趋势?表表7-13 7-13 年龄与冠状动脉硬化的关系年龄与冠状动脉硬化的关系年龄(年龄(X)X)冠状动脉硬化等级(冠状动脉硬化等级(Y)Y)-+合计合计20-20-707022224 42 2989830-30-272724249 93 3636340-40-1616232313137 7595950509 92020151514145858合计合计12212289894
26、14126262782781.建立假设,确定检验水准建立假设,确定检验水准 H0:年龄与冠状动脉粥样硬化等级之间无线性关系年龄与冠状动脉粥样硬化等级之间无线性关系 H1:年龄与冠状动脉粥样硬化等级之间有线性关系年龄与冠状动脉粥样硬化等级之间有线性关系 =0.052.计算统计量计算统计量 T最小最小=5.42 x2=71.43 年龄变量年龄变量X由小到大赋值为由小到大赋值为1.2.3.4;对冠状动脉粥样硬化的等级对冠状动脉粥样硬化的等级Y由小到大赋值为由小到大赋值为1.2.3.413494414412314212211701263426341289112252742634128911221809
27、45835926319863345835926319833223322.fXYfYfYfXfX8192581863437111863002604053000260672736727897482634053067273670324149032414997482636727367222222-.-.-.)./(./.偏回归总偏回归回归,vxxxvxSbLLLbXYYYXX表表7-14 7-14 表表7-137-13的的x2x2的分解的分解变异来源变异来源x2x2值值自由度自由度P P总变异总变异71.4371.439 90.0050.005线性回归分量线性回归分量63.1863.181 10.0050.005偏离线性回归偏离线性回归分量分量8.258.258 80.25-0.50.25-0.5谢谢