1、吉林大学公共卫生学院1主讲人主讲人 刘欣刘欣流行病与卫生统计学教研室流行病与卫生统计学教研室吉林大学公共卫生学院2 四、假设检验的基本思想和步骤四、假设检验的基本思想和步骤吉林大学公共卫生学院3 假设检验假设检验的基本步骤如下:的基本步骤如下:1 1、建立检验假设和确定检验水准、建立检验假设和确定检验水准 检验假设有两种:检验假设有两种:检验假设检验假设(hypothesis under test)又称又称零零/原原假设假设(null hypothesis)。用。用H0表示。假定通常表示。假定通常为:某两个(或多个)总体参数相等,或某为:某两个(或多个)总体参数相等,或某两个总体参数之差等于两
2、个总体参数之差等于0 0,或某资料服从某一,或某资料服从某一特定分布(正态分布、特定分布(正态分布、Poisson分布)等。本分布)等。本例则为:例则为:H0:山山0。吉林大学公共卫生学院4 单双侧的选择在单双侧的选择在检验之前检验之前由由专业知识专业知识确定。确定。备择假设备择假设(alternative hypothesis)又称又称对立对立假设假设。用。用H1表示。表示。H1与与H0对立。对立。H1的内容可的内容可反映出检验的单双侧。本例为:反映出检验的单双侧。本例为:H1:山山0 即为即为单侧检验单侧检验(one-sided test)或或单尾检验单尾检验(one-tailed tes
3、t)。若。若H1:山山0 则为则为双侧检验双侧检验(two-sided test)或或双尾检验双尾检验(two-tailed test)。检验水准检验水准(size of a test)是假设检验作判断是假设检验作判断结论的标准,是预先确定的概率值,常常取结论的标准,是预先确定的概率值,常常取小概率事件小概率事件标准。用标准。用表示。也为表示。也为I I型错误型错误 吉林大学公共卫生学院5的概率大小的概率大小(详后详后)。实际工作中,。实际工作中,常取常取0.05。2 2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 应根据变量或资料的类型、分析的目的、设应根据变量或资料的类型、
4、分析的目的、设计的方案、检验方法的适用条件等选择检验方法。计的方案、检验方法的适用条件等选择检验方法。检验统计量检验统计量(test statistic)是在是在H0假设的条件假设的条件下由统计学家推导出的可由样本指标计算出来用下由统计学家推导出的可由样本指标计算出来用于推断结论的数值。于推断结论的数值。检验方法常用检验方法常用检验统计量检验统计量的名称命名。如的名称命名。如t检检验中的验中的t统计量统计量、u检验中的检验中的u统计量统计量、2检验中检验中的的2统计量统计量等。等。吉林大学公共卫生学院63 3、确定、确定P值和作出推断结论值和作出推断结论 P值的值的统计学含义是指从统计学含义是
5、指从H0规定的总体随机规定的总体随机抽得等于及大于(或等于及小于)现有样本获得抽得等于及大于(或等于及小于)现有样本获得的的检验统计量检验统计量的概率。的概率。通俗地讲,通俗地讲,P值就代表了值就代表了H0成立与否的概率成立与否的概率。将将P值与值与检验水准检验水准进行比较得出推断结论。进行比较得出推断结论。推断结论应包含统计结论和专业结论两部分。推断结论应包含统计结论和专业结论两部分。若若(统计结论)(统计结论)(专业(专业结论)结论)吉林大学公共卫生学院7 第四节第四节 t 检验和检验和u 检验检验 t 检验检验(t-test,亦称亦称Students t-test)的应用条件:的应用条件
6、:当样本例数当样本例数n较小,样本来自正态总体,总体标准较小,样本来自正态总体,总体标准差未知,在做两个样本均数比较时还要求两样本的差未知,在做两个样本均数比较时还要求两样本的总体方差相等,即总体方差相等,即方差齐性方差齐性(homogeneity)。u 检验检验(u-test)的应用条件:的应用条件:主要适用于两样本主要适用于两样本含量含量n n较大(均大于较大(均大于5050)的情况。)的情况。吉林大学公共卫生学院8一、样本均数与总体均数的比较一、样本均数与总体均数的比较 单样本单样本t 检验检验 用于一组定量资料的样本均数用于一组定量资料的样本均数代表未知的总体均数代表未知的总体均数和已
7、知的总体均数和已知的总体均数0(一般为一般为理论值、标准值或经大量观察所得的稳定值理论值、标准值或经大量观察所得的稳定值)进行进行比较。其检验统计量的计算公式为:比较。其检验统计量的计算公式为:nSXSXtX001 n吉林大学公共卫生学院9 例例 根据大量调查,已知正常成年男子脉搏均数为根据大量调查,已知正常成年男子脉搏均数为72次次/分。某分。某医生在一山区随机抽查了医生在一山区随机抽查了25名健康名健康成年男子,求得其脉搏均数成年男子,求得其脉搏均数为为74.2次次/分,分,标准差为标准差为6.0次次/分。能否据此认为分。能否据此认为该山区该山区成年男子脉搏均数成年男子脉搏均数高高于于一般
8、成年男子脉搏均数一般成年男子脉搏均数?在本例中,山区成年男子脉搏均数用在本例中,山区成年男子脉搏均数用山山表示,一般成表示,一般成年男子脉搏均数用年男子脉搏均数用0表示。表示。0=72次次/分分一般总体一般总体山山=?山区总体山区总体n=25分次分次/0.6/2.74SX吉林大学公共卫生学院10 若若 下面通过下面通过例例10.1710.17具体介绍假设检验的过程:具体介绍假设检验的过程:H0:山山0H1:山山0单侧,单侧,=0.05833.1250.6722.7400nSXSXtX吉林大学公共卫生学院11 =24,查查单侧单侧t,=t0.05,24=1.711,今求得,今求得 t=1.833
9、1.711,P0.05,按按=0.05水准拒绝水准拒绝 H0,有统计学意义。可认为该山区成年男子脉,有统计学意义。可认为该山区成年男子脉 搏数高于一般成年男子脉搏数。搏数高于一般成年男子脉搏数。上述上述例题例题属于单样本属于单样本t检验,其假设检验检验,其假设检验的推断结果是依据的推断结果是依据t分布的原理作出的。为了理解分布的原理作出的。为了理解其推断过程的原理,通过直观的示意图(见其推断过程的原理,通过直观的示意图(见附图附图)表达上述例题假设检验的过程。表达上述例题假设检验的过程。吉林大学公共卫生学院12 例例5.15.1 以往通过大规模调查已知某地新生儿以往通过大规模调查已知某地新生儿
10、出生体重为出生体重为3.30kg3.30kg,从该地难产儿中随机抽取,从该地难产儿中随机抽取3535名名新生儿作为研究样本,平均出生体重为新生儿作为研究样本,平均出生体重为3.42kg3.42kg,标,标准差为准差为0.40kg,0.40kg,问该地难产儿出生体重是否与一般问该地难产儿出生体重是否与一般新生儿体重不同?新生儿体重不同?吉林大学公共卫生学院13 配对配对t 检验检验 用于用于配对设计配对设计的定量资料的样本的定量资料的样本均数比较。均数比较。配对设计配对设计主要有两种:主要有两种:二、配对设计资料的比较二、配对设计资料的比较配对设计配对设计同源配对同源配对异源配对异源配对同种处理
11、前后同种处理前后两种不同处理两种不同处理 用于推断两种处理或处理前后的结果有无差用于推断两种处理或处理前后的结果有无差别。利用两种处理或处理前后的别。利用两种处理或处理前后的差值差值d的样本均数的样本均数 所代表的未知总体均数所代表的未知总体均数d 与已知的总体均数与已知的总体均数d吉林大学公共卫生学院14nSdnSdSdtdddd01 n0=0的比较。的比较。其检验统计量的计算公式为:其检验统计量的计算公式为:例例 某护师随机抽取某护师随机抽取10名健康女大学生,在午饭后休息名健康女大学生,在午饭后休息1小时,小时,测试口腔温度,体温表分别在口腔中放置测试口腔温度,体温表分别在口腔中放置4分
12、钟和分钟和7分钟,测试结果见分钟,测试结果见表表10-9。试比较两种放置时间测试结果是否相同?。试比较两种放置时间测试结果是否相同?本试验属于同源配对中两种不同的处理的比较。本试验属于同源配对中两种不同的处理的比较。吉林大学公共卫生学院15学生序号(1)4分钟(2)7分钟(3)d(4)=(3)-(2)d2(5)=(4)(4)136.7036.7037.0537.050.350.350.12250.1225236.7036.7036.8536.850.150.150.02250.0225336.9036.9037.0537.050.150.150.02250.0225436.9036.9036.
13、8536.85-0.05-0.050.00250.0025536.9036.9037.0037.000.100.100.01000.0100636.6536.6536.9036.900.250.250.06250.0625737.0537.0537.3037.300.250.250.06250.0625836.7536.7537.0537.050.300.300.09000.0900936.8036.8037.1037.100.300.300.09000.09001036.5536.5536.8036.800.250.250.06250.0625合计2.052.050.54750.5475dd
14、2表10-9 10名健康女大学生口腔温度测试结果吉林大学公共卫生学院16H0:d0=0H1:d 0 0=0.05205.01005.2ndd1189.011005.25475.01222nnnddSd45.5101189.0205.0nSdtd吉林大学公共卫生学院17 =n-1=10-1=9,查查双侧双侧t,=t0.05,9=2.262,今求得今求得 t=5.452.262,P0.05,按按=0.05水准水准拒绝拒绝H0,有统计学意义。可认为测试时间长短对,有统计学意义。可认为测试时间长短对测试结果有影响,测试结果有影响,7分钟测试结果高于分钟测试结果高于4分钟。分钟。多数假设检验查的是双侧多
15、数假设检验查的是双侧 t0.001,9=4.781,得到得到P0.001。实际上在实际上在=0.05水准下,二者所水准下,二者所得结论完全一样。得结论完全一样。吉林大学公共卫生学院18 两独立样本两独立样本t 检验检验 亦称亦称成组成组t 检验检验。用于。用于完全完全随机设计随机设计的定量资料的两样本均数的比较,目的是的定量资料的两样本均数的比较,目的是推断两样本均数各自所代表的总体均数推断两样本均数各自所代表的总体均数1和和2是否是否相等。相等。完全随机设计完全随机设计是指分别从两研究总体中随机是指分别从两研究总体中随机抽取样本,然后比较两组的总体指标。抽取样本,然后比较两组的总体指标。三、
16、三、两独立样本均数的比较两独立样本均数的比较吉林大学公共卫生学院191 1、两个大样本均数的比较、两个大样本均数的比较121212221212)XXXXXXuSSSnn吉林大学公共卫生学院202 2、两个小样本均数的比较、两个小样本均数的比较)11(2)1()1()11(212122221121212212121nnnnSnSnXXnnSXXSXXtcXX221nn吉林大学公共卫生学院211 1、资料必须合乎随机化抽样原则资料必须合乎随机化抽样原则2 2、选用的假设检验方法应符合其应用条件选用的假设检验方法应符合其应用条件3 3、实际差别大小与统计意义的区别实际差别大小与统计意义的区别4 4、
17、进行假设检验时,对差异有无统计学意义的进行假设检验时,对差异有无统计学意义的 判断不能绝对化判断不能绝对化5 5、假设检验的单侧检验和双侧检验的选择假设检验的单侧检验和双侧检验的选择吉林大学公共卫生学院22一、一、型错误型错误 型错误(型错误(type errortype error)是指拒绝了实际上成立的H0,即“弃真”的错误。型错误的概率用表示。二、二、型错误型错误 型错误(型错误(type errortype error)是指接受了实际上不成立的H0,即“存伪”的错误。型错误的概率用 表示。愈小,愈小,愈大;愈大;愈大,愈大,愈小。愈小。吉林大学公共卫生学院23吉林大学公共卫生学院24
18、常用常用相对数相对数有:有:率、构成比和相对比。率、构成比和相对比。一、常用相对数一、常用相对数 率率 率率(rate)又称又称频率频率指标。指标。说明某现象发生的说明某现象发生的频度或强度。频度或强度。常以百分率常以百分率(%)、千分率、千分率()、万、万分率分率(1/万万)、十万分率、十万分率(1/10万万)等表示。计算公式等表示。计算公式为:为:K单位总数可能发生某现象的观察单位数实际发生某现象的观察率 第一节第一节 分类变量资料的统计描述分类变量资料的统计描述吉林大学公共卫生学院25 表表11-1中患病率的大小体现了不同地区脊柱侧中患病率的大小体现了不同地区脊柱侧凸患病强度的大小。凸患
19、病强度的大小。构成比构成比 构成比构成比(proportion)又称又称构成构成指标。指标。说明某说明某事物内部某组成部分占其全部的比重或分布事物内部某组成部分占其全部的比重或分布。计。计算公式为:算公式为:%100察单位数总和某事物内部各部分的观观察单位数某事物内部某一部分的构成比 表表11-1中阳性数构成比的大小体现了不同地区中阳性数构成比的大小体现了不同地区脊柱侧凸患病的例数在总例数中所占的比重大小。脊柱侧凸患病的例数在总例数中所占的比重大小。吉林大学公共卫生学院26 相对比相对比 相对比相对比(relative ratio)亦称亦称比比(ratio),又称,又称对比对比指标。指标。说明
20、两个有关指标说明两个有关指标比对比对的水平,的水平,常用倍常用倍数或百分数表示。计算公式为:数或百分数表示。计算公式为:)(或乙指标甲指标相对比%100 两个对比指标可以是两个对比指标可以是绝对数绝对数、相对数相对数或或平均数平均数等。如某地的等。如某地的男女性别比男女性别比即为即为绝对数绝对数之比;两地区之比;两地区的某病死亡率之比即为的某病死亡率之比即为相对数相对数之比;两地区之比;两地区7 7岁男岁男童的平均身高之比即为童的平均身高之比即为平均数平均数之比。之比。吉林大学公共卫生学院27吉林大学公共卫生学院28二、应用相对数时的注意事项二、应用相对数时的注意事项(二)正确区分构成比和率(
21、二)正确区分构成比和率(一)计算率或构成比时分母不宜过小(一)计算率或构成比时分母不宜过小(三)正确计算平均率三)正确计算平均率 (四)注意资料的可比性(四)注意资料的可比性 (五)样本率或样本构成比进行比较时要做(五)样本率或样本构成比进行比较时要做 假设检验假设检验吉林大学公共卫生学院29吉林大学公共卫生学院30 从某个二项分类总体中随机抽取含量一定的样从某个二项分类总体中随机抽取含量一定的样本,样本率服从本,样本率服从二项分布二项分布,即样本中阳性数或样本,即样本中阳性数或样本阳性率的分布概率等于二项式展开后各项。阳性率的分布概率等于二项式展开后各项。XnXXnXnxP)1()!(!)(
22、式中式中为总体阳性率,为总体阳性率,n为样本含量,为样本含量,X为阳性数。为阳性数。一、二项分布一、二项分布吉林大学公共卫生学院31 对于抽样研究,率和均数一样,也存在抽样误对于抽样研究,率和均数一样,也存在抽样误差,即伴随在抽样过程中的样本率与总体率之间的差,即伴随在抽样过程中的样本率与总体率之间的差异。同样,率的抽样误差的大小也用差异。同样,率的抽样误差的大小也用率的标准误率的标准误来表示,其公式为:来表示,其公式为:np)1(式中式中P 为样本率的总体标准误为样本率的总体标准误,为总体率为总体率,n 为样本含量为样本含量。二、率的抽样误差与标准误二、率的抽样误差与标准误吉林大学公共卫生学
23、院32实际工作中,总体率实际工作中,总体率常常未知,常用样本率常常未知,常用样本率p代替代替nppSp)1(式中式中SP 为样本率的样本标准误为样本率的样本标准误,为总体率为总体率,n为为样本含量样本含量。例例 某研究者抽样调查了某地区三联疫苗接种者某研究者抽样调查了某地区三联疫苗接种者500500人,人,接种后接种后3535名出现皮疹,发生率为名出现皮疹,发生率为7%7%,试计算率的标准误。,试计算率的标准误。0114.0500)07.01(07.0)1(nppSp吉林大学公共卫生学院33 总体率的估计总体率的估计 1 1 点估计:点估计:2 2 区间估计:区间估计:1 1)正态近似法:)正
24、态近似法:当样本含量当样本含量n足够大,样本率足够大,样本率p或或1-p均均 不太小时(如不太小时(如np和和n(1-p)均大于)均大于5),),总体率总体率()95%的的可信区间:可信区间:p1.96Sp 2 2)查表法:)查表法:当当n较小,如较小,如n 特别是特别是p接近于接近于0或或150吉林大学公共卫生学院34 例例 为了解某药的疗效为了解某药的疗效,对对100100名患者治疗的结果进名患者治疗的结果进行调查行调查,结果为结果为8080人有效人有效,有效率为有效率为80%80%样本率的样本率的抽样误差抽样误差为为:04.0100)80.01(80.0)1(nppSp该药物有效率的该药
25、物有效率的95%可信区间可信区间为为:%)84.87%,16.72()04.096.180.0,04.096.180.0()96.1,96.1(ppSpSp吉林大学公共卫生学院35 四、两个率比较的四、两个率比较的u u检验检验(一)样本率与总体率的比较(一)样本率与总体率的比较nppup)1(式中式中p为样本率,为样本率,为总体率,为总体率,为样本率的总体标准误为样本率的总体标准误p吉林大学公共卫生学院36 四、两个率比较的四、两个率比较的u u检验检验(二)两个样本率的比较(二)两个样本率的比较)11)(1(21212121nnppppSppuccpp212121nnXXSpp吉林大学公共
26、卫生学院37 第三节第三节 检验检验2吉林大学公共卫生学院38一、一、2 2检验的基本思想检验的基本思想 当当两个样本率进行比较时,可以将两个率转两个样本率进行比较时,可以将两个率转化成四个化成四个绝对数绝对数,即每组中的实际发生数和未发,即每组中的实际发生数和未发生数,此四数构成了两行、两列的生数,此四数构成了两行、两列的四格表四格表(four-fold table)。形式见表。形式见表11-7。通过下面通过下面例例8.18.1(两个样本治愈率比较)介绍(两个样本治愈率比较)介绍2检验检验的基本思想。的基本思想。吉林大学公共卫生学院39发生数未发生数合计A组aba+bB组cdc+d合计a+c
27、b+dn表11-7 四格表2检验的基本结构吉林大学公共卫生学院40n2=110 例例1 1 某研究者为探讨某研究者为探讨A、B两种治疗方法对某种疾病的疗效,两种治疗方法对某种疾病的疗效,收集的资料见表收集的资料见表11-8。问两种治疗方法的疗效是否有统计学差异。问两种治疗方法的疗效是否有统计学差异。A疗法疗法B疗法疗法12n1=100p1=11.0%p2=28.2%1=212吉林大学公共卫生学院41H0:1 2H1:1 2=0.05 可将可将H0看作看作1 2 两样本两样本合并的治愈率合并的治愈率pc=20.0%,若若A疗法按此疗法按此合并治愈率合并治愈率将得到下述将得到下述治愈数:治愈数:%
28、0.202104211010031112121nnXXpc20%0.2010021042100 此数称为此数称为理论频数理论频数(theoretical frequency),简称简称理论数理论数,用用T表示。其计算公式为:表示。其计算公式为:吉林大学公共卫生学院42 式中式中Trc 为第为第r行第行第c列的理论数列的理论数,nr为为Trc所在行合计所在行合计,nc为为Trc所在列合计所在列合计。nnnTcrrc 同理同理,B疗法按此疗法按此合并治愈率合并治愈率将得到下述治将得到下述治愈数:愈数:22%0.20110210421101221nnnT A疗法按上述疗法按上述理论数理论数计算公式将
29、得到下述治计算公式将得到下述治愈数:愈数:20%0.20100210421001111nnnT吉林大学公共卫生学院43 表中的原始绝对数称为表中的原始绝对数称为实际频数实际频数(actual frequency),简称简称实际数实际数,用用A表示。表示。A、B疗法若按疗法若按合并治愈率合并治愈率得到得到未未治愈数分别治愈数分别为:为:802101681002112nnnT882101101682222nnnT 从上可以看出,两样本率的差别就等价于从上可以看出,两样本率的差别就等价于实实际数际数A与与理论数理论数T的的差别。在差别。在H0下下,英国统计学家,英国统计学家Pearson K构造了下
30、述检验统计量:构造了下述检验统计量:吉林大学公共卫生学院44 此值称此值称Pearson 2值。此值是以值。此值是以理论数理论数T为基数为基数的的实际数实际数A与与理论数理论数T的的相对误差,相对误差,它反映了它反映了实际实际数数A与与理论数理论数T的吻合程度(差别的程度)的吻合程度(差别的程度)。若。若H0成立,则成立,则实际数实际数A与与理论数理论数T的的差别不会很大,出差别不会很大,出现大的现大的2值的概率值的概率P是很小的,若是很小的,若P检验水准,检验水准,就说明就说明H0成立成立是一个是一个小概率事件小概率事件,因而拒绝,因而拒绝H0;若若P,则尚不能拒绝则尚不能拒绝H0。TTA2
31、2吉林大学公共卫生学院45 Pearson 2值值近似近似服从服从2分布分布。2分布分布(chi-square distribution)是一个是一个连续型连续型分布。分布。2分布分布与自由度与自由度有关。统计学家制作了有关。统计学家制作了2分分布曲线布曲线下面积分布表下面积分布表-2界值表。界值表。2界界值用值用2()表表示,示,20.05(1)=3.84,表示在自由度表示在自由度=1的的 2分布曲线分布曲线下大于等于下大于等于3.84的面积是的面积是0.05 即即P(x3.84)=0.05。直观含义参见附图。直观含义参见附图。Pearson 2值的自由度与格子数有关,其计算值的自由度与格子
32、数有关,其计算公式为:公式为:=(行数行数1)(列数列数1)吉林大学公共卫生学院46附图附图 自由度自由度为为1的的 2分布曲线下面积为分布曲线下面积为0.05的界值的界值吉林大学公共卫生学院47 例例1 1 2检验的完整步骤如下:检验的完整步骤如下:H0:1 2H1:1 2=0.05治愈未治愈A11(20)89(80)B31(22)79(88)66.9888879222231808089202011222222TTA =(行数行数1)(列数列数1)=(2-1)(2-1)=1,查查2界值界值表,表,20.05(1)=3.84。今求得。今求得2=9.663.84,则则P0.05,按按=0.05水
33、准拒绝水准拒绝H0,差异有统计学意义。差异有统计学意义。可认为可认为B种疗法的疗效高于种疗法的疗效高于A种疗法种疗法。吉林大学公共卫生学院48二、二、四格表四格表2 2检验检验 将将四格表四格表中四个中四个绝对数绝对数(a,b,c,d)代入基本代入基本公式公式化简后得化简后得四格表四格表专用专用公式:公式:aba+bcdc+da+cb+ddbcadcbanbcad22 吉林大学公共卫生学院49 与与四格表四格表基本基本公式公式的结果相同。实际常用的结果相同。实际常用四格四格表表专用专用公式求公式求2值值,因为此式不必求,因为此式不必求理论数理论数即可求即可求2值值。用用四格表四格表专用专用公式
34、求公式求例例1 1 2值如下:值如下:dbcadcbanbcad2266.916842110100210893179112治愈 未治愈A 11(a)89(b)100100 a+bB 31(c)79(d)110110 c+d4242168168210210a+cb+dn吉林大学公共卫生学院50四格表四格表2检验的连续性校正检验的连续性校正 由于由于2分布分布是一个是一个连续型连续型分布,而分布,而四格表四格表中的中的资料为资料为离散型离散型数据,由此得到的数据,由此得到的2检验统计量的抽检验统计量的抽样分布也是样分布也是离散型离散型分布。为改善分布。为改善2统计量分布的连统计量分布的连续性,需要
35、对续性,需要对2值作连续性校正。值作连续性校正。连续性校正的连续性校正的四格表四格表基本基本公式为:公式为:TTA225.0 连续性校正的连续性校正的四格表四格表专用专用公式为:公式为:吉林大学公共卫生学院51dbcadcbannbcad222 连续性校正主要针对连续性校正主要针对四格表四格表资料,尤其当资料,尤其当理论理论数数较小时较小时。四格表四格表2检验的条件为:检验的条件为:当当n40且且的的T5,不用校正。,不用校正。当当n40且且的的1T5,需校正。,需校正。当当n40或或的的T1,不能用,不能用2检验,检验,需用需用Fisher精确概率法精确概率法(Fisher exact te
36、st)。吉林大学公共卫生学院52 判断判断四格表四格表资料是否符合资料是否符合四格表四格表2检验的某条检验的某条件的件的简便简便方法为:方法为:首先判断首先判断n是否是否40,若是若是(n40),接着求,接着求四格四格表表中中行合计数与列合计数均最小的那一格行合计数与列合计数均最小的那一格的的理论数理论数T,若若T5,则用,则用2检验;若检验;若1T5,则用校正,则用校正2检验;若检验;若T1,则用,则用Fisher精确概率法。若否精确概率法。若否(n40),则直接用则直接用Fisher精确概率法。精确概率法。例例8.28.2 某医师用甲、乙两种药物治疗小儿单纯性消某医师用甲、乙两种药物治疗小
37、儿单纯性消化不良症状,结果见下表化不良症状,结果见下表11-9。试问甲、乙两种药物的疗。试问甲、乙两种药物的疗效是否有统计学差异。效是否有统计学差异。吉林大学公共卫生学院53药物痊愈数未愈数合计痊愈率%甲26(28.82)7(4.18)3378.8乙36(33.18)2(4.82)3894.7合计6297187.3表11-9 两种药物对小儿单纯性消化不良疗效的比较 本例若按本例若按理论数理论数计算公式求出所有计算公式求出所有理论数理论数(见括号内数),发现有两个格子的见括号内数),发现有两个格子的理论数理论数小于小于5,且总例数大于且总例数大于40,需用校正,需用校正2检验。检验。518.47
38、13392112nnnT582.4713892222nnnTn=7140吉林大学公共卫生学院54H0:1 2H1:1 2=0.0575.282.45.082.42.82.285.082.28265.02222TTA75.23833962712717362262222dbcadcbannbcad或者或者吉林大学公共卫生学院55 =1,查查2界值表,界值表,20.05(1)=3.84。今求得。今求得2=2.753.84,则则P0.05,按,按=0.05水准水准尚不能尚不能拒拒绝绝H0,差异无统计学意义。认为甲乙两种药物的,差异无统计学意义。认为甲乙两种药物的疗效相同。疗效相同。本例若不进行本例若不
39、进行连续性校正,连续性校正,2值为:值为:07.482.482.42.82.2882.2826222 则则2=4.073.84,则则P0.05,按,按=0.05水准水准拒绝拒绝H0,差异有统计学意义。与上述结论相反,差异有统计学意义。与上述结论相反,不不校正导致了假阳性错误校正导致了假阳性错误。吉林大学公共卫生学院56 练习练习 某医学院抽样调查大学四年级和五年级的学生近视某医学院抽样调查大学四年级和五年级的学生近视眼患病情况,如表眼患病情况,如表8-38-3。试问两个年级的患病率有无差。试问两个年级的患病率有无差异?异?表表8-3 8-3 两个年级学生近视眼患病率比较两个年级学生近视眼患病率
40、比较 .年年 级级 近近 视视 非近视非近视 合合 计计 .四年级四年级 2(4.67)26(23.33)282(4.67)26(23.33)28 五年级五年级 5(2.33)9(11.695(2.33)9(11.69)14 .14 .合合 计计 7 35 42 .7 35 42 .吉林大学公共卫生学院57三、配对设计分类变量资料的三、配对设计分类变量资料的2检验检验 对于配对设计的对于配对设计的分类资料分类资料,可把数据整理成,可把数据整理成如下表如下表11-10的形式的形式,此表常称,此表常称配对四格表配对四格表。+aba+bcdc+d合计a+cb+dn表11-10 配对四格表资料的基本结
41、构甲法合计乙法吉林大学公共卫生学院58 从从配对四格表配对四格表中可以看出,中可以看出,a 是甲、乙两法均是甲、乙两法均是阳性的频数,是阳性的频数,d 是甲、乙两法均是阴性的频数,是甲、乙两法均是阴性的频数,b 是甲法阳性、乙法阴性的频数,是甲法阳性、乙法阴性的频数,c 是甲法阴性、是甲法阴性、乙法阳性的频数。乙法阳性的频数。若比较甲、乙两法有无差别,只需推断若比较甲、乙两法有无差别,只需推断b 和和c 分别代表的总体的分别代表的总体的B 和和C是否相等即可,其检验统是否相等即可,其检验统计量的计算公式为:计量的计算公式为:cbcb22吉林大学公共卫生学院59 此检验又称此检验又称McNema
42、r检验。检验。适用条件为适用条件为b+c40,当,当b+c40时,时,应作连续应作连续性校正,见下式。性校正,见下式。cbcb221 自由度为自由度为1。例例 某研究者用甲、乙两种试剂检验某研究者用甲、乙两种试剂检验132份份HBsAg阳阳性血清,结果见下表性血清,结果见下表11-11。试问甲、乙两种试剂检验结。试问甲、乙两种试剂检验结果有无差别。果有无差别。吉林大学公共卫生学院60+801090311142合计11121132表11-11 两种试剂检测HBsAg结果甲试剂合计乙试剂 本例为分类资料配对设计的本例为分类资料配对设计的四格表四格表,故可用,故可用配对四格表配对四格表2检验,又已知
43、检验,又已知b+c=31+10=4140,勿需校正勿需校正。吉林大学公共卫生学院61H0:B CH1:B C=0.0576.1031103110222cbcb =1,查查2界值表,界值表,20.05(1)=3.84。今求得。今求得2=10.763.84,则则P0.05,按,按=0.05水准拒绝水准拒绝H0,差别有统计学意义。认为甲乙两种试剂的差别有统计学意义。认为甲乙两种试剂的HBsAg检出率不同,乙试剂高于甲试剂检出率不同,乙试剂高于甲试剂。吉林大学公共卫生学院62四、行列表资料的四、行列表资料的2检验检验 当当多个样本率或多组构成比进行比较多个样本率或多组构成比进行比较时,可时,可构成多行
44、多列的构成多行多列的表表,称为称为行列表行列表,又称又称RC表表。将将理论数理论数的公式代入的公式代入2检验检验的基本公式的基本公式TTA22化简得下式。化简得下式。吉林大学公共卫生学院63122CRnnAn 式中式中n 为总例数为总例数,A为每个格子的实际数为每个格子的实际数,nR、nC分别分别为某格子实际数为某格子实际数A对应的行合计数和列合计数对应的行合计数和列合计数。例例 某医院研究急性白血病患者与慢性白血病患者的某医院研究急性白血病患者与慢性白血病患者的血型构成情况,数据资料见下表血型构成情况,数据资料见下表11-12。问急、慢性白血。问急、慢性白血病患者的总体血型构成是否相同。病患
45、者的总体血型构成是否相同。ABOAB合计急性白血病58495918184慢性白血病4327338111合计101769226295表11-12 急、慢性白血病患者的血型构成情况吉林大学公共卫生学院64H0:急性和慢性白血病患者的血型构成相同急性和慢性白血病患者的血型构成相同H1:急性和慢性白血病患者的血型构成不同急性和慢性白血病患者的血型构成不同=0.0584.11111268.1847649184101582952222 =(R1)(C1)=(2-1)(4-1)=3,查查2界值表,界值表,20.05(3)=7.81。今求得。今求得2=1.847.81,则则P0.05,按按=0.05水准尚不拒
46、绝水准尚不拒绝H0。认为急、慢性白血病。认为急、慢性白血病患者的总体血型构成相同。患者的总体血型构成相同。吉林大学公共卫生学院65 例例 某研究者用三种不同的治疗方案治疗慢性支气管某研究者用三种不同的治疗方案治疗慢性支气管炎,得到如下表炎,得到如下表11-12的数据。试比较三种治疗方案的疗的数据。试比较三种治疗方案的疗效有无统计学差异。效有无统计学差异。组别有效无效合计有效率(%)西药575730308765.52中药242420204454.55中西医结合130130202015086.67合计21170281表11-13 三种不同治疗方案的疗效比较H0:三种治疗方案的总体有效率相等三种治疗
47、方案的总体有效率相等H1:三种治疗方案的总体有效率三种治疗方案的总体有效率不相等或不全相等不相等或不全相等=0.05吉林大学公共卫生学院6694.2411507020.87703087211572812222 =(R1)(C1)=(3-1)(2-1)=2,查查2界值表,界值表,20.05(2)=5.99。今求得。今求得2=24.947.81,则则P 0.05,按按=0.05水准拒绝水准拒绝H0。认为三种方案治疗慢性支。认为三种方案治疗慢性支气管炎的疗效不相等或不全相等。气管炎的疗效不相等或不全相等。上述上述例题例题的的2检验的检验的P值的大小是通过各自值的大小是通过各自由由样本样本求得的求得的2值,再比较在值,再比较在=0.05水准下水准下2分布曲分布曲线下相应界值获得的。线下相应界值获得的。吉林大学公共卫生学院67 练习:练习:用两种方法检查已确诊的乳腺用两种方法检查已确诊的乳腺癌患者癌患者120120名。甲法检出率为名。甲法检出率为6060,乙,乙法检出率为法检出率为5050,甲乙两法一致的检,甲乙两法一致的检出率为出率为3535,问两种方法有无差别?,问两种方法有无差别?