1、8 8 定性资料的比较定性资料的比较有关样本资料的差异性检验有关样本资料的差异性检验定量资料定量资料数据类型数据类型前提前提条件条件t/Z检验检验四格表四格表 RC表表配对配对四格表四格表设计类型设计类型单单样样本本两两独独立立样样本本配配对对设设计计多多独独立立样样本本方差分析方差分析两两组组二二分分类类配配对对设设计计多多组组多多分分类类单单样样本本两两多多独独立立样样本本配配对对设设计计不满足不满足t 检验检验/方方差分析条件的差分析条件的等等级级资资料料设计设计类型类型定性资料定性资料设计类型设计类型 检验检验2秩和检验秩和检验随随机机区区组组资资料料析析因因设设计计资资料料重重复复测
2、测量量资资料料前提条件前提条件前提条件前提条件教学内容 分类变量分类变量-率的假设检验率的假设检验 检验(检验(chi-square test):是英国人是英国人K.Pearson于于1900年提出年提出理论依据:理论依据:分布分布(chi-square distribution)拟合优度检验拟合优度检验(goodness of fit test)22例例8-11 某医生欲计较万拉法新与氟西某医生欲计较万拉法新与氟西汀治疗老年期抑郁症的疗效,将汀治疗老年期抑郁症的疗效,将60名病名病情相近的患者随机分为两组,治疗结果情相近的患者随机分为两组,治疗结果如下,问其效果有无差别?如下,问其效果有无差
3、别?abcd19111515四格表四格表 1.实际频数实际频数(actual frequency,A):):实际资料中的数据实际资料中的数据理论频数(理论频数(T):):T11=30 =173034603460万法拉新组理万法拉新组理论上应感染的论上应感染的人数人数理论感染率理论感染率 2.无效假设下频数的重新分配无效假设下频数的重新分配 -理论频数理论频数(Theretical frequency,T)nmnTjiij 式中式中tij 表示表示 i 行行 j 列的理论频数,列的理论频数,ni为相应第为相应第i 行的合计,行的合计,mj为相应第为相应第 j 列的合计,列的合计,n为总例数。为总
4、例数。(i=1,2;j=1,2)TTA22)(理论频数理论频数实际频数实际频数如果两个率不同只是抽样误差所致,那么如果两个率不同只是抽样误差所致,那么A与与T之差就不之差就不会很大,则会很大,则 值不会太大;如值不会太大;如A与与T相差过大,相差过大,值就值就会增大,若值大于所规定检验水准的界值,就可拒绝会增大,若值大于所规定检验水准的界值,就可拒绝H0,认为两总体率之间有差别。认为两总体率之间有差别。H0为真时,为真时,Pearson 值近似地服从值近似地服从 分布。分布。自由度计算:自由度计算:=(行数(行数-1)(列数(列数-1)3.检验检验的基本思想:用的基本思想:用 统计量统计量来度
5、量来度量实际频数实际频数和和H0成立条件下成立条件下理论频数理论频数之间的偏差。之间的偏差。2222222分布分布(chi-square distribution)2分布只有一个参数,即自由度分布只有一个参数,即自由度 v 若随机变量若随机变量X1、X2,Xn相互独立且服从标准相互独立且服从标准正态分布,则正态分布,则 服从自由度为服从自由度为n的的2分布。分布。niiX122检验水准为检验水准为时时的的 2 临界值临界值图图2 2分布的临界值示意图分布的临界值示意图:右侧尾部面积为:右侧尾部面积为a a时的时的2临界值,记作临界值,记作 2(a a,)2界值表:将界值表:将2分布右侧尾部面积
6、等于分布右侧尾部面积等于a a时所对应的时所对应的2值称为值称为2分布的临界值分布的临界值,对于不同的自由度及,对于不同的自由度及a a值有值有不同的临界值,由这些临界值构成的表即不同的临界值,由这些临界值构成的表即2界值表界值表。TTA22)(4、值的特点:值的特点:若各实际频数与理论频数完全相同,则值必为零。若各实际频数与理论频数完全相同,则值必为零。永远是正值,且实际频数与理论频数的相对差异永远是正值,且实际频数与理论频数的相对差异 越大时值也越大。越大时值也越大。格子越多,即自由度越大,值也会越大。格子越多,即自由度越大,值也会越大。5、自由度计算:、自由度计算:=(行数(行数-1)(
7、列数(列数-1)2两组二分类资料比较配对设计配对设计二分类资料二分类资料四格表四格表 检验检验直接法直接法校正法校正法Fisher精确概率法精确概率法配对四格表配对四格表 检验检验直接法直接法校正法校正法主要内容:主要内容:22完全随机分组两完全随机分组两组二分类资料组二分类资料8.2.1 独立的两组二分类资料比较独立的两组二分类资料比较 例例8-1 比较万拉法新与氟西汀治疗老年期抑郁症的疗比较万拉法新与氟西汀治疗老年期抑郁症的疗效,问其效果有无差别?效,问其效果有无差别?【案例解析案例解析】n 研究目的:差异性比较研究目的:差异性比较n 资料类型:定性资料资料类型:定性资料二分类二分类n 设
8、计类型:完全随机分组分二组设计类型:完全随机分组分二组满足满足样本例数样本例数40,最小理论频数,最小理论频数5H0:1 1=2H1:1 2=0.05检验检验2TTA22)()()()()(22dbcadcbanbcad基本公式:基本公式:专用公式:专用公式:四格表资料四格表资料(2)计算检验统计量计算检验统计量(1)建立假设检验,确定显著性水平建立假设检验,确定显著性水平 H0:12,即两药的总体痊愈率相同;即两药的总体痊愈率相同;H1:12,即两药的总体痊愈率不相同。,即两药的总体痊愈率不相同。0.05 n=6040,最小理论值为最小理论值为T11=(3026)/60=135 086.11
9、3)1315(17)1715(13)1311(17)1719()(222222TTA【检验过程检验过程】(3)确定确定P 值,得出结论值,得出结论:查查 界值表,得界值表,得 (0.05,1)=3.84,P 0.05。按按0.05水准不拒绝水准不拒绝H0,差别无统计学意义,因此尚,差别无统计学意义,因此尚不能认为两药治疗老年更年期抑郁症的痊愈率不同。不能认为两药治疗老年更年期抑郁症的痊愈率不同。a a=0.05拒绝域拒绝域自由度:自由度:v=12四格表的专用公式四格表的专用公式:)()()()(22dbcadcbanbcad当当T5且且n40时,四格表时,四格表 检验可用专用公式:检验可用专用
10、公式:式中式中a、b、c、d分别为四格表的实际频数,分别为四格表的实际频数,n为总例数为总例数=a+b+c+d。2086.12634303060)15111519()()()()(222dbcadcbanbcad结果与基本公式基本相同结果与基本公式基本相同。解法二:解法二:数据录入数据录入【电脑实现电脑实现】SPSS2.对频数进行加权对频数进行加权3.运算过程运算过程4.SPSS结果输出:结果输出:分组*疗效 Crosstabulation分组*疗效 CrosstabulationCount19113015153034266012分组Total12疗效TotalChi-Square Tests
11、Chi-Square Tests1.086b1.297.6111.4341.0901.297.435.2171.0681.30160Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea.0 cells(.0%)have expec
12、ted count less than 5.The minimum expected count is 13.00.b.检验检验结果显示:结果显示:=1.086,P=0.297,按,按0.05尚不能认为万拉法新与氟西汀治疗老年更年期抑郁症尚不能认为万拉法新与氟西汀治疗老年更年期抑郁症的痊愈率不同。的痊愈率不同。【统计报告统计报告】2 欲比较万拉法新与氟西汀治疗老年期抑郁症的疗效是欲比较万拉法新与氟西汀治疗老年期抑郁症的疗效是否相同,将病情相近的否相同,将病情相近的60名患者随机分两组,分别用两种名患者随机分两组,分别用两种药物治疗,结果见下表:药物治疗,结果见下表:2【结果报告结果报告】例例8
13、-5 研究两种药物治疗冠心病患者实验室指标改善研究两种药物治疗冠心病患者实验室指标改善效果,观察了效果,观察了52例患者,结果如下。试问两种药物的例患者,结果如下。试问两种药物的改善效果是否相同?改善效果是否相同?(25.5)(13.5)(8.5)(4.5)【案例解析案例解析】n 研究目的:差异性比较研究目的:差异性比较n 资料类型:定性资料资料类型:定性资料n 设计类型:独立二组二分类(四格表资料)设计类型:独立二组二分类(四格表资料)满足满足样本例数样本例数40,但最小理论频数,但最小理论频数 5H0:1=2H1:1 2=0.05校正校正 检验检验2TTA22)5.0()()()()2/(
14、22dbcadcbannbcad基本公式:基本公式:四格表专用公式:四格表专用公式:答:答:(1)(2)(3)SPSS结果输出:结果输出:分组*疗效 Crosstabulation分组*疗效 CrosstabulationCount295341081839135212分组Total12疗效TotalChi-Square TestsChi-Square Tests5.551b1.0184.0781.0435.3571.021.040.0235.4441.02052Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exa
15、ct TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea.1 cells(25.0%)have expected count less than 5.The minimum expected count is 4.50.b.【电脑实现电脑实现】SPSS例例8-6 研究脑卒中患者康复治疗效果,观察了病情近研究脑卒中患者康复治疗效果,观察了病情近似折似折22例患者,结果
16、见下表示,问脑卒中患者参加康例患者,结果见下表示,问脑卒中患者参加康复治疗与否是否影响其身体恢复?复治疗与否是否影响其身体恢复?【案例解析案例解析】n 研究目的:差异性比较研究目的:差异性比较n 资料类型:定性资料资料类型:定性资料二分类二分类n 设计类型:独立二组设计类型:独立二组满足满足样本例数样本例数 40,或最小理论频数,或最小理论频数1H0:1 1=2H1:1 2=0.05 Fisher确切概率法确切概率法四格表资料四格表资料Fisher确切概率法确切概率法(Fisher s exact probabilities)适用条件适用条件:样本含量样本含量 n 40;至少一个理论频数至少一
17、个理论频数T1;2检验后所得概率检验后所得概率 P 接近于检验水准接近于检验水准。建立假设,确立检验水准建立假设,确立检验水准 H0:12 H1:12 0.05 计算检验统计量计算检验统计量 n22,采用采用Fisher 确切概率法作检验。确切概率法作检验。即:在四格表周边合计数固定的情况下各种随机事件即:在四格表周边合计数固定的情况下各种随机事件及其概率及其概率答:答:!)!()!()!()!(ndcbadbcadcbapSPSS结果输出:结果输出:【电脑实现电脑实现】SPSS分组*恢复情况 Crosstabulation分组*恢复情况 CrosstabulationCount9110571
18、21482212分组Total恢复良好恢复较差恢复情况TotalChi-Square TestsChi-Square Tests5.507b1.0193.6161.0576.0391.014.031.0265.2561.02222Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp.Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Comp
19、uted only for a 2x2 tablea.2 cells(50.0%)have expected count less than 5.The minimum expected count is 3.64.b.检验的适用条件及其公式检验的适用条件及其公式适用条件适用条件基本公式基本公式四格表专用公式四格表专用公式直接法T5且n40校正法1T5且n40确切概率法T1或n40TTA22)()()()()(22dbcadcbanbcadTTA22)5.0()()()()2/(22dbcadcbannbcad!)!()!()!()!(ndcbadbcadcbap2A B 和数值资料一样,分类
20、资料也可作配对设计,和数值资料一样,分类资料也可作配对设计,只是数值资料的配对其结果是数值变量,而分类只是数值资料的配对其结果是数值变量,而分类资料的配对其结果是分类变量。资料的配对其结果是分类变量。8.2.2 配对的两组二分类资料比较配对的两组二分类资料比较 乙+-甲 +a b -c d 配对四格表 Id 甲 乙 1 +2 +-j -+n -原始数据:原始数据:问题:两种方法的检测结果阳性率是否相同?问题:两种方法的检测结果阳性率是否相同?例如:用甲、乙两种方法分别检测某项指标例如:用甲、乙两种方法分别检测某项指标n例例处理处理1处理处理 2合计合计+-+abn1=a+b_cdn2=c+d合
21、计合计m1=a+cm2=b+dn=a+b+c+d(固定值固定值)nca 的阳性率处理 2nba 的阳性率处理 1设计特点:设计特点:两份样本实质上是一样的,不是互相独立的。两份样本实质上是一样的,不是互相独立的。研究目的:研究目的:推断两处理的阳性概率有无差别。推断两处理的阳性概率有无差别。ncbncanba-21阳性率的差异和处理处理配对配对 检验的基本思想检验的基本思想2配对配对 检验的基本原理检验的基本原理:可见,两种方法阳性率的差别只与可见,两种方法阳性率的差别只与 b 和和 c 有有关,欲推断甲法和乙法的总体阳性率是否相等,只关,欲推断甲法和乙法的总体阳性率是否相等,只需比较需比较B
22、(b来自的总体)和来自的总体)和 C(c来自的总体)是来自的总体)是否相等即可。否相等即可。cbcbcbcbccbcbbTTA222222222)(则则:21.b+c40时,直接法计算:时,直接法计算:2.当当b+c40时,应作连续性校正,即校正法计算:时,应作连续性校正,即校正法计算:cbcb22)(=1 cbcb22)1(=1 b、c分别代表两种方法处理结果不同部分的实际频数分别代表两种方法处理结果不同部分的实际频数McNemar检验检验(McNemars test)配对四格表配对四格表 检验的方法选择:检验的方法选择:2 例例8.2 分别用末梢血与静脉血检查乙型肝炎,结分别用末梢血与静脉
23、血检查乙型肝炎,结果如下,问两种检验结果有无差别。果如下,问两种检验结果有无差别。表表8-3 8-3 末梢血与静脉血检查乙型肝炎抗原结果末梢血与静脉血检查乙型肝炎抗原结果静脉血静脉血末梢血末梢血合计合计+47(a)3(b)50 7(c)243(d)250合计合计 54 246300【案例解析案例解析】n 研究目的:差异性比较研究目的:差异性比较n 资料类型:定性资料资料类型:定性资料-二分类二分类n 设计类型:配对设计设计类型:配对设计满足满足因为因为b+c40H0:1 1=2H1:1 2=0.05配对四格表配对四格表 检验检验2cbcb22)(配对四格表配对四格表检验过程:检验过程:【电脑实
24、现电脑实现】SPSS1.数据录入和加权数据录入和加权2.运算过程运算过程3.SPSS结果输出:结果输出:RC列联表资料列联表资料概述概述:1.四格表只有四格表只有2行(行(row)、)、2列(列(column),是行),是行列表的最简单形式;列表的最简单形式;2.当行和(或)列大于当行和(或)列大于2 时,就叫行时,就叫行列表,有列表,有 R行行和和C列列组成的表格资料就称为组成的表格资料就称为RC列联表列联表。RC表的检验用于多个率或构成比的比较,其表的检验用于多个率或构成比的比较,其基本思想与四格表检验的思想一致。基本思想与四格表检验的思想一致。基本计算公式:基本计算公式:kiiiiTTA
25、122RijjiijmnAn122221专用计算公式:专用计算公式:式中式中n是总例数,是总例数,A是每个格子的实际频数,是每个格子的实际频数,ni、mj分别为某格子对应的行合计和列合计。分别为某格子对应的行合计和列合计。例例8-3 用磷霉素的三种制剂治疗皮肤软组织感染,用磷霉素的三种制剂治疗皮肤软组织感染,将将203例患者随机分为例患者随机分为3组,其疗效如下,问三种制剂组,其疗效如下,问三种制剂的疗效有无差别?的疗效有无差别?1.多组二分类资料比较(多组二分类资料比较(R2列联表列联表 检验)检验)2【案例解析案例解析】n 研究目的:差异性比较研究目的:差异性比较n 资料类型:定性资料资料
26、类型:定性资料二分类二分类n 设计类型:完全随机分三组(独立三组)设计类型:完全随机分三组(独立三组)满足满足没有格子最小理论频数没有格子最小理论频数5H0:1=2=3H1:1、2、3不等或不全相等不等或不全相等=0.05检验检验2kiiiiTTA122三组二分类三组二分类检验过程:检验过程:表表10 10 2 2界值表(部分)界值表(部分)1.数据录入数据录入2.对频数进行加权对频数进行加权3.运算过程运算过程4.SPSS结果输出:结果输出:结论:在结论:在=0.05水准上,拒绝水准上,拒绝H0,接受,接受H1,差别有统,差别有统计学意义,可以认为三种制剂的总体痊愈率有差异计学意义,可以认为
27、三种制剂的总体痊愈率有差异。如果检验结果拒绝检验假设,如果检验结果拒绝检验假设,只认为各组总体痊愈只认为各组总体痊愈率不全相同,但不能推论彼此间都有差别率不全相同,但不能推论彼此间都有差别。要进一步明确。要进一步明确哪两个组间不同,还需作多组间的两两比较。哪两个组间不同,还需作多组间的两两比较。检验水准检验水准的校正:的校正:若设定原检验水准若设定原检验水准=0.05,则,则167.0305.021RRaa校正例例8-6 研究了汉族、回族和满族居民的职业分布情况,研究了汉族、回族和满族居民的职业分布情况,按三个民族分别进行抽样,分别调查了按三个民族分别进行抽样,分别调查了145人、人、97人和
28、人和99人,试比较不同民族居民的职业分布是否不同?人,试比较不同民族居民的职业分布是否不同?1.无序多组多分类资料比较(无序多组多分类资料比较(RC列联表列联表 检验)检验)2【案例解析案例解析】n 研究目的:差异性比较研究目的:差异性比较n 资料类型:定性资料资料类型:定性资料-四分类四分类n 设计类型:完全随机分三组(独立三组)设计类型:完全随机分三组(独立三组)满足满足没有格子最小理论频数没有格子最小理论频数5H0:1=2=3 即即3民族各职业的概率分布相同;民族各职业的概率分布相同;H1:1、2、3不等或不全相等,不等或不全相等,即即3民族各职业的概率分布不同或不全相同民族各职业的概率
29、分布不同或不全相同=0.05检验检验2kiiiiTTA122三组四分类三组四分类检验过程:检验过程:1.数据录入数据录入2.对频数进行加权对频数进行加权3.运算过程运算过程4.SPSS结果输出:结果输出:结论:在结论:在=0.05水准上,不能拒绝水准上,不能拒绝H0,差别无统计学意,差别无统计学意义,尚不能认为三民族的职业构成不相同。义,尚不能认为三民族的职业构成不相同。注意事项注意事项:1.理论频数不宜太小,理论频数不宜太小,一般要求:一般要求:不应有不应有1/5以上格子以上格子的理论频数小于的理论频数小于5或或有一个格子的理论频数小于有一个格子的理论频数小于1 若出现某些格子中理论频数过小
30、时怎么办?若出现某些格子中理论频数过小时怎么办?(1)增大样本含量(最好!)增大样本含量(最好!)(2)删去该格所在的行或列(丢失信息!)删去该格所在的行或列(丢失信息!)(3)根据专业知识将该格所在行或列与别的行或列)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)合并。(丢失信息!甚至出假象)组别组别感染感染合计合计+_甲组甲组20828乙组乙组8412丙组丙组448合计合计321648组别组别感染感染合计合计+_甲组甲组20828乙组乙组8412合计合计321648组别组别感染感染合计合计+_甲组甲组20828乙乙+丙组丙组12812合计合计321648删去丙组:删
31、去丙组:合并乙丙组:合并乙丙组:2.无序多组多分类资料比较(无序多组多分类资料比较(RC列联表列联表 检验)检验)多组比较时,若效应有强弱的等级,如多组比较时,若效应有强弱的等级,如+,+,+,最好采用非参数检验方法,比如秩和检验,最好采用非参数检验方法,比如秩和检验。因为因为 检验只能反映其构成比有无差异,不能比检验只能反映其构成比有无差异,不能比较效应的平均水平。较效应的平均水平。2例例8-7 某研究者为了观察治疗某病的三种疗法的疗效,某研究者为了观察治疗某病的三种疗法的疗效,将患者随机分为三组,对三组患者分别采用三种方法,并将患者随机分为三组,对三组患者分别采用三种方法,并将疗效进行分组
32、统计,试对三组疗效的优劣进行比较。将疗效进行分组统计,试对三组疗效的优劣进行比较。表表8-13 某病三个治疗组疗效的比较某病三个治疗组疗效的比较【案例解析案例解析】n 研究目的:差异性比较研究目的:差异性比较n 资料类型:定性资料资料类型:定性资料-有序有序4分类分类n 设计类型:完全随机分设计类型:完全随机分3组(独立三组)组(独立三组)H0:3组疗效总体分布相同;组疗效总体分布相同;H1:3组疗效总体分布不等或不全相等,组疗效总体分布不等或不全相等,=0.05秩和检验秩和检验3组有序组有序4分类分类8.4.2 有序多分类资料比较有序多分类资料比较秩和检验秩和检验表表8-13 某病三个治疗组
33、疗效比较的秩和分析表某病三个治疗组疗效比较的秩和分析表(1+601+60)/2/2计算检验统计量计算检验统计量 H 值:值:)1(3)1(122NnRNNHii若相同秩次较多,应采用下式计算校正若相同秩次较多,应采用下式计算校正Hc值:值:)/(133NNttHcHHjjC)(相同秩次的个数相同秩次的个数各组秩和各组秩和各组观察例数各组观察例数确定确定 P 值,下结论:值,下结论:若若处理组数处理组数k=3,每组,每组ni5,则查,则查H界值表界值表得到得到P=0.05和和 P=0.01时的临界值,后比较,下结论。时的临界值,后比较,下结论。若若处理组数处理组数k4,每组,每组ni不小于不小于
34、5,则,则H值近似地服值近似地服从从2分布,可查分布,可查2界值表界值表,得到,得到2临界值,后比较,临界值,后比较,下结论。下结论。1.建立检验假设,确立检验水准:建立检验假设,确立检验水准:H0:三个治疗组的疗效的总体分布相同,即疗效同;三个治疗组的疗效的总体分布相同,即疗效同;H1:三个治疗组的疗效的总体分布不相同或不全相同。:三个治疗组的疗效的总体分布不相同或不全相同。=0.052.计算检验统计量计算检验统计量 编秩:本例为等级资料,先计算各等级的合计人数,编秩:本例为等级资料,先计算各等级的合计人数,由此确定秩次范围和各等级的平均秩次。由此确定秩次范围和各等级的平均秩次。求秩和:以各
35、组段的平均秩次分别乘以各等级例数,求秩和:以各组段的平均秩次分别乘以各等级例数,再求出各组秩和。再求出各组秩和。秩和检验过程:秩和检验过程:计算检验统计量计算检验统计量 Hc01.23)1400(3)96164241162056418843212()1400(40012)1(3)1(122222NnRNNHii由于相同秩次较多,因此要对上边公式进行校正由于相同秩次较多,因此要对上边公式进行校正 29.2540040016016010610674746060101.23)/(13333333NNttHHjjC)(相同秩次的个数:相同秩次的个数:6060,7474,106106,1601603确定
36、确定P 值,作出推断结论值,作出推断结论 =处理组数处理组数-1=3-1=2,查查2界值表,界值表,20.05,2=5.99,故,故P0.05,按,按=0.05水准拒绝水准拒绝H0,接受,接受H1,差异有统计学意义,差异有统计学意义,可以认为可以认为3种治疗方法的疗效不同或不全相同。种治疗方法的疗效不同或不全相同。要了解具体哪些组间不同,还需进行两两比较。要了解具体哪些组间不同,还需进行两两比较。1.数据录入和加权数据录入和加权3.SPSS结果输出:结果输出:小小 结结对于定性资料,通常将它整理成对于定性资料,通常将它整理成列联表列联表的形式。的形式。在选用在选用 检验时,一定要考虑其对检验时
37、,一定要考虑其对总例数总例数和和理论理论频数频数的要求。的要求。多个独立样本的多个独立样本的 检验,结论为拒绝检验假设时,检验,结论为拒绝检验假设时,只认为总体率或构成比之间总的来说有差别,若要只认为总体率或构成比之间总的来说有差别,若要了解差别的具体情况,要进一步做了解差别的具体情况,要进一步做多个样本频率的多个样本频率的两两比较两两比较。221.对于两组二分类对于两组二分类22四格表四格表:n 40且所有且所有T5 n 40但有但有1T5 n 40或有或有T1 四格表资料假设方法的选择四格表资料假设方法的选择1:TTA22)(TTA22)21()()()()(22dbcadcbanbcad
38、)()()()2/(22dbcadcbannbcad!)!()!()!()!(ndcbadbcadcbap2.对于配对四格表资料:对于配对四格表资料:1.b+c 40 2.b+c 40 cbcb22)()(cbcb221 四格表资料假设方法的选择四格表资料假设方法的选择2:3.RC列联表资料的列联表资料的2检验:检验:行行列表资料假设方法的选择列表资料假设方法的选择3:RijjiijmnAn122221kiiiiTTA122无序资料无序资料有序资料有序资料秩和检验秩和检验 案例案例8-1 某单位调查了某单位调查了4类人员乙型肝炎表面抗体类人员乙型肝炎表面抗体(HBsAb)的阳性率,想比较)的阳
39、性率,想比较3种病人与健康人群的种病人与健康人群的阳性率有无差别。阳性率有无差别。案 例 分 析 一案 例 分 析 一讨论:讨论:(1)若看成一个)若看成一个42列联表资料进行列联表资料进行1次检验,是次检验,是否能达到分析目的?否能达到分析目的?(2)若将每一种病人与健康人群)若将每一种病人与健康人群 HBsAb的检查结的检查结果分别组成四格表,进行果分别组成四格表,进行3次四格表检验,对否?次四格表检验,对否?(3)怎样达到分析目的?)怎样达到分析目的?案例案例8-2 在论文在论文果糖二磷酸钠治疗新生儿果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效观察缺氧缺血性脑病的疗效观察中,为了研究果中,
40、为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效,糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效,将患者随机分为观察组和对照组,观察组用果将患者随机分为观察组和对照组,观察组用果糖二磷酸钠,对照组用胞磷胆碱。治疗效果分糖二磷酸钠,对照组用胞磷胆碱。治疗效果分为无效、有效和显效三种结果。为无效、有效和显效三种结果。.案 例 分 析 二案 例 分 析 二 原作者采用行列表的专用检验公式,结果是:原作者采用行列表的专用检验公式,结果是:=4.74,P0.05,认为两组疗效之间的差异有统计学意义。,认为两组疗效之间的差异有统计学意义。请大家对本案例讨论如下问题:请大家对本案例讨论如下问题:(1)原作者的分
41、析目的是什么?选用检验的问题在哪里?)原作者的分析目的是什么?选用检验的问题在哪里?(2)什么情况下可以选用检验?)什么情况下可以选用检验?(3)本问题应选用的统计分析方法是什么?为什么要选择这)本问题应选用的统计分析方法是什么?为什么要选择这样的方法?样的方法?2 案例案例8-3 某研究者欲比较食管癌某研究者欲比较食管癌TNM分期的某分期的某种基因蛋白阳性表达率有无差异,收集了食管癌种基因蛋白阳性表达率有无差异,收集了食管癌a期患者期患者7例、例、b期患者期患者10例、例、期患者期患者23例,例,检测了某种基因蛋白的阳性表达例数(检测了某种基因蛋白的阳性表达例数(X)分别为)分别为3、8和和
42、21例。研究者考虑食管癌的例。研究者考虑食管癌的TNM分期是有分期是有序变量,因此运用秩和检验处理资料,结果序变量,因此运用秩和检验处理资料,结果HC=6.1191,P=0.0134,差异有统计学意义。差异有统计学意义。案 例 分 析 三案 例 分 析 三 讨论:讨论:(1)原作者的分析目的是什么?在此目的下应选)原作者的分析目的是什么?在此目的下应选择的统计分析方法是什么?择的统计分析方法是什么?(2)在什么情况下可以选用秩和检验?)在什么情况下可以选用秩和检验?最佳选择题:最佳选择题:1.2值的取值范围为:值的取值范围为:A B0 C 1 D 022222.2.由两样本率的差别推断两总体率
43、的差别,若由两样本率的差别推断两总体率的差别,若 P P 0.050.05,则,则:A.A.两样本率相差很大两样本率相差很大 B.B.两总体率相差很大两总体率相差很大 C.C.两样本率和两总体率差别有统计意义两样本率和两总体率差别有统计意义 D.D.两总体率相差有统计意义两总体率相差有统计意义 3.四格表资料中的实际数与理论数分别用四格表资料中的实际数与理论数分别用A与与T表表示,其基本公式与专用公式求的条件为示,其基本公式与专用公式求的条件为:A.A5 B.T5 C.A5 且且 T5 D.A5 且且n40 E.T5 且且n40 4.分析四格表时,通常在什么情况下需用分析四格表时,通常在什么情
44、况下需用Fisher精确概率法(精确概率法()A1T40 BTP0.10,按水准不拒绝H0,尚不能认为三种措施有效率有差别。(3)简答题:简答题:1.什么是实际频数?什么是理论频数?什么是实际频数?什么是理论频数?2.四格表四格表2检验的应用条件是什么,不满足应用条检验的应用条件是什么,不满足应用条件时的解决办法?件时的解决办法?3.比较两独立样本分布的比较两独立样本分布的2检验、配对样本分布的检验、配对样本分布的2检验在设计方法、资料整理、假设检验等方面检验在设计方法、资料整理、假设检验等方面的差别是什么?的差别是什么?4.RC表表2 2检验应用的注意事项是什么?检验应用的注意事项是什么?THANK YOU!