九章--卡方检验12034-课件.ppt

上传人(卖家):晟晟文业 文档编号:4257992 上传时间:2022-11-23 格式:PPT 页数:55 大小:1.02MB
下载 相关 举报
九章--卡方检验12034-课件.ppt_第1页
第1页 / 共55页
九章--卡方检验12034-课件.ppt_第2页
第2页 / 共55页
九章--卡方检验12034-课件.ppt_第3页
第3页 / 共55页
九章--卡方检验12034-课件.ppt_第4页
第4页 / 共55页
九章--卡方检验12034-课件.ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

1、第九章 卡方检验12034 ppt课件 目的目的:推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 多个样本率比较的分割多个样本率比较的分割 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验。频数分布拟合优度的检验。检验统计量检验统计量:应用应用:计数资料:计数资料2 分布曲线 设 为标准正态总体 的一个随机样本,它们的平方和服从自由度为 的 分布,记作 212,nXXX2(0,1)Nn2222212nXXXX2附表8给出了自由度取不同值时,分布单侧尾部面积的界值,它满足条件根据的定义

2、,当自由度时,分布的界值为标准正态分布界值的平方。22,22,()P 0112第一节第一节 2 2表表 检验检验2目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别 (和(和u u检验等价)检验等价)要求:要求:两样本的两分类个体数排列成四两样本的两分类个体数排列成四 格表资料格表资料一一、两独立样本率检验两独立样本率检验(一)(一)两独立样本率资料的四格表形式 例例9-1 为研究肿瘤标志物癌胚抗原(为研究肿瘤标志物癌胚抗原(CEA)对)对肺癌的诊断价值,随机抽取肺癌的诊断价值,随机抽取72例确诊为肺癌的患例确诊为肺癌的患者为肺癌组,者为肺癌组,114例接受健康

3、体检的非肺癌患者为例接受健康体检的非肺癌患者为对照组。用对照组。用CEA对其进行检测,结果呈阳性反应对其进行检测,结果呈阳性反应者病例组中者病例组中33例,对照组中例,对照组中10例。问两组人群的例。问两组人群的CEA阳性率有无差异?阳性率有无差异?表表9-1 CEA对两组人群的诊断结果对两组人群的诊断结果*分组阳性阴性合计阳性率(%)肺癌组33(16.6)39(55.4)7245.8对照组10(26.4)104(87.6)1148.8合计4314318623.1*括号内为理论频数。本例资料经整理成表本例资料经整理成表9-1形式,即有两形式,即有两个处理组,每个处理组的例数由发生数和个处理组,

4、每个处理组的例数由发生数和未发生数两部分组成。表内有未发生数两部分组成。表内有33、39、10、104 四个基本数据,其余数据均由此四个四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。数据推算出来的,故称四格表资料。(二)(二)检验的基本思想检验的基本思想2处处理理组组 发发生生数数 未未发发生生数数 合合计计 甲甲 a b a+b 乙乙 c d c+d 合合 计计 a+c b+d n 表表9-2 四格表资料的基本形式四格表资料的基本形式基本思想:可通过基本思想:可通过 检验的基本公式检验的基本公式来理解。来理解。22(),()(1)A TT行数-1 列数式中,式中,A为实际频

5、数(为实际频数(actual frequency),),T为理论频数(为理论频数(theoretical frequency)。)。2 理论频数理论频数 是根据检验设是根据检验设 ,且,且用合并率用合并率 来估计而定的。来估计而定的。T012:H(92)acacabcdn11()()(93)aab acTTn21()()(94)ccd acTTn(95)bdbdabcdn12()()(96)bab bdTTn22()()(97)dcd bdTTn理论频数由下式求得:理论频数由下式求得:R CRCn nTn式中,式中,TRC 为第为第R 行行C 列的理论频数列的理论频数 nR 为相应的行合计为相

6、应的行合计 nC 为相应的列合计为相应的列合计 检验统计量检验统计量 值反映了实际频数与理值反映了实际频数与理论频数的吻合程度。论频数的吻合程度。若检验假设若检验假设H0:1=2成立,四个格子的实际频成立,四个格子的实际频数数A 与理论频数与理论频数T 相差不应该很大,即统计量相差不应该很大,即统计量 不应该很大。如果不应该很大。如果 值很大,即相对应的值很大,即相对应的P 值很值很小,若小,若 ,则反过来推断,则反过来推断A与与T相差太大,超出相差太大,超出了抽样误差允许的范围,从而怀疑了抽样误差允许的范围,从而怀疑H0的正确性,的正确性,继而拒绝继而拒绝H0,接受其对立假设,接受其对立假设

7、H1,即,即12。P22 由公式(由公式(9-1)还可以看出:)还可以看出:值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆是正值,故自由度皆是正值,故自由度愈大,愈大,值也会愈大;所以只有考虑值也会愈大;所以只有考虑了自由度了自由度的影响,的影响,值才能正确地反映实际频数值才能正确地反映实际频数A和理论频和理论频数数T 的吻合程度。的吻合程度。检验的自由度取决于可以自由取值的格检验的自由度取决于可以自由取值的格子数目,而不是样本含量子数目,而不是样本含量n n。四格表资料只。四格表资料只有两行两列,有两行两列,=1

8、=1,即在周边合计数固定的情,即在周边合计数固定的情况下,况下,4 4个基本数据当中只有一个可以自由个基本数据当中只有一个可以自由取值。取值。22()A TT2()A TT222(1)建立检验假设,确定检验水平。建立检验假设,确定检验水平。H0:1=2H1:12=0.05。(三)(三)假设检验假设检验(2)求检验统计量值)求检验统计量值1172 43/186 16.6T,1272 16.6 55.4T 2143 16.626.4T,22114 26.4 87.6T。22222(9990.48)(513.52)(7583.52)(2112.48)90.4813.5283.5212.4812.86

9、1)12)(12(22222(33 16.6)(3955.4)(1026.4)(10487.6)16.655.426.487.611112()34.3216.416.655.426.487.6以以=1 1查查附附表表8 8的的2界界值值表表得得005.0P。按按05.0 检检验验水水准准拒拒绝绝0H,接接受受1H,肺肺癌癌患患者者癌癌胚胚抗抗原原的的 阳阳性性率率显显著著高高于于健健康康人人,提提示示可可能能具具有有临临床床诊诊断断价价 值值。四格表资料检验的专用公式四格表资料检验的专用公式22()()()()()ad bc na b a c b d c d2186(33 104 10 39)

10、234.1072 43 143 114(四四)四格表资料检验的校正公式四格表资料检验的校正公式 22(0.5)cA TT22()2()()()()cn|ad-bc|-n=a+b c+d a+c b+d 分布是一连续型分布,而四格分布是一连续型分布,而四格表资料属离散型分布,由此计算得表资料属离散型分布,由此计算得的的 统计量的抽样分布亦呈离散性统计量的抽样分布亦呈离散性质。为改善质。为改善 统计量分布的连续性,统计量分布的连续性,则进行连续性校正。则进行连续性校正。222四格表资料 检验公式选择条件:40,5nT2 ,不校正的理论或专用公式;,校正公式;,直接计算概率。40,15nT401nT

11、或 连续性校正仅用于连续性校正仅用于 的四格表资料,当的四格表资料,当 时,一般不作校正。时,一般不作校正。212例例9-2 将将116例癫痫患者随机分例癫痫患者随机分为两组,一组为两组,一组70例接受常规加高压氧例接受常规加高压氧治疗(高压氧组),另一组治疗(高压氧组),另一组46例接受例接受常规治疗(常规组),治疗结果见表常规治疗(常规组),治疗结果见表7-4。问两种疗法的有效率有无差别?问两种疗法的有效率有无差别?表9-3两种疗法治疗癫痫的效果治疗结果治疗方法有效无效合计有效率(%)高压氧组 66(62.8)4(7.2)7094.3常规组38(41.2)8(4.8)4682.6合 计 1

12、04 1211689.7012112:,:,0.05HH本例,故用四格表资料检验的校正公式22116,4.8nT但2,查界值表得。按 检验水准不拒绝,尚不能认为组有效率不等。1210.005.0 P05.00H2(66 84 38116 2)11622.9270 46 104 12c 本资料若不校正时,本资料若不校正时,结论与之相反。结论与之相反。24.080.05P,二、二、两相关样本率检验两相关样本率检验(McNemar检验)检验)配对四格表资料的配对四格表资料的 检验检验2与计量资料推断两总体均数是否与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,有差别有成组设计和配对设计一

13、样,计数资料推断两个总体率(构成比)计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,是否有差别也有成组设计和配对设计,即即四格表资料四格表资料和和配对四格表资料配对四格表资料。例例9-3某抗癌新药的毒理研究中,将某抗癌新药的毒理研究中,将78只大鼠按性别、窝别、体重、年龄等因只大鼠按性别、窝别、体重、年龄等因素配成素配成39对,每个对子的两只大鼠经随机对,每个对子的两只大鼠经随机分配,分别接受甲剂量和乙剂量注射,试分配,分别接受甲剂量和乙剂量注射,试验结果见表验结果见表9-4。试分析该新药两种不同剂。试分析该新药两种不同剂量的毒性有无差异。量的毒性有无差异。表表9-4 某抗癌

14、新药两种剂量的毒理实验结果某抗癌新药两种剂量的毒理实验结果 乙 剂 量 甲 剂 量 死 亡()生 存()合 计 死 亡()6(a)12(b)18生 存()3(c)18(d)21合 计 93039 上述配对设计实验中,就每个对子而上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有言,两种处理的结果不外乎有四种可能四种可能:两只大鼠均死亡(甲两只大鼠均死亡(甲乙乙)数数(a);两只均生存(甲两只均生存(甲乙乙)数数(d);其中一只死亡(甲其中一只死亡(甲乙乙)数数(b);其中一只死亡(甲其中一只死亡(甲乙乙)数数(c)。其中,其中,a,d 为两法观察结果一致的两种情况,为两法观察结果一致的

15、两种情况,b,c为两法观察结果不一致的两种情况为两法观察结果不一致的两种情况。cbcb22)(,1 cbcbc22)1(,1=检验统计量为检验统计量为H0:总体四格表中甲乙 的对子数与甲乙的对子数出现频率相同(两剂量毒性相同);H1:总体四格表中甲乙 的对子数与甲乙的对子数出现频率不同(两剂量毒性不同);=0.05已知样本四格表中,b=12,c=3,因 b+c=15,故将其代入公式 9-13,有查附表 8,20.025,15.02,20.05,13.84,得 0.025P0.05,按=0.05 水准拒绝 H0,接受 H1,可以认为两种剂量的毒性有差异,甲剂量组的死亡率较高(因 bc)。27.4

16、312)1321(22c注意:注意:本法一般用于样本含量不太大的资料。因本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况为它仅考虑了两法结果不一致的两种情况(b,c),而未考虑样本含量而未考虑样本含量n和两法结果一致的两种情和两法结果一致的两种情况况(a,d)。所以,当。所以,当n很大且很大且a与与d的数值很大的数值很大(即两法的一致率较高),(即两法的一致率较高),b与与c的数值相对较的数值相对较小时,即便是检验结果有统计学意义,其实际小时,即便是检验结果有统计学意义,其实际意义往往也不大。意义往往也不大。第二节第二节RC表 检验 2行行列表资料列表资料多个样本率比较

17、时,有R行2列,称为R2表;两个样本的构成比比较时,有2行C列,称2C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为RC表。检验统计量检验统计量22(1)(1)(1)RCAnn n行数列数一、多个样本率的比较一、多个样本率的比较例9-4用A、B、C三种不同方法分别处理新生儿脐带,发生感染的情况见表9-6,试比较3种不同方法的脐带感染率有无差异。表9-6三种脐带处理方法的脐带感染情况脐带感染处理组感染未感染合计感染率(%)A76314332192.36B15240924240.62C 2 762 7640.26合计93631464071.45二、两组构成比的比较例9-5

18、为研究某种新药对尿路疼痛的止痛效果,将有尿路疼痛的患者144例随机分为两组,每组72例,一组服该新药(治疗组),另一组服安慰剂(对照组)。两组患者尿路疼痛的原因见表9-7,问两组患者尿路疼痛原因的分布有无差异?表9-7两组患者尿路疼痛原因的分布尿路疼痛原因分 组尿路感染器械损伤其它合计治疗组3429972对照组2935872合 计6364171442.求检验统计量和自由度。将表 9-7 数据代入公式 9-14,有22222234299293582144(1)1.027263726472 177263726472 17(21)(31)2 3.确定 P 值,下结论。查2界值表,20.5,21.39

19、,20.5,21.018,所以,P0.50,以0.05水准不拒绝 H0,即尚不能认为两组患者尿路疼痛原因的分布有差异。三、多组构成比的比较例例9-6 在某项疼痛测量研究中,给160例手术后疼痛的患者提供四种疼痛测量量表,即直观模拟量表(VAS),数字评估量表(NRS),词语描述量表(VDS),面部表情疼痛量表(FPS),患者首选的量表以及患者的文化程度见表9-8,问患者首选疼痛量表与文化程度是否有关?表9-8 不同文化程度患者首选疼痛量表的类型 首选测痛量表文化程度V ASVDSNRSFPS合计高中以下3(3.5)16(18.7)18(19.7)44(39.0)81高中0(1.6)10(8.6)9(9.0)18(17.8)37高中以上4(1.8)11(9.7)12(10.2)15(20.2)42合计7373977160四、RC表检验的条件21行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。注意注意:不同年龄组可以合并,但不同血型就不能合并。改用双向无序RC表的Fisher确切概率法(可用SAS软件实现)。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(九章--卡方检验12034-课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|