计数资料的统计推断-ppt课件.ppt

上传人(卖家):三亚风情 文档编号:2754165 上传时间:2022-05-23 格式:PPT 页数:32 大小:485KB
下载 相关 举报
计数资料的统计推断-ppt课件.ppt_第1页
第1页 / 共32页
计数资料的统计推断-ppt课件.ppt_第2页
第2页 / 共32页
计数资料的统计推断-ppt课件.ppt_第3页
第3页 / 共32页
计数资料的统计推断-ppt课件.ppt_第4页
第4页 / 共32页
计数资料的统计推断-ppt课件.ppt_第5页
第5页 / 共32页
点击查看更多>>
资源描述

1、1 率的抽样误差与可信区间率的抽样误差与可信区间卡方检验卡方检验 一、卡方检验的基本思想一、卡方检验的基本思想 二、四格表专用公式二、四格表专用公式 三、连续性校正公式三、连续性校正公式 四、配对四格表资料的四、配对四格表资料的 2 2检验检验 五、行五、行列(列(R RC C)表资料的)表资料的 2 2检验检验计数资料的统计学推断计数资料的统计学推断率的抽样误差与可信区间率的抽样误差与可信区间 一、率的抽样误差与标准误一、率的抽样误差与标准误 二、总体率的可信区间二、总体率的可信区间一、一、 率的抽样误差与标准误率的抽样误差与标准误 样本率样本率 (p) 和总体率和总体率 () 的差异称为率

2、的的差异称为率的抽抽样误差样误差(sampling error of rate) ,用,用率的标准率的标准误误(standard error of rate)度量。)度量。np)1( 如果总体率如果总体率未知,用未知,用样本率样本率p估计估计nppsp)1( 标准误的计算标准误的计算二、二、 总体率的可信区间总体率的可信区间 总体率的可信区间总体率的可信区间 (confidence interval of rate):根据样本率推算总体率可能所在的范围根据样本率推算总体率可能所在的范围 当当n n足够大,且足够大,且n pn p 和和n n(1- p1- p)均大于均大于5 5时,时,p p的

3、抽样分布逼近正态分布。其可信区间为:的抽样分布逼近正态分布。其可信区间为:双侧:双侧: (p - u(p - u/2/2 Sp, p + u Sp, p + u/2/2 Sp) Sp) (u u0.05/20.05/2=1.96=1.96)单侧:单侧: p- up- u Sp Sp 或或 p + up + u Sp Sp (u u0.050.05=1.645=1.645)s试估计试估计p=0.80p=0.80,Sp =0.04Sp =0.04的总体率双侧的总体率双侧95%95%可信可信区间区间。s解:解: u0.05/2=1.96, (p - u/2 Sp, p + u/2 Sp) s(0.8

4、0-1.960.04,0.80+1.960.04)=(0.7216,0.8784)s即总体率的即总体率的95%可信区间为(可信区间为(72.16%87.84%)。)。s注意:注意:s如果计算获得的可信区间下限小于如果计算获得的可信区间下限小于0%,上限大于,上限大于100%,s则将下限直接定为则将下限直接定为0%,上限直接定为,上限直接定为100%。(二)查表法s当样本含量较小时,比如n50, p1%时,可查附表时,可查附表6百百分率的可信限,得到总体率的可信区间。分率的可信限,得到总体率的可信区间。1、可从附表直接查到、可从附表直接查到 例:例: 某医院用复方当归注射液静脉滴注治疗脑动脉硬化

5、症某医院用复方当归注射液静脉滴注治疗脑动脉硬化症22例,其中显效者例,其中显效者10例。问该药显效的例。问该药显效的95%与与99%可可信区间各为多少?信区间各为多少?2 2、不能直接从附表查到、不能直接从附表查到 例:例: 某疗法治疗某病某疗法治疗某病1010人,治愈人,治愈8 8人,请据此估人,请据此估计该疗法治愈率的计该疗法治愈率的95%95%可信区间。可信区间。 (附表中的(附表中的X X值只列出值只列出Xn/2Xn/2部分,当部分,当Xn/2Xn/2时,应以时,应以n-Xn-X值查表,再用值查表,再用1 1减去由此查得的减去由此查得的可信区间。)可信区间。) 即:即:X=10-8=2

6、X=10-8=2,以,以n=10n=10和和X=2X=2查表得未愈查表得未愈率的率的95%95%可信区间为(可信区间为(3%3%,56%56%),治愈率的),治愈率的95%95%可信区间为(可信区间为( 1-56%1-56%,1-3%1-3%)= =(44%44%,97%97%)。)。小小 结结 1样本率也有抽样误差,率的抽样误差的大小样本率也有抽样误差,率的抽样误差的大小用用p或或Sp来衡量。来衡量。 2率的分布服从二项分布。当率的分布服从二项分布。当n足够大,足够大,和和1-均不太小,有均不太小,有n5和和n(1-)5时,近似正态分布时,近似正态分布。 3总体率的可信区间是用样本率估计总体

7、率的总体率的可信区间是用样本率估计总体率的可能范围。当可能范围。当p分布近似正态分布时,可用正态近分布近似正态分布时,可用正态近似法估计率的可信区间。似法估计率的可信区间。 卡方检验卡方检验 2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。 v 目的:目的: 推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 推断多个总体率或构成比之间有无差别推断多个总体率或构成比之间有无差别v 检验统计量检验统

8、计量:2 2v 应用:应用:计数资料计数资料一、卡方检验的基本思想一、卡方检验的基本思想(1)疗法疗法死亡死亡生存生存 合计合计病死率病死率(%)盐酸苯乙双胍盐酸苯乙双胍26 (a)178 (b) 204(a+b) 12.75 (p1)安慰剂安慰剂 2 (c) 62 (d) 64(c+d) 3.13 (p2)合合 计计 28 (a+c.)240(b+d.) 268(a+b+c+d=n) 10.45 (pc)表表 两种疗法的心血管病病死率的比较两种疗法的心血管病病死率的比较(a +b )pc= (a + b) ( a + c.)/ n= n R n C /n =21.3(a+b)(1-pc)=

9、(a + b) ( b + d.)/ n = n R n C /n =182.7(c + d) pc= ( c + d) ( a +c )/ n =n R n C/n =6.7(c+d)(1-pc)= ( c + d )(b + d.)/ n =n R n C/n =57.3nnncolumnrowTCR总例数合计列合计行)()( 四格表资料的基本形式四格表资料的基本形式 一、卡方检验的基本思想一、卡方检验的基本思想(2) 各种情形下,理论与实际偏离的总和即为卡方值(chi-square value),它服从自由度为的卡方分布。) 1)(1(,1)()(222CRTTATTA1) 12)(12

10、(82. 4)3 .5717 . 617 .18213 .211(7 . 423 .57)3 .5762(27 . 6)7 . 62(27 .182)7 .182178(23 .21)3 .2126(22v2/) 12/(2222)2/(21)(ef3.847.8112.59P P0.050.05的临界值的临界值2分布分布(chi-square distribution)2检验的基本公式检验的基本公式) 1)(1(1)()(222CRTTATTA 上述上述基本公式基本公式由由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起

11、来的。它不仅适用于四格表资料,也适用于其它的“行列表”。二、四格表专用公式(二、四格表专用公式(1) 为了不计算理论频数为了不计算理论频数T, 可由可由基本公式基本公式推导出,推导出,直接由直接由各格子的实际频数(各格子的实际频数(a、b、c、d)计算卡方值的公式:)计算卡方值的公式:(四格表专用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcbadbbabdcbacabadcbacabaaTTA二、四格表专用公式(二、四格表专用公式(2)021 ,05. 0221021 ,05. 02

12、21 ,05. 0205. 0;84. 3,05. 0;84. 305. 0;84. 31 , 82. 46424028204268)21786226(22HPHPP,即不拒绝则如果即拒绝如果下结论:2(1) u2 2.194924.82(n40,所有T5时)三、连续性校正公式(三、连续性校正公式(1) 2分布是一连续型分布,而行分布是一连续型分布,而行列表资料属离散型分布列表资料属离散型分布,对其进行校正称为连续性校正,对其进行校正称为连续性校正(correction for (correction for continuity),continuity),又称又称YatesYates校正(校

13、正(Yates correctionYates correction)。)。当当n40,而,而1T5时,用时,用连续性校正连续性校正公式公式当当n40或或T1时,用时,用Fisher精确精确检验检验(Fisher exact test )校正公式校正公式:列表资料),(也适合其它行TTAc22)5 . 0()()()()2/(22dbcadcbannbcadc三、连续性校正公式(三、连续性校正公式(2)1 , 62. 3357142842)24262592(22c1 , 49. 5357142842)26592(22因为因为1 1T T5 5,且,且n n4040时,所以应用连续性校正时,所以

14、应用连续性校正2检验检验四、四格表的确切概率检验法四、四格表的确切概率检验法在四格表在四格表2检验中,若检验中,若n40,或有理论频数或有理论频数T1,采用采用Fisher确切概率法确切概率法五、配对四格表资料的五、配对四格表资料的2检验检验配对四格表资料的配对四格表资料的2检验也称检验也称McNemar检验(检验(McNemars test) 1,) 1(2402cbcbcbc时,需作连续性校正, 1,27. 4312) 1312(22,4015采用连续性校正本例cb 1,)(2240ccbcbb时,当05. 0;84. 321 ,05. 02PH0:b,c来自同一个实验总体(两种剂量的毒性

15、无差异);来自同一个实验总体(两种剂量的毒性无差异);H1:b,c来自不同的实验总体(两种剂量的毒性有差别);来自不同的实验总体(两种剂量的毒性有差别);=0.05。配对四格表资料的配对四格表资料的2检验公式推导检验公式推导六、行列(RC)表资料的2检验RC表的2检验通用公式nnnTCR总例数列合计行合计理论频数代入基本公式 可推导出: 基本公式 通用公式 ) 1()(2222CRnnAnTTA 自由度=(行数1) (列数1) 几种RC表的检验假设H0RC表的计算举例地区ABABO合计亚洲321369952951080欧洲2584322194517北美洲40810637444995合计9875

16、181549332592 某研究人员收集了亚洲、欧洲和北美洲的某研究人员收集了亚洲、欧洲和北美洲的A A、B B、ABAB、O O血型血型资料,结果见表资料,结果见表1 1,其目的是研究不同地区的人群血型分类构,其目的是研究不同地区的人群血型分类构成比是否一样。成比是否一样。 表表 1 1 三个不同地区血型样本的频数分布三个不同地区血型样本的频数分布6) 14() 13(56.297) 199399544451810803699871080321(25922222 RC表2检验的应用注意事项 1. 对RC表,若较多格子(1/5)的理论频数小于5或有一个格子的理论频数小于1,则易犯第一类错误。出现某些格子中理论频数过小时怎么办? (1)增大样本含量(最好!) (2)删去该格所在的行或列(丢失信息!) (3)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象) RC表2检验的应用注意事项 2.2.多组比较时,若效应有强弱的等级,如多组比较时,若效应有强弱的等级,如+ +,+,+,最好,最好采用后面的非参数检验方法。采用后面的非参数检验方法。2 2检验只能反映其构成比有无差检验只能反映其构成比有无差异,不能比较效应的平均水平。异,不能比较效应的平均水平。 3.3.行列两种属性皆有序时,可考虑趋势检验或等级相关分析。行列两种属性皆有序时,可考虑趋势检验或等级相关分析。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(计数资料的统计推断-ppt课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|