医学统计学医统卡方检验课件.pptx

上传人(卖家):晟晟文业 文档编号:3691443 上传时间:2022-10-04 格式:PPTX 页数:56 大小:920.28KB
下载 相关 举报
医学统计学医统卡方检验课件.pptx_第1页
第1页 / 共56页
医学统计学医统卡方检验课件.pptx_第2页
第2页 / 共56页
医学统计学医统卡方检验课件.pptx_第3页
第3页 / 共56页
医学统计学医统卡方检验课件.pptx_第4页
第4页 / 共56页
医学统计学医统卡方检验课件.pptx_第5页
第5页 / 共56页
点击查看更多>>
资源描述

1、一、率率(rate):率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比,说明某现象出现的强度或频度,通常以百分率(%)、千分率()、万分率(/万)、或十万分率(10万)等来表示。你们班级的及格率,挂科率怎么算?计算公式如下:比例基数有可能数某事物或现象发生的所际数某事物或现象发生的实率构成比(proportion):表示某事物内部各组成部分在整体中所占的比重,常以百分数表示。调查下:你们当中多少人用国产手机?非国产手机?计算公式为%100单位之和(例数之和)某事物内部的所有观察)分的观察单位数(例数该事物内部某一组成部构成比二、构成比 检验检验(chi-square test):

2、(chi-square test):英国统计英国统计学家学家PearsonPearson提出的一种主要用于分析分提出的一种主要用于分析分类变量数据的假设检验方法类变量数据的假设检验方法.目的:目的:推断推断两个总体率或构成比之间有无差别两个总体率或构成比之间有无差别推断推断多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别检验统计量:检验统计量:2应用应用:计数资料计数资料2 Karl Pearson 第一节第一节 四格表资料的四格表资料的2 检验检验目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别要求:要求:两样本的两分类个体数排列成两样本的两分类

3、个体数排列成 四格表资料四格表资料要考查西安医学院临床专业要考查西安医学院临床专业01班和班和02班班的系统解剖的及格率,从的系统解剖的及格率,从01班抽取班抽取20人人(其中(其中15人及格,人及格,5人挂科),从人挂科),从02班抽班抽取取30人(其中人(其中20人及格,人及格,10人挂科)。人挂科)。问这两个班级的及格率有无不同?哪个问这两个班级的及格率有无不同?哪个班级学习成绩更好?班级学习成绩更好?四格表资料的基本形式 例9-1 吲达帕胺片治疗原发性高血压疗效,将70名高血压患者随机分为两组,试验组用吲达帕胺片加辅助治疗,对照组用安慰剂加辅助治疗。试分析有效性。通用公式:A 为实际频

4、数,T 为理论频数,为自由度。=(行数-1)(列数-1)TTA22)(一、检验的通用公式2理论频数计算公式 ijijnnTnTij 为第 i 行第 j 列的理论频数,n ni i 和n nj j 分别为相应行与列的周边合计数,n 为总例数。v 检验统计量检验统计量2 2 值反映了实际频值反映了实际频数与理论频数的吻合程度。数与理论频数的吻合程度。若检验假设若检验假设H H0 0:1 1=2 2成立,四个格子的实成立,四个格子的实际频数际频数A A 与理论频数与理论频数T T 相差不应该很大,即相差不应该很大,即统计量统计量2 2不应该很大。如果不应该很大。如果2 2值很大,即相值很大,即相对应

5、的对应的P P 值很小,若值很小,若 PP,则反过来推断,则反过来推断A A与与T T 相差太大,超出了抽样误差允许的范围,相差太大,超出了抽样误差允许的范围,从而怀疑从而怀疑H H0 0的正确性,继而拒绝的正确性,继而拒绝H H0 0,接受其对,接受其对立假设立假设H H1 1,即,即1 12 2。v自由度自由度愈大,愈大,2 值也会愈大;所以值也会愈大;所以只有考虑了自由度只有考虑了自由度的影响,的影响,2 值才值才能正确地反映实际频数能正确地反映实际频数A和理论频数和理论频数T 的吻合程度。的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=

6、1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。检验步骤:1.建立检验假设并确定检验水准H0:1=2 即试验组与对照组的总体有效率相等H1:12 即试验组与对照组的总体有效率不等=0.052.计算检验统计量 3.3.确定P P 值,作出推断结论当自由度当自由度确定后,确定后,2分布曲线下右侧尾部的面积分布曲线下右侧尾部的面积为为时,横轴上相应的时,横轴上相应的2值记作值记作2,查2界值表,得20.05,1=3.84,按=0.05水 准,拒绝H0,接受H1,P0.05,可以认为两组治疗原发性高血压的总体有效率不同,即可认为吲达帕胺片治疗原发性高血压是有效的。专用公式:)()

7、()()(22dbcadcbanbcad22(2052421)708.4044264129二、四格表资料2检验的专用公式结论同前。校正公式:TTAc22)5.0(22(/2)()()()()c|ad-bc|-nn=a+b c+d a+c b+dFrank Yates 三、四格表资料2检验的校正公式2分布是一连续型分布,而四格表资料属离散型分分布是一连续型分布,而四格表资料属离散型分布,由此计算得的布,由此计算得的 2统计量的抽样分布亦呈离散性质。统计量的抽样分布亦呈离散性质。为改善为改善2 统计量分布的连续性,则需行连续性校正统计量分布的连续性,则需行连续性校正。2连续性校正仅用于=1 的四格

8、表资料,当2 时,一般不作校正。四格表资料四格表资料2 检验公式的选择检验公式的选择:40,5nT,基本公式/专用公式;,校正公式;,直接计算概率。40,15nT40 1nT或例例9-2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将血管疾病的疗效,将58例脑血管疾病患者随机分为例脑血管疾病患者随机分为两组,结果见表。问两种药物治疗脑血管疾病的有两组,结果见表。问两种药物治疗脑血管疾病的有效率是否相等?效率是否相等?0H:211H:2105.0即两种药物治疗脑血管疾病的有效率相等 即两种药物治疗脑血管疾病的有效率不相等2.计算检验统计量226 2

9、5 3 24 58 258037649 9 28 30c/.1)12)(12(3.确定P 值,作出推断结论 不拒绝H0,尚不能认为两种药物治疗脑血管疾 病的有效率不相等1.建立假设,设定检验水准四、四格表资料的Fisher确切概率法(自学)当四格表资料中出现n40 或T 40,用非校正公式计算得 3.确定P值,作出推断结论 P 0.05,不拒绝H0,尚不能认为两种培养基的阳性培养率不同136.0202420-2422,)(第三节第三节 行行列表资料的列表资料的2检验检验 行行列表资料列表资料 多个样本率比较时,多个样本率比较时,有有 R 行行 2 列,称为列,称为 R 2表;表;两个样本的构成

10、比比较时,两个样本的构成比比较时,有有 2 行行 C 列,称列,称 2C 表;表;多个样本的构成比比较,多个样本的构成比比较,有有 R 行行 C 列,称为列,称为 R C 表。表。检验统计量检验统计量22(1)(1)(1)RCAnnn行 数列 数TTA22)(例例9 9-5 5 某医院用某医院用3 3种方案治疗急性肝炎种方案治疗急性肝炎254254例,观察例,观察结果如下,问结果如下,问3 3种方案治疗急性肝炎的有效率是否不种方案治疗急性肝炎的有效率是否不同。同。组别组别有效有效无效无效合计合计有效率(有效率(%)西药组西药组5151494910010051.0051.00中药组中药组3535

11、4545 80 8043.7543.75中西药结合组中西药结合组59591515 74 7479.7379.73合计合计 145 145 109 10925425457.0957.09表表9-6 39-6 3种方案治疗急性肝炎的效果种方案治疗急性肝炎的效果 H0?H1?例例9-6 某研究人员收集了亚洲、欧洲和北美洲人某研究人员收集了亚洲、欧洲和北美洲人的的A、B、AB、O血型资料,结果见表血型资料,结果见表9-79-7,问不,问不同地区人群同地区人群ABO血型分类构成比是否不同。血型分类构成比是否不同。地区地区A AB BAB AB O O合计合计亚洲亚洲3213213693699595295

12、29510801080欧洲欧洲25825843432222194194517517北美洲北美洲4084081061063737444444995995合计合计98798751851815415493393325922592表表9-7 9-7 三个不同地区血型样本的频分布三个不同地区血型样本的频分布H0?H1?1.理论理论频数:行列表中的各格频数:行列表中的各格T1,并且,并且1T5的格子数不宜超过的格子数不宜超过1/5格子总数,否则可能格子总数,否则可能产生偏性。处理方法有三种产生偏性。处理方法有三种:1)增大增大样本含量以达到增大理论频数样本含量以达到增大理论频数的目的,属首选方法,只是有些

13、研究的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂无法增大样本含量,如同一批号试剂已用完等。已用完等。行行列表资料列表资料 2 检验检验的的注意事项注意事项2)根据根据专业知识,删去理论频数太小的行或专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。例如:不同年龄组可以的邻行或邻列合并。例如:不同年龄组可以合并,但不同血型就不能合并。合并,但不同血型就不能合并。3)改用改用双向无序双向无序RC表的表的Fisher确切概率确切概率法(可用法(可用SAS软件实现)。软件实现)。2.多多个样本率比较:若所得

14、统计推断为拒绝个样本率比较:若所得统计推断为拒绝H0,接受,接受H1时,只能认为各总体率之间总时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间均有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比间有差别,需进一步做多个样本率的多重比较。较。3.行行列表资料卡方检验与分类变量的顺序列表资料卡方检验与分类变量的顺序无关。无关。有序有序的的RC 表表资料两组(或多组)疗效(痊资料两组(或多组)疗效(痊愈、显效、有效、无效)的比较不宜愈、显效、有效、无效)的比较不宜用卡方检验用卡方检验。

15、有序的有序的RC 表资料两组(或多组表资料两组(或多组)构成比)构成比(痊愈、显效、有效、无效)的痊愈、显效、有效、无效)的比较可用用比较可用用卡方卡方检验。检验。单向单向有序表资料,宜选用秩转换的非参数检验;有序表资料,宜选用秩转换的非参数检验;分析两个有序分类变量间是否存在相关关系,宜分析两个有序分类变量间是否存在相关关系,宜用等级相关分析。用等级相关分析。小 结 1.检验是用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。其基本公式为 2.针对不同的数据有 四格表专用公式、四个表校正公式和RC列联表通用公式,在应用过程中需要根据不同的数据形势选

16、择合适的方法。22TTA22)(3.当多个样本率比较的推断结论拒绝H0,只说明各总体率之间有差别,但不能说明任两个总体率之间有差别。为此,需要采用多个样本率的多重比较方法。4.多个样本率间多重比较有 分割法、可信区间法和Bonferroni方法,应用这些方法能够保证假设检验中I型错误的概率不变。2 习题:某医学院抽样调查大学四年级和五年级习题:某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为学生近视眼患病情况,四年级学生的近视率为7.14%,五年级学生的近视率为,五年级学生的近视率为35.71%,调查调查结果见表结果见表8-2。问该大学四年级与五年级学生。问该大学四年

17、级与五年级学生的近视眼患病率是否不同?的近视眼患病率是否不同?表 8-2 两个年级大学生的近视眼患病率比较 年级 近视 非近视 合计 近视率(%)四年级 2(4.67)26(23.33)28 7.14 五年级 5(2.33)9(11.67)14 35.71 合计 7 35 42 16.67 2242(|2 926 5|)4223.62(25)(269)(226)(59)c P 0.005,按=0.05水准,不拒绝H0,还不能认为四年级与五年级学生近视眼患病率不等。本资料若不校正时,本资料若不校正时,结论与之相反。结论与之相反。25.4905.0P课后习题课后习题2-1课后习题课后习题2-2参考参考答案:由于有格子理论频数答案:由于有格子理论频数小于小于1,故采用精确概率法。,故采用精确概率法。课后习题课后习题2-3课后习题课后习题2-4课后习题课后习题2-5课后习题课后习题2-6谢谢!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 医疗、心理类
版权提示 | 免责声明

1,本文(医学统计学医统卡方检验课件.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|