医学精品课件:分类变量的统计分析.ppt

上传人(卖家):罗嗣辉 文档编号:5079769 上传时间:2023-02-09 格式:PPT 页数:101 大小:2.23MB
下载 相关 举报
医学精品课件:分类变量的统计分析.ppt_第1页
第1页 / 共101页
医学精品课件:分类变量的统计分析.ppt_第2页
第2页 / 共101页
医学精品课件:分类变量的统计分析.ppt_第3页
第3页 / 共101页
医学精品课件:分类变量的统计分析.ppt_第4页
第4页 / 共101页
医学精品课件:分类变量的统计分析.ppt_第5页
第5页 / 共101页
点击查看更多>>
资源描述

1、1统计分析统计分析数值变量数值变量分类变量分类变量变量类型变量类型第十六章第十六章 分类变量的统计分析分类变量的统计分析2分类变量的统计描述分类变量的统计描述常用相对数常用相对数应用相对数的注意事项应用相对数的注意事项率的标准化法率的标准化法3绝对数与相对数的概念绝对数与相对数的概念绝对数绝对数(absolute number):分类变量资料整理后所得到的原始数据,分类变量资料整理后所得到的原始数据,通常不具有可比性。通常不具有可比性。相对数相对数(relative number):指两个有联系的指标之比,是分类变量指两个有联系的指标之比,是分类变量统计描述指标的统称。统计描述指标的统称。34

2、相相 对对 数数第一节第一节 常用相对数常用相对数5概概 念念计计 算算又称频率指标,说明某现象又称频率指标,说明某现象发生的频率或强度。发生的频率或强度。一、率一、率(rate)5=K发生某现象的观察单位数率可能发生该现象的观察单位总数66比例基数比例基数K的取法:的取法:可取百分率可取百分率(%)、千分率、千分率()、万分率、万分率(1/万万)、十万分率十万分率(1/10万万)等,主要根据习惯用法和使结果保等,主要根据习惯用法和使结果保留一、二位整数。留一、二位整数。医学上常用的率:医学上常用的率:发病率、患病率、死亡率、病死率、治愈率、发病率、患病率、死亡率、病死率、治愈率、生存率等。生

3、存率等。7某年某市三个区的肠道传染病发病率某年某市三个区的肠道传染病发病率 7市区市区 人口数人口数 发病人数发病人数 发病率发病率()甲甲 98740 503 5.09 乙乙 75135 264 3.51 丙丙 118730 466 3.92合计合计 292605 1233 4.218概概 念念计计 算算又称构成指标,表示事物内部某组成部分又称构成指标,表示事物内部某组成部分占其全部的比重或分布,常以百分率占其全部的比重或分布,常以百分率(%)作为比例基数。作为比例基数。二、二、构成比构成比(proportion)8=100%事 物 内 部 某 一 组 成 部 分 的 观 察 单 位 数构

4、成 比事 物 内 部 所 有 组 成 部 分 的 观 察 单 位 总 数9病情严重程度病情严重程度 住院人数住院人数 病死数病死数 死亡构成死亡构成(%)病死率病死率(%)轻轻 300 12 26.7 4.0 中中 350 18 40.0 5.1 重重 150 15 33.3 10.0 合计合计 800 45 100.0 5.692000年某医院某病的住院人数和死亡人数年某医院某病的住院人数和死亡人数10白细胞分类白细胞分类 分类计数分类计数 构成比构成比(%)中性粒细胞中性粒细胞 140 70.0 淋巴细胞淋巴细胞 50 25.0 单核细胞单核细胞 5 2.5嗜酸粒细胞嗜酸粒细胞 4 2.0

5、嗜碱粒细胞嗜碱粒细胞 1 0.5 合计合计 200 100.010某正常人的白细胞分类计数构成比某正常人的白细胞分类计数构成比1111各组成部分的构成比之和各组成部分的构成比之和为为100%。事物内部某一部分构成比发生事物内部某一部分构成比发生变化,其它部分的构成比也相变化,其它部分的构成比也相应地发生变化。应地发生变化。特特点点12概概 念念计计 算算又称对比指标,指两个相关指标数值又称对比指标,指两个相关指标数值大小的比值,说明两者的对比水平,大小的比值,说明两者的对比水平,常以倍数或百分率常以倍数或百分率(%)表示表示。三、相对三、相对比比(relative ratio)12=100%甲

6、指标相对比(或)乙指标13例例1 我国我国2010年第六次人口普查总人数中,男性年第六次人口普查总人数中,男性为为686852572人,女性为人,女性为652872280人,试计算人人,试计算人口男女性别比例。口男女性别比例。结果说明,我国男性人数为女性人数的结果说明,我国男性人数为女性人数的1.052倍,倍,或者表达成男或者表达成男:女为女为 105.20:100。(。(2000年第五年第五次普查结果为次普查结果为 106.74:100)686852572652872280男女性别比例男女性别比例=1.05201414例例2 某市乙型脑炎的发病率某市乙型脑炎的发病率1990年为年为 4.48

7、/10万,万,2000年为年为0.88/10万,则这两年相万,则这两年相对比为:对比为:4.480.08100%=19.64%0.884.48=5.09(倍)或1515例例3 某医院某医院2005年医护人员为年医护人员为875人,同年人,同年平均开病床平均开病床1436张,则该医院张,则该医院2005年病床数年病床数与医护人员的相对比为:与医护人员的相对比为:1436=875张相对比=1.64张/人人1616%100XsCV例例4 变异系数(变异系数(coefficient of variation,CV)1717 2005年某研究组对武汉市江汉区中学生的吸烟情况、年某研究组对武汉市江汉区中学

8、生的吸烟情况、吸烟原因进行了调查。共调查吸烟原因进行了调查。共调查1722人,男生人,男生839人中人中172人吸烟;女生人吸烟;女生883人中人中17人吸烟,抽烟的主要原因人吸烟,抽烟的主要原因见表。试计算见表。试计算:(1)男女生吸烟率。)男女生吸烟率。(2)男女生吸烟率之比。)男女生吸烟率之比。(3)计算各种吸烟原因所占的百分构成比,并找出)计算各种吸烟原因所占的百分构成比,并找出前三位的吸烟原因。前三位的吸烟原因。常用相对数求法举例常用相对数求法举例18性别性别 人数人数 吸烟人数吸烟人数 吸烟率吸烟率(%)男男 839 172 20.50 女女 883 17 1.93合计合计 172

9、2 189 10.98182005年某地区中学男、女生吸烟率比较年某地区中学男、女生吸烟率比较男、女生吸烟率相对比男、女生吸烟率相对比=20.50/1.93=10.6219吸烟原因吸烟原因 人数人数 构成比构成比(%)位次位次解除烦恼解除烦恼 64 33.86 1显示气派显示气派 45 23.81 2 帮助社交帮助社交 43 22.75 3帮助思考帮助思考 16 8.47 4 显示富有显示富有 12 6.35 5 其其 它它 9 4.76 6 合合 计计 189 100.0 19189名吸烟者的吸烟原因构成比名吸烟者的吸烟原因构成比20第二节第二节 应用相对数的注意事项应用相对数的注意事项1.

10、计算相对数时,分母不宜过小计算相对数时,分母不宜过小2.正确区分构成比和率正确区分构成比和率3.比较相对数时比较相对数时,应注意资料的可比性:应注意资料的可比性:率的标准化率的标准化4.分母不同的率不能简单相加求平均率分母不同的率不能简单相加求平均率5.样本率或构成比的比较应进行假设检验样本率或构成比的比较应进行假设检验WARNING2021 为了消除相比较组间因内部构成不同对所比为了消除相比较组间因内部构成不同对所比较指标的影响,采用统一的标准构成对总率进行较指标的影响,采用统一的标准构成对总率进行调整,使算得的标准化率具有可比性,得出科学调整,使算得的标准化率具有可比性,得出科学的结论。的

11、结论。21率的标准化的概念与基本思想:率的标准化的概念与基本思想:第三节第三节 率的标准化法率的标准化法22 住院人数住院人数 治愈人数治愈人数 治愈率治愈率(%)甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 1500 500 975 315 65.0 63.0 外科外科 500 1500 470 1365 94.0 91.0 传染病科传染病科 500 500 475 460 95.0 92.0 合计合计 2500 2500 1920 2140 76.8 85.6 22 科别科别甲、乙两医院的治愈率甲、乙两医院的治愈率23标准化率的计算标准化率的

12、计算1.选定标准选定标准 选择有代表性、较稳定、数量较大的人群选择有代表性、较稳定、数量较大的人群,如全国、全省的历年累计数据;,如全国、全省的历年累计数据;也可将比较也可将比较组的人口合并;组的人口合并;任选其中一组作为标准。任选其中一组作为标准。2.计算标化率计算标化率 直接法直接法 间接法间接法3.比较得出结论比较得出结论 232424直接法直接法 已知各科的真实治愈率。已知各科的真实治愈率。iiiiN pNpppNN或25 原治愈率原治愈率 Pi(%)预期治愈人数预期治愈人数 Ni Pi 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 2000 65.0 63.0 1

13、300 1260 外科外科 2000 94.0 91.0 1880 1820传染病科传染病科 1000 95.0 92.0 950 920 合计合计 5000 76.8 85.6 4130 4000 25科别科别标准人口标准人口Ni甲、乙两医院的标准化治愈率甲、乙两医院的标准化治愈率(直接法直接法)26甲医院标准化后的治愈率:甲医院标准化后的治愈率:乙医院标准化后的治愈率:乙医院标准化后的治愈率:26813100032.8424767iiN ppN523100021.1124767iiN ppN4130500040005000=80%=82.6%100%100%27 原治愈率原治愈率 Pi(%

14、)预期治愈率预期治愈率 Ni/NPi(%)甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 0.4 65.0 63.0 26.0 25.2 外科外科 0.4 94.0 91.0 37.6 36.4传染病科传染病科 0.2 95.0 92.0 19.0 18.4 合计合计 1.0 76.8 85.6 82.6 80.0 27科别科别标准人口标准人口构成比构成比Ni/N甲、乙两医院的标准化治愈率甲、乙两医院的标准化治愈率(直接法直接法)iiNpNiiNpN28 住院人数住院人数 治愈人数治愈人数 治愈率治愈率(%)甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 甲医院甲医院

15、 乙医院乙医院 内科内科 1500 500 975 315 65.0 63.0 外科外科 500 1500 470 1365 94.0 91.0 传染病科传染病科 500 500 475 460 95.0 92.0 合计合计 2500 2500 1920 2140 76.8 85.6 28 科别科别甲、乙两医院的治愈率甲、乙两医院的治愈率 间接法间接法 未知:各科真实治愈率未知:各科真实治愈率 已知:医院总治愈人数和各科住院人数已知:医院总治愈人数和各科住院人数 各科标准治愈率和总的标准治愈率(文献获得)各科标准治愈率和总的标准治愈率(文献获得)29 住院人数住院人数 Ni 预期治愈人数预期治

16、愈人数 Ni Pi 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 61.0 1500 500 915 305 外科外科 92.0 500 1500 460 1380传染病科传染病科 94.0 500 500 470 470 合计合计 87.5 2500 2500 1845 2155 29科别科别标准标准 治愈率治愈率Pi(%)甲、乙两医院的标准化治愈率(间接法)甲、乙两医院的标准化治愈率(间接法)iirpPP SMRn PiirpPP SMRn PP甲甲P乙乙87.5%1920/1845=87.5%1.04=91%87.5%2140/2155=87.5%0.99=86.6%

17、3030iirpPP SMRn P 当当Pi代表死亡率时,代表死亡率时,r/(niPi)是被标化组的是被标化组的实际死亡人数与预期死亡人数的比值,称为实际死亡人数与预期死亡人数的比值,称为标准标准化死亡比化死亡比(standard mortality ratio,SMR)。3131n当各比较组内部构成不同,而且对总率有影响时,应当各比较组内部构成不同,而且对总率有影响时,应对率进行标准化,然后再比较。对率进行标准化,然后再比较。n选用的标准不同,计算出的标准化率也不同。标准化选用的标准不同,计算出的标准化率也不同。标准化率只反映各被标化组的相对水平,不代表其实际水平。率只反映各被标化组的相对水

18、平,不代表其实际水平。n各年龄组的率出现明显交叉时,不宜用标准化法。各年龄组的率出现明显交叉时,不宜用标准化法。n若是抽样研究,样本标化率的比较应作假设检验。若是抽样研究,样本标化率的比较应作假设检验。率的标准化应注意的问题率的标准化应注意的问题WARNING32统计分析统计分析统计描述统计描述统计推断统计推断统计分析统计分析3233用样本信息来推用样本信息来推断总体的特征,断总体的特征,称为统计推断。称为统计推断。参数估计参数估计parameter estimate假设检验假设检验hypothesis test统计推断统计推断statistical inference34一、率的抽样误差一、

19、率的抽样误差 由抽样造成的由抽样造成的样本率与总体率之间样本率与总体率之间的差异以及的差异以及在同一总体中抽取的在同一总体中抽取的各样本率间各样本率间的差别。的差别。反映率反映率抽样误差大小的指标是抽样误差大小的指标是率的标准误率的标准误。第四节率的抽样误差和总体率的估计第四节率的抽样误差和总体率的估计35率的标准误的计算:率的标准误的计算:理论值:理论值:估计值:估计值:35(1)pn(1)pppSn36 例例 欲了解某种新药对慢性乙型肝炎的疗效,欲了解某种新药对慢性乙型肝炎的疗效,对对100名患者进行治疗,其中名患者进行治疗,其中90人有效,试计算其人有效,试计算其标准误。标准误。本例本例

20、n=100 p=90100=0.9,标准误为:,标准误为:(1)0.04(1 0.04)0.0088500pppSn360.0337二、总体率的可信区间估计二、总体率的可信区间估计37 根据已知条件,总体率可信区间的估计有根据已知条件,总体率可信区间的估计有2种方法:种方法:n正态近似法正态近似法n查表法查表法3838从某个二项分类总体中随机抽取含量一定的样本从某个二项分类总体中随机抽取含量一定的样本,发生阳性结果的次数,发生阳性结果的次数x的概率分布服从二项分的概率分布服从二项分布布(binomial distribution),即样本中阳性数概,即样本中阳性数概率等于二项式展开后各项。若总

21、体阳性率为率等于二项式展开后各项。若总体阳性率为、样本含量为样本含量为n,阳性数为,阳性数为X,则样本中出现,则样本中出现X个阳个阳性事件的概率可由下式求得。性事件的概率可由下式求得。n ,2,1,0 )1()!(!)(xxnxnxPxnx3939已知:已知:=0.3,n=5;=0.3,n=10;=0.3,n=15;=0.5,n=10。根据上述公式求各阳性数事件的。根据上述公式求各阳性数事件的概率并作概率分布图。概率并作概率分布图。率的抽样分布图率的抽样分布图 4040P(X)XXXa.n=5b.n=10c.n=30=30%的的二项分布示意图二项分布示意图P(X)P(X)41411.为离散型分

22、布;为离散型分布;2.当当=0.5 时,呈对称分布;时,呈对称分布;3.当当 n 增大时,只要增大时,只要不太接近不太接近0或或1,二项分布二项分布 逐渐逼近逐渐逼近正态分布正态分布。一般认为,当一般认为,当n和和n(1-)5时时,可近似看作可近似看作 正正态分布态分布。4242 1.正态近似法正态近似法 当当n足够大足够大(n50),且,且np和和n(1p)51.96ppS总体率总体率95%可信区间:可信区间:总体率总体率99%可信区间:可信区间:2.58ppS总体率可信区间估计的方法总体率可信区间估计的方法43 上例中某地治疗上例中某地治疗100名患者,名患者,90人有效,得出人有效,得出

23、 有效率有效率90%,试估计该新药有效率,试估计该新药有效率95%置信区间。置信区间。n=100,p=0.9,np=90 5,n(1-p)=10 5 前已算得前已算得 ,则其,则其95%CI为:为:1.960.04 1.96 0.00880.0228 0.0572ppS(,)43 =0.9 1.960.03=(0.8412,0.9588)即该新药有效率即该新药有效率95%置信区间为置信区间为84.12%95.88%。0.0088pS 0.03442.查表法查表法 如果如果n、p不满足上述条件不满足上述条件(n50),可根据二,可根据二项分布的原理估计总体率的置信区间。项分布的原理估计总体率的置

24、信区间。即根据即根据样本含量样本含量n和和阳性数阳性数X查表得到总体查表得到总体率的置信区间。率的置信区间。当当xn/2时,直接查表可得;时,直接查表可得;当当xn/2时,应以时,应以n-x查表,然后用查表,然后用100减去查得减去查得的数字,即为所求的区间。的数字,即为所求的区间。4445 例例 某社区抽取某社区抽取40岁以上居民岁以上居民30人测量血压,人测量血压,查出高血压查出高血压10名,试估计该社区名,试估计该社区40岁以上居民高岁以上居民高血压患病率的血压患病率的95%置信区间置信区间。n=30,阳性患者数,阳性患者数 x x=10。查百分率的置信区间表查百分率的置信区间表(P33

25、1)得:得:45即该社区即该社区40岁以上居民高血压患病率的岁以上居民高血压患病率的95%CI为为17%53%175346上例若上例若 n=30,阳性患者数阳性患者数 x=23,求总体率求总体率95%CI。第一步:第一步:n-x=30-23=7 查表(查表(n=30,x=7)得:得:10%42%第二步:第二步:100%10%90%100%42%58%得得总体率总体率95%可信区间可信区间为为 58%90%47一、样本率与总体率的比较一、样本率与总体率的比较 目的是推断样本所代表的未知总体率目的是推断样本所代表的未知总体率与已知的与已知的总体率总体率0 0是否相同。是否相同。已知的总体率已知的总

26、体率0 0一般为理论值、标准值或经过大一般为理论值、标准值或经过大量调查所获得的稳定值。量调查所获得的稳定值。应用条件:应用条件:n足够大足够大(n50),np和和n(1p)5第五节第五节 率的率的 u 检验检验(1)pppun48例例 某地区一般人群乙肝的阳性率约为某地区一般人群乙肝的阳性率约为15%,今对,今对该地区该地区150名流浪者进行检查,其中阳性名流浪者进行检查,其中阳性30人,问人,问当地流浪者乙肝的阳性率是否高于一般人群当地流浪者乙肝的阳性率是否高于一般人群?本例本例:n=150,p=30/150=20%,np和和n(1-p)5,满足满足u检验条件,检验条件,0=15%491.

27、建立假设,确定检验水准建立假设,确定检验水准 H0:=0 H1:0 =0.05 2.选定检验方法,计算统计量选定检验方法,计算统计量 0.50.34.32(1)0.3(1 0.3)98pun1.715503.确定确定P值,作出推断结论值,作出推断结论查查t界值最后一行,单侧界值最后一行,单侧u0.05=1.645,双侧,双侧u0.05=1.96本例本例 u=1.715单侧单侧u0.05,所以,所以P0.05。按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有统计学意,差异有统计学意义,可认为当地流浪者乙肝阳性率高于一般人群。义,可认为当地流浪者乙肝阳性率高于一般人群。51 二、两个

28、大样本率的比较二、两个大样本率的比较 应用条件:应用条件:n1足够大足够大(n50),n1p1和和n1(1p1)5 n2足够大足够大(n50),n2p2和和n2(1p2)51212ppppuS121211(1)ppccSppnn1212cXXpnn52 例例 欲了解从事工农业生产的欲了解从事工农业生产的50岁以上人群患岁以上人群患高血压的情况。调查了首钢工人高血压的情况。调查了首钢工人1281人,高血压人,高血压患者患者386人,患病率为人,患病率为30.13%;石景山区农民;石景山区农民387人,高血压患者人,高血压患者65人,患病率为人,患病率为16.80%,试问这,试问这两类人群高血压患

29、病率有无差别?两类人群高血压患病率有无差别?53本例本例:n1=1281,X1=386;n2=387,X2=65,满足,满足u检检验条件。验条件。P1=0.3013,P2=0.1680 1.建立假设,确定检验水准建立假设,确定检验水准 H0:1=2 H1:12 =0.05 2.选定检验方法,计算统计量选定检验方法,计算统计量 54121211(1)110.057(1 0.057)0.0147522478ppccSppnn12120.069 0.0461.5670.0147ppppuS121224330.057522478cXXpnn386+651281+387=0.27040.30130.16

30、8=5.17553.确定确定P值,作出推断结论值,作出推断结论双侧双侧u0.05=1.96,u0.01=2.58,本例,本例 u=5.172.58,所,所以以P0.01。按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有统计学,差异有统计学意义,可认为这两类人群高血压患病率有差别。意义,可认为这两类人群高血压患病率有差别。56第六节第六节 2检验(检验(Chi-square test)t 是现代统计学的创始人之一,英国是现代统计学的创始人之一,英国统计学家统计学家K.Pearson于于1900年提出的年提出的一种具有广泛用途的假设检验方法。一种具有广泛用途的假设检验方法。常用于计数

31、资料的统计推断。常用于计数资料的统计推断。57 检验(检验(Chi-square test)主要用于计数资料的统主要用于计数资料的统计分析,研究的变量是分类变量,而观察值以频数计分析,研究的变量是分类变量,而观察值以频数表示。表示。该方法可用于推断两个及多个总体率(或构成比)该方法可用于推断两个及多个总体率(或构成比)之间有无差别、分类资料的关联度分析等。之间有无差别、分类资料的关联度分析等。2x58 例例 某医生欲比较某医生欲比较A、B两种药物治疗老年抑郁症的两种药物治疗老年抑郁症的效果,将病情相近的效果,将病情相近的60名患者随机分为两组,分别名患者随机分为两组,分别用两种药物治疗,结果见

32、下表用两种药物治疗,结果见下表:A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效有效 无效无效 合计合计 有效率有效率(%)A药药 19 11 30 63.33 B药药 15 15 30 50.00 合计合计 34 26 60 56.67 一、一、2检验的基本思想检验的基本思想59 阳性数阳性数 阴性数阴性数 合合 计计 阳性率阳性率(%)A组组 a b a+b a/(a+b)B组组 c d c+d c/(c+d)合计合计 a+c b+d n (a+c)/n 四格表四格表2检验的基本结构检验的基本结构60A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效有效 无效无效 合计合

33、计 有效率有效率(%)A药药 19(a)11(b)30(a+b)63.33 B药药 15(c)15(d)30(c+d)50.00 合计合计 34(a+c)26(b+d)60(n)56.6761理论频数理论频数计算公式计算公式为:为:NnnTCRRCR行行(row)C列列(column)62假设假设H0:1=2=56.67%=(a+c)/n成立,则四个格子成立,则四个格子的理论数用的理论数用 T 表示:表示:RCRCn nTnT11=3034/60=17 T12=3026/60=13T21=3034/60=17 T22=3026/60=13A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有

34、效有效 无效无效 合计合计 有效率有效率(%)A药药 19(a)11(b)30(a+b)63.33 B药药 15(c)15(d)30(c+d)50.00 合计合计 34(a+c)26(b+d)60(n)56.6763n如果无效假设成立,四个格子的实际数如果无效假设成立,四个格子的实际数A与与T应比较应比较接近;如果假设不成立,则接近;如果假设不成立,则A与与T相差较大。卡方检相差较大。卡方检验就是看验就是看A与与T之间吻合的程度。之间吻合的程度。n统计学家统计学家Pearson提出,在无效假设提出,在无效假设H0成立时统计量成立时统计量 2值值的分布规律,称为的分布规律,称为2分布分布。22(

35、)A TT 64A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效有效 无效无效 合计合计 有效率有效率(%)A药药 19(17)11(13)30(a+b)63.33 B药药 15(17)15(13)30(c+d)50.00 合计合计 34(a+c)26(b+d)60(n)56.6722()A TT (1917)2 17=+(1113)2 13(1517)2 17(1513)2 13+=1.0965 不同自由度的不同自由度的 分布曲线图分布曲线图 值的大小除了取决于值的大小除了取决于A-T的差值外,还与格子数有关,的差值外,还与格子数有关,因为每个格子的(因为每个格子的(A-T)2/T

36、都是正值,所以会随着格子都是正值,所以会随着格子数的增加而变大。严格地说,分布与自由度有关。数的增加而变大。严格地说,分布与自由度有关。2266 2 2检验的自由度检验的自由度 指可以自由取值的基本格子数指可以自由取值的基本格子数 自由度一定时,其自由度一定时,其 2值的概率分布也就确定。根据自值的概率分布也就确定。根据自由度由度 和检验水准和检验水准 查查 2界值表,可得界值表,可得 2界值,若界值,若 2值值 20.05(),),则则P0.05,可按,可按=0.05检验水准拒绝检验水准拒绝H0;若若 2值值 20.05(),),则则P0.05,不能拒绝不能拒绝H0。)1)(1(列数行数67

37、67(p336)68 二、四格表的二、四格表的2检验检验 四格表专用公式:四格表专用公式:22()()()()()ad bc na b c d a c b d 69 当当n40,所有所有T 5时,用普通时,用普通 2 检验检验 当当n40,任一格子任一格子1 T5时,用校正时,用校正 2 检验检验 当当n40或或任一格子任一格子T 1时,用时,用Fisher确切概率法确切概率法 22()2()()()()nadbcnab cdac bd 22(0.5ATT)校正公式:校正公式:70 2检验步骤:检验步骤:1.建立假设,确定检验水准建立假设,确定检验水准 H0:1 2,两种药物有效率相同,两种药

38、物有效率相同 H1:1 2,两种药物有效率不同,两种药物有效率不同 =0.05 2.计算统计量计算统计量2值值71T11=3034/60=17 T12=3026/60=13T21=3034/60=17 T22=3026/60=13n=60,且所有的,且所有的T5故用普通故用普通 2 检验,不用校正检验,不用校正7222()()()()()ad bc na b c d a c b d=(19151115)260 30303426=1.09A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效有效 无效无效 合计合计 有效率有效率(%)A药药 19(a)11(b)30(a+b)63.33 B药

39、药 15(c)15(d)30(c+d)50.00 合计合计 34(a+c)26(b+d)60(n)56.67=733.确定确定P值,作出结论值,作出结论=(21)(21)=1,按,按=1查查 2界值表,界值表,20.05(1)=3.84,本例本例2=1.093.84,所以,所以P0.05。按按=0.05水准,不拒绝水准,不拒绝H0,差异无统计学意义,差异无统计学意义,不能认为两种药物的有效率不同。不能认为两种药物的有效率不同。7474 2f(2)=1自由度自由度=1的的2分布分布值示意图值示意图3.84=0.051.0975 方法方法 有损伤有损伤 无损伤无损伤 合计合计 损伤率损伤率(%)手

40、术手术 22 6 28 78.57 放疗放疗 7 8 15 46.67 合计合计 29 14 43 67.44例例 两种方法治疗脑胶质瘤患者后脑功能损伤率比较两种方法治疗脑胶质瘤患者后脑功能损伤率比较76 2检验步骤:检验步骤:1.建立假设,确定检验水准建立假设,确定检验水准 H0:1 2,两种方法脑功能损伤率相同,两种方法脑功能损伤率相同 H1:1 2,两种方法脑功能损伤率不同,两种方法脑功能损伤率不同 =0.05 2.计算统计量计算统计量2值值77T11=2829/43=18.88 T12=2814/43=9.12T21=1529/43=10.12 T22=1514/43=4.88n=43

41、,且,且T22 5故应用校正故应用校正 2检验检验 方法方法 有损伤有损伤 无损伤无损伤 合计合计 损伤率损伤率(%)手术手术 22 6 28 78.57 放疗放疗 7 8 15 46.67 合计合计 29 14 43 67.4478(22867 43/2)243 28152914=3.19=方法方法 有损伤有损伤 无损伤无损伤 合计合计 损伤率损伤率(%)手术手术 22 6 28 78.57 放疗放疗 7 8 15 46.67 合计合计 29 14 43 67.44222()2()()()()60(25 1 727)6022.8932 28 52 8nadbcnab cdac bd 793.

42、确定确定 P 值,作出结论值,作出结论=(21)(21)=1,按,按=1查查 2界值表,界值表,20.05(1)=3.84,本例本例2=3.193.84,故,故P0.05。按按=0.05水准,不拒绝水准,不拒绝H0,差异无统计学意义,差异无统计学意义,不能认为两种治疗方法脑功能损伤发生率不同。不能认为两种治疗方法脑功能损伤发生率不同。222()()()()()(251727)604.333228528adbcnabcdacbd 如果不校正:如果不校正:(22867)243 28152914=4.528 3.84=20.05(1)故故P0.05,可认为两种治疗方法的,可认为两种治疗方法的脑功能损

43、伤发生率不同。脑功能损伤发生率不同。四格表确切概率法四格表确切概率法(Fishers Exact Test)在四格表资料中若有在四格表资料中若有,尤其尤其是用其它检验方法所得的概率接近显著性水平是用其它检验方法所得的概率接近显著性水平(0.05)时,宜用直接概率法算出确切的概率。)时,宜用直接概率法算出确切的概率。本法的基本思想是在四格表的行合计、列合计不变本法的基本思想是在四格表的行合计、列合计不变的前提下,出现各种组合的概率服从超几何分布,的前提下,出现各种组合的概率服从超几何分布,每一种组合的概率可用公式直接计算。每一种组合的概率可用公式直接计算。!)!()!()!()!(ndcbadb

44、cadcbaP疗法疗法 治愈未治愈合计治愈率治愈未治愈合计治愈率%新疗法新疗法 72 977.78保守疗法保守疗法 2 6 825.00合计合计 9 8 17 52.94本例本例n=1740,宜用,宜用四格表确切概率法。四格表确切概率法。两种疗法对腰椎间盘脱出症的疗效两种疗法对腰椎间盘脱出症的疗效 三、配对四格表的三、配对四格表的2检验(检验(McNemar检验)检验)样样 品品甲甲乙乙 n份份abcd84配对四格表资料的基本结构配对四格表资料的基本结构甲甲 法法 乙乙 法法 a b a+b c d c+d合合 计计 a+c b+d n合合 计计85配对四格表配对四格表 2值的计算值的计算b+

45、c40 时:时:b+c40 时需校正:时需校正:22()bcbc 22(1)bcbc86例例 有有50份痰液标本,每份分别接种在甲、乙两种份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌生长情况,结果见下表,培养基中,观察结核杆菌生长情况,结果见下表,试比较两种培养基的效果。试比较两种培养基的效果。乙培养基乙培养基 27 12 39 3 8 11合合 计计 30 20 50两种培养基培养效果比较两种培养基培养效果比较甲培养基甲培养基合合 计计87 2检验步骤:检验步骤:1.建立假设,确定检验水准建立假设,确定检验水准 H0:B=C,两种培养基的阳性率相同两种培养基的阳性率相同 H1:

46、BC,两种培养基的阳性率不同两种培养基的阳性率不同 =0.05 2.计算统计量计算统计量2值值 本例本例 b+c=12+3=1540,故使用校正公式:,故使用校正公式:883.确定确定P值,作出结论值,作出结论 本例本例=(21)(21)=1,按,按=1查查2界值表,界值表,20.05(1)=3.84,算得,算得2=4.273.84,故,故P0.05。按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有统计学,差异有统计学意义,可以认为甲、乙两种培养基意义,可以认为甲、乙两种培养基的阳性的阳性率不同率不同。22(1)bcbc (123 1)2 12+3=4.2789 当四格表的行数或

47、列数大于当四格表的行数或列数大于2时,称为时,称为行行列表列表或或RC表表,用于多个,用于多个样本率样本率或或构成比构成比的比较。的比较。22(1)RcAnn n 四、四、RC表资料的表资料的2检验检验 90 家庭关系家庭关系 满意度满意度 合计合计 满意率(满意率(%)满意满意 不满意不满意 和和 睦睦 174 60 234 74.36 一一 般般 36 57 93 38.71 差差 6 10 16 37.50 合合 计计 216 127 343 62.97343例离退休老人的家庭关系与生活满意度例离退休老人的家庭关系与生活满意度(一)多个率的比较(一)多个率的比较 T33=16127/34

48、3=5.92Tmin=91 2检验步骤:检验步骤:1.建立假设,确定检验水准建立假设,确定检验水准 H0:1=2=3 H1:1、2、3不等或不全等不等或不全等 =0.05 2.计算统计量计算统计量2值值9222(1)RcAnn n=343(1742/234216+602/234127+102/161271)=40.94 家庭关系家庭关系 满意度满意度 合计合计 满意率(满意率(%)满意满意 不满意不满意 和和 睦睦 174 60 234 74.36 一一 般般 36 57 93 38.71 差差 6 10 16 37.50 合合 计计 216 127 343 62.97933.确定确定P值,作

49、出结论值,作出结论 本例本例=(31)(21)=2,按,按=2查表,查表,20.05(2)=5.99,20.01(2)=9.21,算得,算得2=40.949.21,所以,所以P0.01。按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,差异有,差异有统计学意义,可以认为三种不同家庭关系的老统计学意义,可以认为三种不同家庭关系的老人生活满意度不同或不全同,家庭和睦的老人人生活满意度不同或不全同,家庭和睦的老人生活满意率最高。生活满意率最高。94 民族民族 职业职业 合计合计 干部干部 工人工人 农民农民 其他其他 汉族汉族 20 56 62 7 145 回族回族 14 40 32 11 9

50、7 满族满族 18 28 45 8 99 合合 计计 52 124 139 26 341三个民族居民的职业分布三个民族居民的职业分布(二)多个构成比的比较(二)多个构成比的比较 T24=9726/341=7.4Tmin=95 2检验步骤:检验步骤:1.建立假设,确定检验水准建立假设,确定检验水准 H0:三个民族职业构成比分布相同:三个民族职业构成比分布相同 H1:三个民族职业构成比分布不同或不全同三个民族职业构成比分布不同或不全同 =0.05 2.计算统计量计算统计量2值值9622(1)RcAnn n=341(202/14552+562/145124+82/99261)=8.802 民族民族

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(医学精品课件:分类变量的统计分析.ppt)为本站会员(罗嗣辉)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|