分类变量资料统计分析讲义课件.ppt

上传人(卖家):晟晟文业 文档编号:4773739 上传时间:2023-01-09 格式:PPT 页数:110 大小:1.33MB
下载 相关 举报
分类变量资料统计分析讲义课件.ppt_第1页
第1页 / 共110页
分类变量资料统计分析讲义课件.ppt_第2页
第2页 / 共110页
分类变量资料统计分析讲义课件.ppt_第3页
第3页 / 共110页
分类变量资料统计分析讲义课件.ppt_第4页
第4页 / 共110页
分类变量资料统计分析讲义课件.ppt_第5页
第5页 / 共110页
点击查看更多>>
资源描述

1、分类变量资料分类变量资料的统计分析的统计分析统计推断统计推断u u检验、检验、检验检验2参数估计参数估计假设检验:假设检验:频数分布频数分布集中趋势指标集中趋势指标离散趋势指标离散趋势指标医学参考值范围估计医学参考值范围估计数值变量资料数值变量资料的统计分析的统计分析统计描述统计描述统计推断统计推断u u 检验检验t t 检验检验方差分析方差分析统计描述统计描述 相对数相对数参数估计参数估计假设检验假设检验第十六章第十六章 分类变量的统计分析分类变量的统计分析第第1-31-3节节 统计描述统计描述刘颖刘颖 预防医学教研室预防医学教研室掌握:掌握:n 常用相对数指标的意义、计算方法和注意事项;常

2、用相对数指标的意义、计算方法和注意事项;n 率的标准误和总体率可信区间的估计方法及意义;率的标准误和总体率可信区间的估计方法及意义;n u 检验和检验和 检验的适用条件和计算方法。检验的适用条件和计算方法。2熟悉:熟悉:n 率的标准化的意义和计算方法率的标准化的意义和计算方法1常用相对数常用相对数2应用相对数的注意事项应用相对数的注意事项3率的标准化率的标准化第一节第一节 常用相对数常用相对数绝对数(绝对数(absolute number)分类变量资料整分类变量资料整理后所得到的数据。理后所得到的数据。相对数(相对数(relative number)分类变量资料的分类变量资料的统计描述指标。统

3、计描述指标。例例1 某年某地流行性乙型脑炎发病某年某地流行性乙型脑炎发病 240 例、麻疹例、麻疹发病发病 200 例。例。240、200 绝对数绝对数绝对数说明在一定条件下该地该病实际发生的绝对绝对数说明在一定条件下该地该病实际发生的绝对水平,是制订疾病防治计划和统计分析的基础。水平,是制订疾病防治计划和统计分析的基础。甲地麻疹发病率甲地麻疹发病率=240/2000=12%乙地麻疹发病率乙地麻疹发病率=200/1000=20%发病人数发病人数易感儿童易感儿童甲地甲地 240 2000乙地乙地 200 1000例例2常用相对数常用相对数 1.率(率(rate)又称频率指标或强度指标;又称频率指

4、标或强度指标;说明说明某现象发生的频率或强度某现象发生的频率或强度;常以常以%、1/万、万、1/10万等表示。万等表示。可能可能发生某现象的单位总数发生某现象的单位总数发生某现象的观察单位发生某现象的观察单位数数率率=比例基数比例基数例例3 某年某市三个区的肠道传染病发病率某年某市三个区的肠道传染病发病率区区 人口数人口数 发病人数发病人数 发病率发病率()甲甲 98740 503 5.09乙乙 75135 264 3.51丙丙 118730 466 3.92合计合计 292605 1233 4.21甲区发病率甲区发病率=503/98740=5.09总发病率总发病率=1233/292605=4

5、.212.构成比构成比(constituent ratio)又称构成指标或结构指标,说明又称构成指标或结构指标,说明某一事物内部某一事物内部各组成部分的比重或分布各组成部分的比重或分布,常以百分数表示。,常以百分数表示。某一组成部分的观察单位数某一组成部分的观察单位数同一事物各组成部分的观察单位数同一事物各组成部分的观察单位数构成比构成比=100%表表16.1 2000年某医院某病住院与死亡人数年某医院某病住院与死亡人数病情严重程度病情严重程度 住院人数住院人数 病死数病死数 死亡构成死亡构成(%)病死率病死率(%)轻轻 300 12 26.7 4.0 中中 350 18 40.0 5.1 重

6、重 150 15 33.3 10.0 合计合计 800 45 100.0 5.6构成比的构成比的特点特点n 各构成部分的构成比总和为各构成部分的构成比总和为100%;n 某一部分所占比重的增减,会相应地影响某一部分所占比重的增减,会相应地影响其他部分,各构成比之间是相互制约的其他部分,各构成比之间是相互制约的。3.相对比(相对比(relative ratio)表示表示两个有关指标之比两个有关指标之比,常以倍数或,常以倍数或百分数表示。百分数表示。甲指标甲指标乙指标乙指标相对比相对比=(或或100%)例例5 2000 年我国第五次人口普查结果,男年我国第五次人口普查结果,男 65355 万人,女

7、子万人,女子 61228 万人,试计算人口男女性别比。万人,试计算人口男女性别比。6535561228性别比性别比 =1.067例例6 某市乙型脑炎的发病率某市乙型脑炎的发病率 1990 年为年为 4.48/10 万,万,2000 年为年为 0.88/10 万,试计算相对比。万,试计算相对比。相对比相对比=4.48/0.88=5.1(倍倍)相对比相对比=0.88/4.48100%=19.64%例例16.3 甲、乙两地肺癌死亡率分别为甲、乙两地肺癌死亡率分别为23.1/10万、万、12.33/10万,则两地死亡率的相对比为万,则两地死亡率的相对比为23.1/12.33=1.87,即甲地肺癌死亡率

8、是乙地的,即甲地肺癌死亡率是乙地的1.87倍,倍,RR=1.87。n 计算相对数时分母不宜过小,即观察单位数应计算相对数时分母不宜过小,即观察单位数应足够多。足够多。n 分析时构成比和率不能混淆(见表分析时构成比和率不能混淆(见表16-1)构成比构成比说明事物内部各组成部分的比重或分布;说明事物内部各组成部分的比重或分布;率率说明现象发生的频率或强度。说明现象发生的频率或强度。第二节第二节 应用相对数的应用相对数的注意事项注意事项表表16.1 2000年某医院某病住院与死亡人数年某医院某病住院与死亡人数病情严重程度病情严重程度 住院人数住院人数 病死数病死数 死亡构成死亡构成(%)病死率病死率

9、(%)轻轻 300 12 26.7 4.0 中中 350 18 40.0 5.1 重重 150 15 33.3 10.0 合计合计 800 45 100.0 5.6n 相对数的比较应注意可比性相对数的比较应注意可比性 观察对象同质、研究方法相同、观察时观察对象同质、研究方法相同、观察时间相等,以及客观条件一致;间相等,以及客观条件一致;资料内部构成是否相同。资料内部构成是否相同。n 率的标准化率的标准化n 要考虑存在抽样误差要考虑存在抽样误差 率或构成比的比较应做假设检验率或构成比的比较应做假设检验第三节第三节 率的标准化法率的标准化法 率的标准化法(率的标准化法(standardizatio

10、n)在一个指定的标在一个指定的标准构成条件下进行率的对比的方法。准构成条件下进行率的对比的方法。实际工作中,对两个或多个频率指标进行比较实际工作中,对两个或多个频率指标进行比较时,若各组对象内部构成存在差异,且差异又影响时,若各组对象内部构成存在差异,且差异又影响分析结果,应该用率的标准化法进行比较。分析结果,应该用率的标准化法进行比较。表表16.2 甲、乙两医院的治愈率甲、乙两医院的治愈率 科别科别 住院人数住院人数 治愈人数治愈人数 治愈率治愈率(%)甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 1500 500 975 315 65.0 6

11、3.0 外科外科 500 1500 470 1365 94.0 91.0传染病科传染病科 500 500 475 460 95.0 92.0 合计合计 2500 2500 1920 2140 76.8 85.61.用用“标准人口标准人口”计算计算(1)选定标准:)选定标准:两医院各型病人相加;两医院各型病人相加;标准的选择方法:标准的选择方法:n 选择有代表性、较稳定、数量较大的人群,如全选择有代表性、较稳定、数量较大的人群,如全 国、全省的历年累计数据;国、全省的历年累计数据;n 在互相比较的两组资料中,任选其中一组或两组在互相比较的两组资料中,任选其中一组或两组 合并作为共同标准。合并作为

12、共同标准。标准化率的计算(直接法)标准化率的计算(直接法)(2)计算甲、乙两医院各型传染病病人的预期治愈)计算甲、乙两医院各型传染病病人的预期治愈人数:人数:各型病人标准人口数分别乘以相应的原治愈各型病人标准人口数分别乘以相应的原治愈率;率;(3)计算甲、乙两医院传染病的标准化治愈率:)计算甲、乙两医院传染病的标准化治愈率:各各型病人预期治愈人数相加除以标准总人数。型病人预期治愈人数相加除以标准总人数。表表16.3 标准人口数计算甲、乙两医院标准化治愈率(直接法)标准人口数计算甲、乙两医院标准化治愈率(直接法)科别科别 标准人标准人 原治愈率原治愈率(%)预期治愈人数预期治愈人数 口数口数 甲

13、医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 2000 65.0 63.0 1300 1260 外科外科 2000 94.0 91.0 1880 1820传染病科传染病科 1000 95.0 92.0 950 920合计合计 5000 76.8 85.6 4130 4000乙医院标化治愈率乙医院标化治愈率=乙医院预期治愈人数之和乙医院预期治愈人数之和/标准组总人数标准组总人数 =4000/5000*100%=80%2.用用“标准人口构成比标准人口构成比”计算计算(1)将标准病人数换算成构成比;)将标准病人数换算成构成比;(2)计算甲、乙两医院各型传染病的分配治愈率:)计算甲、

14、乙两医院各型传染病的分配治愈率:标准人口构成比乘以相应原治愈率;标准人口构成比乘以相应原治愈率;(3)计算甲、乙两医院某传染病的标准化治愈率:)计算甲、乙两医院某传染病的标准化治愈率:各型传染病分配治愈率相加。各型传染病分配治愈率相加。表表16.4 标准人口构成比计算甲、乙两医院标准化治愈率标准人口构成比计算甲、乙两医院标准化治愈率 科别科别 标准人口标准人口 原治愈率原治愈率(%)预期治愈率预期治愈率 构成比构成比 甲医院甲医院 乙医院乙医院 甲医院甲医院 乙医院乙医院 内科内科 0.4 65.0 63.0 26.0 25.2 外科外科 0.4 94.0 91.0 37.6 36.4传染病科

15、传染病科 0.2 95.0 92.0 19.0 18.4合计合计 1.0 76.8 85.6 82.6 80.0应用标准化法时的应用标准化法时的注意事项注意事项n 当各比较组内部构成不同,并足以影响总当各比较组内部构成不同,并足以影响总率的比较时,应对率进行标准化后再作比较;率的比较时,应对率进行标准化后再作比较;n 率的标准化的目的是消除混杂因素影响,率的标准化的目的是消除混杂因素影响,使其具可比性;使其具可比性;n 各年龄组对应的率出现明显交叉时,宜各年龄组对应的率出现明显交叉时,宜分别比较各年龄组死亡率,而不用标准化进分别比较各年龄组死亡率,而不用标准化进行比较;行比较;n 如是抽样研究

16、,两样本标准化率的比较如是抽样研究,两样本标准化率的比较应作假设检验。应作假设检验。n 标准化率已不能反映率的实际水平,它标准化率已不能反映率的实际水平,它 只能表明相互比较资料间的相对水平;只能表明相互比较资料间的相对水平;n 选定的标准构成不同,所得的标准化率选定的标准构成不同,所得的标准化率 也不同,仅限于采用共同标准构成的组也不同,仅限于采用共同标准构成的组 间比较。间比较。统统 计计推推 断断统统 计计描描 述述统计分析统计分析第十六章第十六章 分类变量的统计分析分类变量的统计分析第第4-64-6节节 统计推断统计推断刘刘 颖颖预防医学教研室预防医学教研室1率的抽样误差和总体率的估计

17、率的抽样误差和总体率的估计2率的率的 u 检验检验3 检验检验2一、率的抽样误差和标准误一、率的抽样误差和标准误 率的抽样误差的大小用率的抽样误差的大小用率的标准误率的标准误表示。表示。第四节率的抽样误差和总体率的估计第四节率的抽样误差和总体率的估计1pn1pppSn例例16.5 欲了解某种新药对慢性乙型肝炎的疗欲了解某种新药对慢性乙型肝炎的疗效,对效,对100名患者进行治疗,其中名患者进行治疗,其中90人有效,人有效,试计算其标准误。试计算其标准误。10.9 1 0.90.03100pppSn一、正态近似法一、正态近似法适用条件:适用条件:np 和和 n(1-p)5 时,可根据近似正态分布时

18、,可根据近似正态分布 的原理估计其可信区间。的原理估计其可信区间。例例16.5 试求该新药有效率的试求该新药有效率的95%可信区间?可信区间?二、总体率的二、总体率的可信区间估计可信区间估计0.91.960.03 0.091.960.030.8412 0.9588ppuS,二、查表法二、查表法 适用条件:适用条件:n 50,特别是,特别是 p 接近接近 0 或或 1 时,时,此时资料呈二项分布,可按二项分布的原理估计总体此时资料呈二项分布,可按二项分布的原理估计总体率的可信区间。率的可信区间。一、样本率与总体率比较的一、样本率与总体率比较的u 检验检验目的:目的:推断样本率与总体率的差异是否仅

19、由抽样所推断样本率与总体率的差异是否仅由抽样所 致,其差异是否有统计学意义。致,其差异是否有统计学意义。总体率:总体率:一般是理论值、标准值或是经过大量观察一般是理论值、标准值或是经过大量观察 所得的稳定值。所得的稳定值。第五节率的第五节率的 u 检验检验u1pn其中:其中:为样本率为样本率 为总体率为总体率 n 为样本含量为样本含量p例例16.7 某地区一般人群中乙型肝炎的阳性率为某地区一般人群中乙型肝炎的阳性率为15%,现对该地区,现对该地区150名流浪者进行检查,其中阳名流浪者进行检查,其中阳性性30人,问当地流浪者的阳性率是否高于一般人群人,问当地流浪者的阳性率是否高于一般人群的阳性率

20、?的阳性率?本例样本率为本例样本率为50%,np 和和 n(1-p)5 时,可认为时,可认为呈近似正态分布,故可采用呈近似正态分布,故可采用 u 检验。检验。1.检验假设检验假设H0:,当地流浪者阳性率与一般人群相同,当地流浪者阳性率与一般人群相同H1:,当地流浪者阳性率高于一般人群,当地流浪者阳性率高于一般人群单侧单侧 00.1500.0 52.计算计算 u 值值 3.确定确定 P 值值 ,下结论,下结论 u=1.715 1.645,P 0.05,按,按a=0.05的检验水准,拒的检验水准,拒绝绝H0,接受,接受H1,认为当地流浪者的阳性率高于一般人群。,认为当地流浪者的阳性率高于一般人群。

21、0000.20.15u1.71510.15 1 0.15150pn目的:目的:推断两样本率是否来自同一总体。推断两样本率是否来自同一总体。适用条件:适用条件:样本率符合近似正态分布的条件样本率符合近似正态分布的条件(n 较大,且较大,且 P 和和 1-P 不太小,即不太小,即 np 和和 n(1-p)5时),可用率的时),可用率的 u 检验。检验。二、两样本率比较的二、两样本率比较的 u 检验检验1212u111ccppppnn 式中:式中:、为样本率,为样本率,n1、n2为样本例数,为样本例数,X1、X2为阳性例数,为阳性例数,为两样本合并率。为两样本合并率。cp1p12c12pXXnn2p

22、例例16.8 欲了解从事工农业生产的欲了解从事工农业生产的50岁以上人群高血岁以上人群高血压的情况,调查了首钢工人压的情况,调查了首钢工人1281人,高血压患者人,高血压患者386人,患病率为人,患病率为30.13%;石景山区农民;石景山区农民387人,高血人,高血压压患者患者65人,患病率为人,患病率为16.80%,试问从事工农业生产,试问从事工农业生产的的50岁以上人群高血压患病率有无差别?岁以上人群高血压患病率有无差别?本例两样本的乙肝携带人数均大于本例两样本的乙肝携带人数均大于5,故,故可采用样本率的可采用样本率的 u 检验。检验。1.建立检验假设建立检验假设 H0:H1:12120.

23、0 52.计算计算 u 值值 12c121212386 65p0.27041281 3870.3013 0.1685.1711110.2704 1 0.270411281 387ccXXnnppuppnn3.确定确定 P 值值 ,下结论,下结论 u=5.17 1.96,P 0.05,按,按 a=0.05 的检验的检验水准,拒绝水准,拒绝H0,接受,接受H1,从事工业生产和农业生从事工业生产和农业生产的产的50岁以上人群高血压患病率不同。岁以上人群高血压患病率不同。第六节第六节 检验检验 检验(检验(chi-square test)适用于:适用于:分类变量资料中两个或多个样本的总体率是否分类变量

24、资料中两个或多个样本的总体率是否相同相同,两个或多个样本的构成比是否相同,配对资,两个或多个样本的构成比是否相同,配对资料两种属性间的阳性率是否相等。料两种属性间的阳性率是否相等。22(一)四格表的(一)四格表的 检验检验基本思想基本思想 可用于两样本率的比较可用于两样本率的比较 表表16-7 四格表四格表 检验的检验的基本结构基本结构一、一、四格表四格表的的 检验检验22 处理处理 发生数发生数 未发生数未发生数 合计合计 A组组 a b a+b B组组 c d c+d 合计合计 a+c b+d n2nnnTCRRCncabaT11ndbbaT12ndccaT21ndbdcT22上表中第上表

25、中第 R 行、第行、第 C 列的理论频数为:列的理论频数为:因此:因此:如果四格表中实际的发生数用如果四格表中实际的发生数用 A 来表示,来表示,可通过下式计算可通过下式计算 值:值:2TTA22基本思想:实际频数与理论频数吻合程度基本思想:实际频数与理论频数吻合程度。在检验假设成立的情况下,在检验假设成立的情况下,A 与与 T 之差一般不之差一般不会很大,此时会很大,此时 值也较小;反之,值也较小;反之,值较大。值较大。检验的检验的自由度:自由度:v=(行数(行数-1)(列数)(列数-1)22例例16.9 某医生欲比较某医生欲比较A、B两种药物治疗老年期抑两种药物治疗老年期抑郁症的效果,将病

26、情相近的郁症的效果,将病情相近的60名患者随机分成两名患者随机分成两组,分别用两种药物进行治疗,结果见表组,分别用两种药物进行治疗,结果见表16-6,问,问两种药物治疗效果是否有差别?两种药物治疗效果是否有差别?(二)四格表的(二)四格表的 检验的检验的基本步骤基本步骤2表表16-6 A、B两种药物的疗效比较两种药物的疗效比较 分组分组 有效例数(有效例数(%)无效例数(无效例数(%)合计合计 A 19(63.33)11(36.67)30 B 15(50.00)15(50.00)30 合计合计 34(56.67)26(43.33)601.建立检验假设建立检验假设 H0:H1:12120.0 5

27、2.计算计算 统计量统计量 计算各理论频数:计算各理论频数:21130341760T1230261360T2130341760T2230261360T22222219 1711 1315 1715 13171317131.09A TT3.确定确定 P 值值 ,下结论,下结论 v=(行数(行数-1)(列数)(列数-1)=1 按按 v=1,查,查 界值表,界值表,故,故 P0.05,按,按 a=0.05 的水准,的水准,不拒绝不拒绝H0,说明两种药物治疗效果差异无统,说明两种药物治疗效果差异无统计学意义。计学意义。2 84.32105.0 220.05 1(三)四格表的(三)四格表的 检验的检验的

28、专用公式专用公式2dbcadcbabcad2222A TT(16-13)(16-15)(四)四格表的(四)四格表的 检验的检验的应用条件应用条件 P3262n T5 且且 n40 时,非连续性校正时,非连续性校正n 1T5 且且 n40时,连续性校正时,连续性校正n T1 或或 n 40时,确切概率法时,确切概率法22(五)四格表的(五)四格表的 检验的检验的连续性校正连续性校正2dbcadcbannbcad222TTA225.0(16-16)(16-17)例例16-922219 15 11 156030 30 34 261.09adbcabcdacbd3.确定确定 P 值值 ,下结论,下结论

29、 v=(行数(行数-1)(列数)(列数-1)=1 按按 v=1,查,查 界值表,界值表,故,故 P0.05,按,按 a=0.05 的水准,的水准,不拒绝不拒绝H0,说明两种药物治疗老年期抑郁症,说明两种药物治疗老年期抑郁症差异无统计学意义。差异无统计学意义。2 84.32105.0 220.05 1例例16.10 脑胶质瘤患者脑胶质瘤患者43人,人,28例采用手术、例采用手术、15例采用放疗方法进行治疗(表例采用放疗方法进行治疗(表16-8),试),试比较两种治疗方法治疗后出现的脑功能损伤比较两种治疗方法治疗后出现的脑功能损伤发生率有无差异?发生率有无差异?表表16-8 两种疗法治疗患者脑功能

30、损伤率比较两种疗法治疗患者脑功能损伤率比较治疗方法治疗方法 有有 无无 合计合计 手术手术 22 6 28 放疗放疗 7 8 15 合计合计 29 14 43 22224 32 28674 323.1 92 82 91 51 4na db cnabcdacbd2215144.8843T校正校正 表表 16-9 配对配对22列联表基本结构列联表基本结构二、二、配对配对四格表四格表 检验检验2 乙属性乙属性 +a b a+b c d c+d 合计合计 a+c b+d n甲属性甲属性合合 计计计算公式计算公式:b+c 40 时时,b+c40 时时,应作连续性校正应作连续性校正 检验检验222bcbc

31、221bcbc(16-18)(16-19)例例16.11 有有50份痰液标本,每份分别接种份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌的在甲、乙两种培养基中,观察结核杆菌的生长情况,结果如表生长情况,结果如表16-10,试比较两种培,试比较两种培养基的效果?养基的效果?表表 16-10 甲、乙两种培养基培养效果比较甲、乙两种培养基培养效果比较 乙培养基乙培养基 +27 12 39 3 8 11 合计合计 30 20 50甲培养基甲培养基合合 计计1.检验假设检验假设 H0:总体:总体B=C,两种培养基阳性率相同,两种培养基阳性率相同 H1:总体:总体BC,两种培养基阳性率不同,两

32、种培养基阳性率不同0.0 52.计算计算 统计量统计量 分析:分析:由于由于 b+c=12+3=15 40,可得可得 v=(行数(行数-1)(列数)(列数-1)=122212314.271233.确定确定 P 值值 ,下结论,下结论 P0.05,按,按 a=0.05 的水准,拒绝的水准,拒绝H0,接受接受H1,可以认为两种培养基的阳性率不同。,可以认为两种培养基的阳性率不同。三、行三、行列表列表 检验检验2 当行和当行和/或列大于或列大于 2 时时,称为行称为行列表列表,又称为又称为 RC 表。表。专用公式专用公式:22Rn1nnCA式中式中:n为总例数为总例数,A 为每个格子的实际数为每个格

33、子的实际数,nR、nC分别为某格子实际数分别为某格子实际数 A 对应的行合计和列合计。对应的行合计和列合计。例例16.12 某预防医学研究人员调查了某预防医学研究人员调查了343例例离退休老人的生活满意度和家庭关系,结果离退休老人的生活满意度和家庭关系,结果如表如表16-11所示,试分析家庭关系类型与老人所示,试分析家庭关系类型与老人生活满意度的关系。生活满意度的关系。(一)多个率比较(一)多个率比较 表表 16-11 离退休老人家庭关系与生活满意度离退休老人家庭关系与生活满意度家庭关系家庭关系 满意满意 不满意不满意 合计合计 满意率满意率(%)和睦和睦 174 60 234 74.36 一

34、般一般 36 57 93 38.71 差差 6 10 16 37.50 合计合计 216 127 343 62.971.检验假设检验假设 H0:三种不同家庭关系的老人生活满意度相等:三种不同家庭关系的老人生活满意度相等 H1:三种不同家庭关系的老人生活满意度不同:三种不同家庭关系的老人生活满意度不同 或不全相同或不全相同0.0 52.计算统计量计算统计量 22R222n1nn1746010343.1234 216234 12716 12740.94CAn=343,且所有,且所有T53.确定确定 P 值值 ,下结论,下结论 v=(R-1)(C-1)=(3-1)(2-1)=2,查查 界值表,界值表

35、,P0.05,按,按 a=0.05 的水准,拒绝的水准,拒绝H0,接受,接受H1,三种不同家庭关系类型的老人生活满,三种不同家庭关系类型的老人生活满意度不同,家庭和睦老人生活满意率最高。意度不同,家庭和睦老人生活满意率最高。2 20.05 25.99例例16.13 某研究者欲研究汉族、回族和满族某研究者欲研究汉族、回族和满族居民职业分布情况,从三个民族居民中抽居民职业分布情况,从三个民族居民中抽样,分别调查了样,分别调查了145、97和和99人,调查结果见人,调查结果见表表16-12。问三个民族职业构成是否不同?。问三个民族职业构成是否不同?(一)多个构成比比较(一)多个构成比比较 表表 16

36、-12 三个民族居民的职业分布三个民族居民的职业分布民族民族 干部干部 工人工人 农民农民 其他其他 合计合计 汉族汉族 20 56 62 7 145回族回族 14 40 32 11 97满族满族 18 28 45 8 99合计合计 52 124 139 26 3411.检验假设检验假设 H0:三个民族职业构成比分布相同:三个民族职业构成比分布相同 H1:三个民族职业构成比分布不同或不全相同:三个民族职业构成比分布不同或不全相同0.0 52.计算统计量计算统计量 22R222n1nn20568341.1145 52145 12499 268.802CAn=341,且所有,且所有T53.确定确定

37、 P 值值 ,下结论,下结论 v=(R-1)(C-1)=(3-1)(4-1)=6,查查 界值表,界值表,P0.05,按,按 a=0.05 的水准,不拒绝的水准,不拒绝H0,尚不能认为三个民族居民的职业总体构成不同。,尚不能认为三个民族居民的职业总体构成不同。2 20.05 612.59行行列表列表 检验的检验的注意事项注意事项n RC 表中不宜有表中不宜有1/5的格子小于的格子小于5,或者有或者有一个格子的理论频数小于一个格子的理论频数小于1。处理方法处理方法:增大样本例数增大样本例数;删除理论数较删除理论数较小的行和列小的行和列;将理论数较小的行或列与性质将理论数较小的行或列与性质相近的行或

38、列合并。相近的行或列合并。2n 对于单向有序序列的行对于单向有序序列的行列表列表,如比较如比较两种药物治疗某病的疗效两种药物治疗某病的疗效,其结果为痊愈、其结果为痊愈、有效有效、无效、无效,用用 检验只能比较两种药物检验只能比较两种药物疗效的构成情况疗效的构成情况,若比较两种药物的疗效是若比较两种药物的疗效是否相同否相同,则需要用秩和检验。则需要用秩和检验。2n 多个样本率或构成比的多个样本率或构成比的 检验,结果为检验,结果为拒绝拒绝 H0 时,只能认为各总体率或各总体构时,只能认为各总体率或各总体构成比之间总的来说有差异,但不能说明他们成比之间总的来说有差异,但不能说明他们彼此间都有差异,

39、或某两两间有差别。可采彼此间都有差异,或某两两间有差别。可采用用 分割法。分割法。22基本概念基本概念n 总体与样本总体与样本n 变量与变量值变量与变量值n 参数与统计量参数与统计量n 误差误差n 概率概率复习复习统计资料的类型统计资料的类型n 数值变量资料数值变量资料n 分类变量资料分类变量资料n 变量间的转化变量间的转化统计工作的基本步骤统计工作的基本步骤 统计设计统计设计 收集资料收集资料 整理资料整理资料 分析资料分析资料统计描述统计描述资料类型资料类型二分类二分类多分类多分类分类变量分类变量数值变量数值变量有序分类变量有序分类变量无序分类变量无序分类变量分类变量资料分类变量资料的统计

40、分析的统计分析统计推断统计推断u u检验、检验、检验检验2参数估计参数估计假设检验:假设检验:频数分布频数分布集中趋势指标集中趋势指标离散趋势指标离散趋势指标医学参考值范围估计医学参考值范围估计数值变量资料数值变量资料的统计分析的统计分析统计描述统计描述统计推断统计推断u u检验检验t t检验检验方差分析方差分析统计描述统计描述 相对数相对数参数估计参数估计假设检验假设检验1.总体是由总体是由()组成。组成。A.部分个体部分个体 B.全部对象全部对象 C.全部个体全部个体 D.同质个体的所有观察值同质个体的所有观察值 E.相同的观察指标相同的观察指标2.抽样的目的是(抽样的目的是()。)。A.

41、研究样本统计量研究样本统计量 B.由样本统计量推断总体参数由样本统计量推断总体参数 C.研究典型案例研究典型案例 D.研究总体统计量研究总体统计量 E.研究特殊个体的特征研究特殊个体的特征3.参数是指参数是指()。A.参与个体数参与个体数 B.总体中研究对象的总和总体中研究对象的总和 C.样本的样本的统计指标统计指标 D.样本的总和样本的总和 E.总体的统计指标总体的统计指标巩固题巩固题4.反映计量资料平均的指标是(反映计量资料平均的指标是()。)。A.频数频数 B.参数参数 C.百分位数百分位数 D.平均数平均数 E.统计量统计量5.表示总体均数的符号是表示总体均数的符号是()。A.B.C.

42、X D.S E.M6.下列指标中,不属于集中趋势指标的是(下列指标中,不属于集中趋势指标的是()。)。A.均数均数 B.中位数中位数 C.百分位数百分位数 D.几何均数几何均数 E.众数众数7.一些以老年人为主的慢性病患者,年龄分布的集中位置一些以老年人为主的慢性病患者,年龄分布的集中位置偏向于年龄大的一侧,称为(偏向于年龄大的一侧,称为()。)。A.正偏态分布正偏态分布 B.负偏态分布负偏态分布 C.对数正态分布对数正态分布 D.正态分布正态分布 E.对称分布对称分布8.下面的变量中,属于分类变量的是下面的变量中,属于分类变量的是 。A 脉搏脉搏 B 血型血型 C 肺活量肺活量 D 红细胞计

43、数红细胞计数 E 血压血压9.两组呈正态分布的定量资料,均数相差悬殊,若比较离两组呈正态分布的定量资料,均数相差悬殊,若比较离散趋势,最好选用的指标为散趋势,最好选用的指标为 。A 全距全距 B 四分位数间距四分位数间距 C 方差方差 D 标准差标准差 E 变异系数变异系数10均数与标准差之间的关系是均数与标准差之间的关系是A标准差越小,均数代表性越大标准差越小,均数代表性越大 B标准差越小,均数代表性越小标准差越小,均数代表性越小C均数越大,标准差越小均数越大,标准差越小 D均数越大,标准差越大均数越大,标准差越大E标准差越大,均数代表性越大标准差越大,均数代表性越大11.以舒张压以舒张压1

44、2.7KPa为高血压,测量为高血压,测量1000人,结果有人,结果有990名非高血压患者,有名非高血压患者,有10名高血压患者,该资料属()名高血压患者,该资料属()资料。资料。A、计算、计算 B、计数、计数 C、计量、计量 D、等级、等级 E、都对、都对12.描述计量资料的主要统计指标是描述计量资料的主要统计指标是:A.平均数平均数 B.相对数相对数 C.t值值 D.标准误标准误 E.概率概率13.测得测得10名乳腺癌患者化疗后血液尿氮含量(名乳腺癌患者化疗后血液尿氮含量(mmol/L)分分别为别为3.43,2.96,4.43,3.03,4.53,5.25,5.64,3.82,4.28,5.

45、25,试问试问:(1)该资料是总体资料还是样本资料?该资料是总体资料还是样本资料?(2)其总体的同质基础是什么?其总体的同质基础是什么?(3)要表达资料的平均水平,该选用什么统计指标?要表达资料的平均水平,该选用什么统计指标?1.下列指标,属于绝对数的是:。A 甲区的急性传染病人数为乙区的1.25倍 B 甲区某年急性传染病的发病率为382/10万 C 甲区占某市急性传染病的比重为18%D 某区某男身高为168厘米 E 以上都不是2.男性人口数/女性人口数,这一指标为:A率 B构成比 C相对比 D动态数列 E不是相对数3.构成比 。A 反映事物发生的强度 B 反映了某一事物内部各部分与全部构成的

46、比重 C 既反映了A也反映了B D 表示两个同类指标之比 E 以上都不是1均数和标准差可全面描述(均数和标准差可全面描述()资料的特征)资料的特征。A 所有分布形式所有分布形式 负偏态分布负偏态分布 正偏态分布正偏态分布 正态分布和近似正态分布正态分布和近似正态分布 2血清学滴度资料最常计算血清学滴度资料最常计算()以表示其平均水平。以表示其平均水平。A均数均数 B中位数中位数 C几何均数几何均数 D全距全距 E标准差标准差3比较身高与体重两组数据变异大小宜采用(比较身高与体重两组数据变异大小宜采用()A 变异系数变异系数 B 方差方差 C 标准差标准差 D 四分位间距四分位间距 4两组呈正态

47、分布的数值变量资料,但均数相差悬两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为殊,若比较离散趋势,最好选用的指标为()A全距全距 B四分位数间距四分位数间距 C方差方差 D标准差标准差 E变异系数变异系数5 应用(应用()指标描述最小组段无下限或最大组段)指标描述最小组段无下限或最大组段无上限的频数分布。无上限的频数分布。A 算术均数算术均数 B 中位数中位数 C 几何均数几何均数 D 全距全距 E 标准差标准差6 描述一组偏态分布资料的变异度,以(描述一组偏态分布资料的变异度,以()指标)指标较好。较好。A 全距全距 B 标准差标准差 C 变异系数变异系数 D

48、 四分位数间距四分位数间距 E 均数均数7.频数分布的两个重要特征是:频数分布的两个重要特征是:A.统计量与参数统计量与参数 B.样本均数与总体均数样本均数与总体均数C.集中趋势与离散趋势集中趋势与离散趋势 D.正态分布与偏态分布正态分布与偏态分布E.样本与总体样本与总体8.以下指标中(以下指标中()可以用来描述计量资料的离散)可以用来描述计量资料的离散程度。程度。A.算术均数算术均数 B.中位数中位数 C.几何均数几何均数 D.众数众数 E.全距全距编号编号 性别性别 年龄年龄 身高(身高(cm)坐高(坐高(cm)血型血型 表面抗原表面抗原 肝大肝大1 男男 7 116.7 66.3 A +

49、2 女女 8 120.0 68.3 AB 3 女女 10 126.8 71.5 O +4 男男 9 123.7 70.0 A .若干名儿童健康检查部分检测指标若干名儿童健康检查部分检测指标问:问:1.1.上述变量中能形成计数资料的指标有:上述变量中能形成计数资料的指标有:2.2.计量资料的指标有:计量资料的指标有:3.3.等级资料的指标有:等级资料的指标有:4.4.对于身高或坐高指标,在进行统计描述时宜计算(对于身高或坐高指标,在进行统计描述时宜计算()和()和()表示)表示 其集中趋势和离散趋势?其集中趋势和离散趋势?例例1 现有现有10名女大学生的口腔温度(名女大学生的口腔温度()分别为:

50、分别为:36.7、36.8、36.8、37.0、37.1、37.2、37.1、37.0、36.9、37.3,分析,分析其平均温度及离散程度。其平均温度及离散程度。例例2 有有7份血清的抗体效价为:份血清的抗体效价为:1:2,1:4,1:8,1:32,1:32,1:64,1:64,求其平均,求其平均效价。效价。例例3 某传染病患者某传染病患者 10 例,他们的潜伏期例,他们的潜伏期分别为:分别为:4、4、5、5、6、7、7、9、12、20天,求传染病患者的平均潜伏期。天,求传染病患者的平均潜伏期。200个血铅测量值个血铅测量值例例4 200 个血铅平均值个血铅平均值组段组段 频数频数f 累计频数

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(分类变量资料统计分析讲义课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|