1、2022-8-131第十第十章章黄志刚公共卫生学院流行病与统计教研室2022-8-132例例:某医生为研究一种降糖新药的疗效,以统一的某医生为研究一种降糖新药的疗效,以统一的纳入标准和排除标准选择了纳入标准和排除标准选择了60名名2型糖尿病患者,型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临按完全随机设计方案将患者分为三组进行双盲临床试验。其中,床试验。其中,降糖新药高剂量组降糖新药高剂量组21人、低剂量人、低剂量组组19人、对照组人、对照组20人人。对照组服用公认的降糖药。对照组服用公认的降糖药物,治疗物,治疗4周后测得其餐后周后测得其餐后2小时血糖的下降值小时血糖的下降值(mmo
2、l/L),结果如表,结果如表9-1所示。所示。问治疗问治疗4周后,餐后周后,餐后2小时血糖下降值的三组总体小时血糖下降值的三组总体平均水平是否不同?平均水平是否不同?2022-8-1332022-8-134不能用t检验分析两组以上多个均数的比较 1、与资料最初的设计要求不符、与资料最初的设计要求不符 2、增加犯第一类错误的概率、增加犯第一类错误的概率2022-8-1352022-8-136实例演示样本编号 S112.614.29210.855.4439.233.9349.116.55510.94.8369.244.8679.553.88810.283.8999.125.38108.754.08
3、从已知从已知正态总体正态总体N(10,52)随机抽取随机抽取10个样本(个样本(ni=10)的结果)的结果X2022-8-137比较组tP1与32.0610.0131与62.3290.0251与72.3720.0231与92.2720.0291与102.9180.00645次比较中5次有统计学意义的结果实际犯第一类错误的概率:实际犯第一类错误的概率:5/45=0.112022-8-138Analysis of Variance Analysis of Variance(ANOVAANOVA)由英国统计学)由英国统计学家家R.A.FisherR.A.Fisher首创,为纪首创,为纪念念Fishe
4、rFisher,以,以F F命名,故方命名,故方差分析又称差分析又称F F 检验检验 (F F testtest)。用于推断)。用于推断多个总多个总体均数体均数有无差异有无差异.2022-8-139 方差分析的含义方差分析的含义 方差方差是描述研究对象变异程度的一种指标是描述研究对象变异程度的一种指标 方差分析是一种假设检验的方法,就是对变异方差分析是一种假设检验的方法,就是对变异的分析的分析 用于两组或两组以上多个均数之间的比较用于两组或两组以上多个均数之间的比较第一节 方差分析的基本思想和应用条件2022-8-1310 例例:某研究者为研究煤矿粉尘作业环境对尘肺的影响,将某研究者为研究煤矿
5、粉尘作业环境对尘肺的影响,将24只只Wistar 大鼠随机分到甲、乙、丙三个组,每组大鼠随机分到甲、乙、丙三个组,每组8只,只,分别在地面分别在地面办公楼、煤炭仓库和矿井下染尘,办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重周后测量大鼠全肺湿重,三组三组大鼠的全肺湿重有无差别?大鼠的全肺湿重有无差别?2022-8-1311 样本均数的差异,可能有两种原因所致样本均数的差异,可能有两种原因所致:1 1、可能由随机误差所致,随机误差包括两种、可能由随机误差所致,随机误差包括两种成分成分个体间的变异个体间的变异和测量误差和测量误差两部分;两部分;2 2、可能是由于各组所接受的处理不同,不同、
6、可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组的处理引起不同的作用和效果,导致各处理组之间均数不同。之间均数不同。2022-8-1312 方差分析的基本思想方差分析的基本思想:将所有观察值之间的变异(称总变异)根据离将所有观察值之间的变异(称总变异)根据离均差平方和划分的原理,按设计和需要分解成均差平方和划分的原理,按设计和需要分解成两个或多个部分。每一部分变异都反映了研究两个或多个部分。每一部分变异都反映了研究工作中某种特定的内容(如某种处理因素的作工作中某种特定的内容(如某种处理因素的作用、随机误差的影响等),通过对平均变异的用、随机误差的影响等),通过对平均
7、变异的比较,做出相应的统计判断。比较,做出相应的统计判断。2022-8-1313总变异(总变异(Total variation):全部测量值与总均数):全部测量值与总均数 间的差别间的差别 组间变异(组间变异(between group variation)各组的均数各组的均数 与总均数与总均数 间的差异间的差异组内变异(组内变异(within group variation)每组的每组的8个测量值个测量值(观察值)与该组均数(观察值)与该组均数 的差异的差异 XXiXiXijXX2022-8-1314 24只大鼠的全肺湿重大小各不相等,它们之间只大鼠的全肺湿重大小各不相等,它们之间的变异称为
8、总变异。的变异称为总变异。用每个观察值与总均数的离均差平方和来表示,用每个观察值与总均数的离均差平方和来表示,称为总离均差平方和称为总离均差平方和SS总总2()1 (9-1)ijijSSxxN总总 1.总变异总变异SSSS组间组间反映了反映了各组均数各组均数 间的变异程度间的变异程度组间变异组间变异随机误差随机误差+处理因素效应处理因素效应 2.组间变异组间变异iXm mi m mj2()1 (9-2)iiiSSn xxk 组间组间在同一处理组内,虽然在同一处理组内,虽然每个受试对象接受的处每个受试对象接受的处理相同,但测量值仍各理相同,但测量值仍各不相同,这种变异称为不相同,这种变异称为组内
9、变异。组内变异。SSSS组内组内仅仅反映了仅仅反映了随机误随机误差差的影响。也称的影响。也称SSSS误差误差3.组内变异组内变异 m m i2()(1)(9-3)ijiiijiSSxxnN k组内组内三种三种“变异变异”之间的关系之间的关系均方均方(mean square,MS)均方之比均方之比F 值值2022-8-1320方差分析的检验假设:方差分析的检验假设:H H0 0:为各样本来自均数相等的总体:为各样本来自均数相等的总体 H H1 1:为各总体均数不等或不全相等:为各总体均数不等或不全相等 如果组间变异与组内变异相等,两者的比值如果组间变异与组内变异相等,两者的比值即统计量即统计量F
10、 F为为1 1;由于存在抽样误差,两者往往不;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量恰好相等,但相差不会太大,统计量F F应接近于应接近于1 1。因此不拒绝因此不拒绝H H0 0,可认为各样本均数间的差异,是由,可认为各样本均数间的差异,是由于抽样误差所致,而不是由于处理因素的作用所于抽样误差所致,而不是由于处理因素的作用所致。致。2022-8-1321如果各样本均数间的差异,不仅是由抽样误差所如果各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远大致,还有处理因素的作用。此时的组间变异远大于组内变异,两者的比值即统计量于组内变异,两者的比值即
11、统计量F F 明显大于明显大于1 1。因此就要拒绝因此就要拒绝H H0 0,接受,接受H H1 1,可认为各样本均数间,可认为各样本均数间的差异,并不是由于抽样误差所致,而是处理因的差异,并不是由于抽样误差所致,而是处理因素的作用。素的作用。2022-8-1322 F值要大到何种程度才有统计学意义呢?即,F值要大到何种程度才能认为各组均数间的各组均数间的差异差异是由处理因素处理因素引起而非随机误差呢?可以通过查F界值表,确定P值作出统计推断 附表附表7(F界值表)P341F 界值表界值表附表附表7 7 F F界值表(方差分析用,单侧界值)界值表(方差分析用,单侧界值)上行:上行:P P=0.0
12、5 =0.05 下行:下行:P P=0.01=0.01分母自由度分母自由度2 2分子的自由度,分子的自由度,1 11 12 23 34 45 56 6 1 1161161200200216216225225230230234234 405240524999499954035403562556255764576458595859 2 218.5118.5119.0019.0019.1619.1619.2519.2519.3019.3019.3319.33 98.4998.4999.0099.0099.1799.1799.2599.2599.3099.3099.3399.33 25254.244.
13、243.393.392.992.992.762.762.602.602.492.49 7.777.775.575.574.684.684.184.183.853.853.633.63 72022-8-13242022-8-13252022-8-1326 方差分析的基本思想方差分析的基本思想 将将总变异总变异分解为分解为组间变异组间变异和和误差(组内)变异误差(组内)变异,然后比较两者的均方,即计算然后比较两者的均方,即计算F值值,若,若F值大于某值大于某个临界值,表示处理组间的效应不同,若个临界值,表示处理组间的效应不同,若F值接近值接近1时,表示处理组间效应相同时,表示处理组间效应相同(差异
14、仅仅由随机原因差异仅仅由随机原因所致所致)。对于不同设计的方差分析,其基本思想都一样,对于不同设计的方差分析,其基本思想都一样,即均将处理间平均变异与误差平均变异比较。不即均将处理间平均变异与误差平均变异比较。不同之处在于同之处在于变异分解的项目变异分解的项目因设计不同而异。因设计不同而异。2022-8-1327 方差分析的应用条件:方差分析的应用条件:各样本须是相互独立的随机样本(各样本须是相互独立的随机样本(独立性独立性)各样本来自正态分布总体(各样本来自正态分布总体(正态性正态性)各总体方差相等(各总体方差相等(方差齐性方差齐性)2022-8-13282022-8-1329正态分布的判断
15、方法正态分布的判断方法利用利用频数表或频数图频数表或频数图进行判断进行判断 根据专业知识判断:根据专业知识判断:疾病的潜伏期、住院天数和疾病的潜伏期、住院天数和 临床生化指标大多为偏态临床生化指标大多为偏态 经验判断经验判断 若若 ,可认为资料呈偏态分布,可认为资料呈偏态分布 若若 ,则有理由怀疑资料呈偏态分布,则有理由怀疑资料呈偏态分布 正态性检验正态性检验(W检验、检验、D检验)检验)XS3XS 2022-8-1330方差齐性的判断方法方差齐性的判断方法 经验判断经验判断 S2MAX/S2MIN5,认为方差不齐;,认为方差不齐;否则认为方差齐性。否则认为方差齐性。方差齐性检验方差齐性检验
16、2022-8-1331 方差分析的用途:方差分析的用途:两个或多个样本均数间的比较两个或多个样本均数间的比较 分析两个或多个因素间的交互作用分析两个或多个因素间的交互作用 回归方程的线性假设检验回归方程的线性假设检验 多元线性回归分析中偏回归系数的假设检验多元线性回归分析中偏回归系数的假设检验 两样本的方差齐性检验等两样本的方差齐性检验等2022-8-1332第二节 完全随机设计的方差分析 完全随机设计(完全随机设计(completely random design)又称成组设计又称成组设计 在实验研究中,按随机化原则将受试对象随机在实验研究中,按随机化原则将受试对象随机分配到某一研究因素的多
17、个水平中去,然后观分配到某一研究因素的多个水平中去,然后观察实验效应;察实验效应;在调查研究中,按一个研究因素的不同水平分在调查研究中,按一个研究因素的不同水平分组,比较各组的效应。组,比较各组的效应。2022-8-1333临床研究中,还可能遇到:临床研究中,还可能遇到:比较几种不同疗法治疗某种疾病后某指标的变化,比较几种不同疗法治疗某种疾病后某指标的变化,以评价它们的疗效;以评价它们的疗效;比较某种疾病不同类型之间某一指标有无差别等比较某种疾病不同类型之间某一指标有无差别等均属于一个因素不同水平间几个样本均数的比较,均属于一个因素不同水平间几个样本均数的比较,可用单因素的方差分析(可用单因素
18、的方差分析(one-way ANOVAone-way ANOVA)来处)来处理此类资料理此类资料。2022-8-1334 处理(研究)因素和水平处理(研究)因素和水平 研究因素:血型研究因素:血型 不同水平:不同水平:A B AB O 处理因素:药物处理因素:药物 不同水平:同一药物的不同剂量不同水平:同一药物的不同剂量 不同药物不同药物 判断原则:判断原则:在统计学上,仅当实验条件有在统计学上,仅当实验条件有2种或种或2种以上的具体表种以上的具体表现时,才称其为现时,才称其为“因素因素”,其具体表现称为,其具体表现称为“水平水平”。2022-8-1335例题2022-8-1336 随机分组方
19、法随机分组方法:1.编号编号,确定分组方案(如较小确定分组方案(如较小12个随机数为个随机数为A组组,中间中间12个数为个数为B组,较大组,较大12个随机数为个随机数为C组)组)2.产生随机数字(查表或电脑),排序产生随机数字(查表或电脑),排序 3.按方案分组按方案分组2022-8-1337方差分析的步骤 建立假设建立假设 H0:1=2=3(三组大鼠(三组大鼠NO含量总体均数相等)含量总体均数相等)H1:1、2、3不等或不全相等不等或不全相等 a=0.052022-8-1338 计算统计量计算统计量2022-8-1339 列出方差分析表2022-8-1340 做出统计推断:做出统计推断:查附
20、表查附表7可知,本例可知,本例F=5.564F0.015.32,P0.01。按按a=0.05水准,拒绝水准,拒绝H0,接受,接受H1,认为三组,认为三组的差别具有统计学意义,即可以认为三组的的差别具有统计学意义,即可以认为三组的NO水平不同或不全相同。水平不同或不全相同。2022-8-1341第三节随机区组设计的方差分析2022-8-1342随机区组设计随机区组设计randomized block design 又称为配伍组设计,是配对设计的扩展。具又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、
21、病情、病程、动物窝性别、体重、年龄、职业、病情、病程、动物窝别等)将受试对象配成区组别等)将受试对象配成区组(block)(block),再分别将,再分别将各区组内的受试对象随机分配各区组内的受试对象随机分配到各处理或对照组到各处理或对照组2022-8-1343 随机区组设计的特点随机区组设计的特点 是随机分配的次数要重复多次,每次随机分配是随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。理组受试对象数量相同,区组内均衡。2022-8-13442022-8-13452022-8-134620
22、22-8-1347 变异分解变异分解 总变异:总变异:所有观察值之间的变异所有观察值之间的变异 处理间变异:处理因素随机误差处理间变异:处理因素随机误差 区组间变异:区组因素随机误差区组间变异:区组因素随机误差 误差变异:误差变异:随机误差随机误差2022-8-1348 随机区组设计总变异总变异SS总总和处理组间变异处理组间变异 SS组间组间的计算与完全随机设计的方差分析相同 SS区组 的计算:2()1 (9-7)jjjSSn xxb 区 组区 组8)-(9 )1/(bSSMS区组区组2022-8-1349 数理统计上可以证明,随机区组设计的总变异和自由度可以分解为三部分:SSSSSSSS处理
23、区组总误差处理总区组误差2022-8-13502022-8-1351随机区组设计方差分析的步骤 1、建立假设,确定检验水准、建立假设,确定检验水准 对于处理组对于处理组 H0:1=2=3(即即3种营养素对小白鼠体重增加作用相同种营养素对小白鼠体重增加作用相同)H1:1、2、3不等或不全相等不等或不全相等 a=0.05对于区组对于区组 H0:十个区组的总体均数相等十个区组的总体均数相等 H1:十个区组的总体均数不等或不全相等十个区组的总体均数不等或不全相等 a=0.052022-8-13522022-8-13532022-8-13542022-8-1355 随机区组设计的方差分析随机区组设计的方
24、差分析 总变异总变异 和完全随机设计的方差分析相比,误差减和完全随机设计的方差分析相比,误差减小了,统计检验效率提高了。小了,统计检验效率提高了。处理组间变异处理组间变异区组间变异区组间变异误差误差组内变异组内变异2022-8-1356第四节 多个样本均数的两两比较 常用的两种方法:常用的两种方法:SNK(Student-Newman-Keuls)检验)检验 也称也称q检验,检验,适用于探索性研究,对任意两个样适用于探索性研究,对任意两个样本均数都进行检验本均数都进行检验。LSD-t(least significant difference)最小显著)最小显著性差异检验性差异检验 适用于多个处
25、理组与对照组的比较,或某几个处适用于多个处理组与对照组的比较,或某几个处理组间的比较。理组间的比较。2022-8-1357 SNK-q 检验检验 检验统计量q的计算公式为:(9-10)11()2ABABABxxABxxxxqSMSnn 误差误差 式中式中 为两个对比组的样本均数,为两个对比组的样本均数,是方差分析中的误差均方(或组内均方),是方差分析中的误差均方(或组内均方),为两对比组的样本例数。为两对比组的样本例数。v v误差误差 为方差分析中误差均方的自由度。为方差分析中误差均方的自由度。BAxx,误差MSBAnn,2022-8-1358 例例:某研究者为研究煤矿粉尘作业环境对尘肺的影响
26、,将24只Wistar 大鼠随机分到甲、乙、丙三个组,每组8只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重,三组大鼠的全肺湿重有无差别?2022-8-13592022-8-13602022-8-13612022-8-13622022-8-1363 3.确定确定P值,做出统计推断值,做出统计推断 q界值不但考虑自由度,而且考虑组数a,即任意两对比组包含的组数。以组数组数a 和 查附表8(q 界值表)。21误差2022-8-1364 LSD-t检验检验 适用于多个处理组与对照组的比较,或某几个处理组间的比较,一般在设计阶段设计阶段确定哪些均数需进行多重比较。检验统计量t值的计
27、算公式为:(9-11)11()ABABABxxABxxxxtSMSnn 误 差误 差2022-8-1365L S D-t 检检 验验 公公 式式 与与 两两 样样 本本 均均数数 比比 较较 的的t 检检 验验 公公 式式 区区 别别 在在 于于 两两样样 本本 均均 数数 差差 值值 的的 标标 准准 误误ijXXS和和自自 由由 度度 的的 计计 算算 上上。2022-8-1366在两样本均数比较的 t 检验公式里是用合并方差2cS来计算ijXXS,=n1+n22;LSD-t 检验是用方差分析表中的误差均方误差MS来计算ijXXS,=误差。2022-8-13672022-8-13682022-8-13692022-8-1370小 结 方差分析的基本思想方差分析的基本思想 完全随机设计方差分析完全随机设计方差分析 随机区组设计方差分析随机区组设计方差分析 多个样本均数的两两比较方法:多个样本均数的两两比较方法:SNK(Student-Newman-Keuls)q检验检验 LSD-t(least significant difference)最小显著)最小显著性差异检验性差异检验
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。