医学统计学(方差分析)课件.ppt

上传人(卖家):晟晟文业 文档编号:5157075 上传时间:2023-02-15 格式:PPT 页数:62 大小:2.28MB
下载 相关 举报
医学统计学(方差分析)课件.ppt_第1页
第1页 / 共62页
医学统计学(方差分析)课件.ppt_第2页
第2页 / 共62页
医学统计学(方差分析)课件.ppt_第3页
第3页 / 共62页
医学统计学(方差分析)课件.ppt_第4页
第4页 / 共62页
医学统计学(方差分析)课件.ppt_第5页
第5页 / 共62页
点击查看更多>>
资源描述

1、样本样本(一勺)(一勺)总体总体(一锅)(一锅)统计推断统计推断随机抽样随机抽样参数?参数?统计量统计量参数估计参数估计假设检验假设检验第第6章章均方分析,变异数分均方分析,变异数分析析,F 检验检验(由英国著名由英国著名统计学家统计学家R.A.Fisher推导推导出来的)出来的),是对变异的是对变异的来源及大小进行分析来源及大小进行分析的一种统计方法。的一种统计方法。教学目的与要求教学目的与要求 n掌握:掌握:1、方差分析的基本思想、方差分析的基本思想2、方差分析前提条件、方差分析前提条件3、多重比较、多重比较4、重复测量资料方差分析、重复测量资料方差分析n了解:了解:1、两因素方差分析、两

2、因素方差分析 教学内容提要教学内容提要 n重点讲解:重点讲解:方差分析的基本思想方差分析的基本思想完全随机设计的单因素方差分析完全随机设计的单因素方差分析多个样本均数间的多重比较多个样本均数间的多重比较n介绍:方差分析的原理与条件介绍:方差分析的原理与条件 不同的是:方差分析用于多个均数的比较。不同的是:方差分析用于多个均数的比较。与前面讲过的假设检验与前面讲过的假设检验相同的是:相同的是:方差分析的任务:统计量方差分析的任务:统计量F F的计算的计算 F FMSMS1 1/MS/MS2 2 t检验是用检验是用 t值进行假设检验,方差分析则用值进行假设检验,方差分析则用F值进行假设检验值进行假

3、设检验方差分析的基本概念7方差分析的几个概念和符号方差分析的几个概念和符号n什么是方差?什么是方差?n离均差离均差n离均差之和离均差之和n离均差平方和(离均差平方和(SS)n方差(方差(2 S2)也叫均方()也叫均方(MS)n 标准差:标准差:Sn自由度:自由度:n关系:关系:MS=SS/方差分析的基本概念方差分析的基本概念方差分析的几个符号方差分析的几个符号 xij表示第表示第i组第组第j个观察值个观察值 表示第表示第i组的均数组的均数(=)表示总平均表示总平均=xi.jijixn1).(xxijijxN1基本思想基本思想:先假设(:先假设(H0)各各总体均数全相等总体均数全相等;将;将总变

4、总变异异SS总总,按设计和资料分析的需要,按设计和资料分析的需要分分为两个或多个组为两个或多个组成部分,其成部分,其自由度自由度也相应地也相应地分分为几个部分,以为几个部分,以随机误随机误差为基础差为基础,按,按F分布的规律分布的规律作统计推断。作统计推断。目的目的:推断总体平均数是否相等推断总体平均数是否相等.独特之处独特之处:不直接比较均数不直接比较均数,利用利用变异变异的关系进行判别的关系进行判别.第一节第一节 完全随机设计资料的方差分析完全随机设计资料的方差分析(单因素方差分析)(单因素方差分析)一、方差分析的意义一、方差分析的意义 前一章介绍了两个样本均数比较的假设检前一章介绍了两个

5、样本均数比较的假设检验方法,但对于验方法,但对于3个、个、4个、个、5个均数或更多个的个均数或更多个的比较,比较,t检验或检验或u检验就无能为力了,或许有人会检验就无能为力了,或许有人会想起将几个均数两两比较分别得到结论,再将结想起将几个均数两两比较分别得到结论,再将结论综合,其实这种做法是错误的。试想假设检验论综合,其实这种做法是错误的。试想假设检验时通常检验水平时通常检验水平取取0.05,亦即弃真概率控制在,亦即弃真概率控制在0.05以内,但将以内,但将3个均数作两两比较,要作三次个均数作两两比较,要作三次比较,可信度成为比较,可信度成为 (1-0.05)3=0.857四均数比较作四均数比

6、较作6次次 (1-0.05)6=0.735五均数比较作五均数比较作10次次(1-0.05)10=0.599六均数比较作六均数比较作15次次(1-0.05)15=0.463鉴于以上的原因,对多组均数的比较问题鉴于以上的原因,对多组均数的比较问题我们采用方差分析我们采用方差分析例例1 某克山病区测得某克山病区测得11例克山病患者与例克山病患者与13名健康名健康人的血磷值(人的血磷值(mmol/L)如下,问该地急性克)如下,问该地急性克山病患者与健康人的血磷值是否不同?山病患者与健康人的血磷值是否不同?患者患者x1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.

7、87 2.07 2.11健康人健康人x2:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87二、单因素方差分析的基本思想二、单因素方差分析的基本思想24名患者与健康人的血磷值大小不等,称这种名患者与健康人的血磷值大小不等,称这种变异为总变异。可以用总离均差平方和变异为总变异。可以用总离均差平方和 及及N来反映,总自由度来反映,总自由度 T=N-1。SS总总2个组各组内部血磷值也不等,这种变异称为个组各组内部血磷值也不等,这种变异称为组内变异,其大小可用组内变异,其大小可用2组组内离均差平方和组组内离均差平方和及各组例

8、数及各组例数ni来反映,自由度来反映,自由度组内组内=N-k(k是是组数),它反映了随机误差。组数),它反映了随机误差。SS组内组内 kinjiijjxx112)(2)1(iisn 2组样本均数也不等,这种变异称为组间变异,组样本均数也不等,这种变异称为组间变异,反映了克山病对血磷值的影响和随机误差反映了克山病对血磷值的影响和随机误差组间变异(组间变异(between groups variation):):SS组间组间 21)(总xxnikiiv组间组间k1 三者关系三者关系SS总总=SS组间组间+SS组内组内v总总=组间组间+组内组内2)(xSSijijx总 直观意义检验统计量检验统计量

9、F统计量具统计量具2个自由度个自由度:v1,v2)()1(kNSSkSSMSMSF组内组间组内组间 如果两组样本来自同一总体,即克山病患者与如果两组样本来自同一总体,即克山病患者与健康人血磷值相同,则健康人血磷值相同,则理论上理论上F应等于应等于1,因为,因为两种变异都只反映两种变异都只反映随机误差随机误差。由于抽样误差的。由于抽样误差的影响,影响,F值未必是值未必是1,但,但应在应在1附近附近。若。若F较小,较小,我们断定我们断定2组均数相同,或者说来自同一总体,组均数相同,或者说来自同一总体,F较大,推断不是来自同一总体。较大,推断不是来自同一总体。成立时成立时组内组间10H1H1MSMS

10、F三、优点三、优点 不受比较的组数限制。不受比较的组数限制。可同时分析多个因素的作用。可同时分析多个因素的作用。可分析因素间的交互作用。可分析因素间的交互作用。四、方差分析的应用条件四、方差分析的应用条件 各样本是相互独立的随机样本各样本是相互独立的随机样本 各样本来自正态总体各样本来自正态总体 各组总体方差相等,即方差齐各组总体方差相等,即方差齐【例题例题1 1】n某社区随机抽取糖尿病患者、某社区随机抽取糖尿病患者、IGT异常和正异常和正常人共常人共30人进行载脂蛋白测定,结果如下,人进行载脂蛋白测定,结果如下,问问3种人的载脂蛋白有无差别?种人的载脂蛋白有无差别?n问题:问题:1、分析问题

11、,选择合适的统计方法、分析问题,选择合适的统计方法 2、如何整理资料、输入计算机、如何整理资料、输入计算机列举存在的变异及意义列举存在的变异及意义n全部的全部的30个实验数据之间大小不等,存在变异,个实验数据之间大小不等,存在变异,总变异总变异。n各个各个组间存在变异组间存在变异:反映处理因素之间的作用,:反映处理因素之间的作用,以及随机误差。以及随机误差。n各个各个组内组内个体间数据不同:反映了观察值的随个体间数据不同:反映了观察值的随机误差。机误差。n各种变异的表示方法各种变异的表示方法各种变异的表示方法各种变异的表示方法nSS总总n 总总nMS总总SS组内组内 组内组内MS组内组内SS组

12、间组间 组间组间MS组间组间三者之间的关系:三者之间的关系:SS总总=SS组内组内+SS组间组间 总总=组内组内+组间组间 统计量统计量F 的计算及其意义的计算及其意义F=MS组间组间/MS组内组内自由度:自由度:组间组间=组数组数-1 组内组内=N-组数组数 通过这个公式计算出统计量通过这个公式计算出统计量F,查表求,查表求出对应的出对应的P值,与值,与 进行比较,以确定是否进行比较,以确定是否为小概率事件。为小概率事件。各种符号的意义各种符号的意义nxij第第i 个组的第个组的第j 个观察值个观察值ni=1,2,knj=1,2,ni ni第第i 个处理组的例数个处理组的例数nni=Nnxi

13、=n x=(x)2(1)建立假设和确定检验水准)建立假设和确定检验水准H0:三种人载脂蛋白的总体均数相等三种人载脂蛋白的总体均数相等,1=2=3H1:三组总体均数不相等或不全等三组总体均数不相等或不全等=0.05(2)计算)计算C=(x)2/N=(3309.5)2/30=365093SS总总=x2-C=372974.87-365093=7881.87SS组内组内=SS总总-SS组间组间=7881.87-2384.026=5497.84总总=N-1=29,组间组间=k-1=2,组内组内=N-k=30-3=27 MS组间组间=SS组间组间/组间组间=1192.01 MS组内组内=SSE/组内组内=

14、203.62F=MS组间组间/MS组内组内=5.8540(3)查方差分析)查方差分析F界值表界值表8确定确定P值值:F 0.05(2,30)=3.32;F 0.01(2,30)=5.39(4)作出推断结论作出推断结论 按按=0.05水平拒绝水平拒绝H0,接受,接受H1,认为三种人载脂,认为三种人载脂蛋白的总体均数不同。蛋白的总体均数不同。组间组间组内组内完整书写方差分析的过程完整书写方差分析的过程n建立假设,确定显著性水平:建立假设,确定显著性水平:H0:3种载脂蛋白的总体均数相等种载脂蛋白的总体均数相等 1=2=3 H1:3种载脂蛋白的总体均数种载脂蛋白的总体均数不相等或不全相等不相等或不全

15、相等 H1与与H0相反,如果相反,如果H0被否决,则被否决,则H1成立。成立。n 常取常取0.05,区分大小概率事件的标准。区分大小概率事件的标准。n 计算统计量计算统计量F:根据资料的性质选择不同的统计方:根据资料的性质选择不同的统计方法。注意都是在法。注意都是在H0成立的条件下进行计算。成立的条件下进行计算。n 计算概率值计算概率值P:P的含义。的含义。n 做出推论:统计学结论和专业结论。做出推论:统计学结论和专业结论。n四组不同摄入方式人的血浆游离吗啡水平四组不同摄入方式人的血浆游离吗啡水平静脉点滴静脉点滴肌肉注射肌肉注射皮下注射皮下注射口服口服1212 9121016 7 8 715

16、6 8 8 9 1110 9 714均数均数1013 8 9.5单因素方差分析单因素方差分析完整书写方差分析的过程完整书写方差分析的过程建立假设:建立假设:H0:4组病人血浆游离吗啡水平组病人血浆游离吗啡水平 1=2=3=4 H1:4组病人血浆游离吗啡水平的总体均数全不相等或组病人血浆游离吗啡水平的总体均数全不相等或不全不全相等相等确定显著性水平,用确定显著性水平,用 表示表示。区分大小概率事件的标准,常取区分大小概率事件的标准,常取0.05。计算统计量计算统计量F:F=MS组间组间/MS组内组内 根据资料的性质选择不同的统计方法。注意都是在根据资料的性质选择不同的统计方法。注意都是在H0成成

17、立的条件下进行计算。立的条件下进行计算。计算概率值计算概率值P:P的含义。的含义。做出推论:做出推论:统计学结论和专业结论。统计学结论和专业结论。单因素方差分析单因素方差分析方差分析表方差分析表(练习,完成该表。例题,写在黑板上)单因素方差分析单因素方差分析F0.05(3,15)3.29F与它所对应的与它所对应的P值成反比值成反比结合上题理解:方差分析的基本思想结合上题理解:方差分析的基本思想n将全部观察值将全部观察值总的离均差平方和总的离均差平方和(SS总总)及)及自自由度(由度(总总)分解为两个或多个部分分解为两个或多个部分n除随机误差外,其余每个部分的变异可由某个除随机误差外,其余每个部

18、分的变异可由某个因素的作用加以解释因素的作用加以解释n通过比较不同来源变异的均方(通过比较不同来源变异的均方(MS),借助),借助F分布做出统计推断,从而了解该因素对观察指分布做出统计推断,从而了解该因素对观察指标有无影响标有无影响。存在问题存在问题n方差分析结果提供了各组均数间差别的总的信方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统未指出哪几个组均数间的差别具有或不具有统计学意义。计学意义。n为了得到这方面的信息,可进行多个样本间的为了得到这方面的信息,可进行多个样本间的两两比

19、较。两两比较。第二节第二节 多个样本均数间的两两比较多个样本均数间的两两比较(又称多重比较)(又称多重比较)多重比较即多个样本均数间的两两比较,多重比较即多个样本均数间的两两比较,由于涉及的对比组数大于由于涉及的对比组数大于2,若仍用,若仍用t 检验作每两检验作每两个对比组比较的结论,会使个对比组比较的结论,会使犯第一类错误犯第一类错误的的概率概率增大增大,即可能把本来无差别的两个总体均数判,即可能把本来无差别的两个总体均数判为有差别。为有差别。4个样本均数间的比较个样本均数间的比较多重比较方法(两两比较)多重比较方法(两两比较)n对对满足正态性和方差齐性的资料满足正态性和方差齐性的资料:多个

20、实验组分别多个实验组分别与一个对照组比较常用与一个对照组比较常用Dunnet-t法法。每两个均数比较每两个均数比较常用最小显著差值法(常用最小显著差值法(LSD-t)、)、SNK(Student-Newman-Keuls,即即q检验)法检验)法、Tukey(可靠显著差异)(可靠显著差异)法、法、Bonferroni-t(校正最小显著差异)调整法等。(校正最小显著差异)调整法等。n对对不满足正态性和方差齐性的资料不满足正态性和方差齐性的资料:可通过数据变换,:可通过数据变换,使满足方差分析的应用条件。可用非参数检验法,如使满足方差分析的应用条件。可用非参数检验法,如秩和检验。可采用近似检验,如秩

21、和检验。可采用近似检验,如Tamhanes T2,Dunnetts T3,Games-Howell,Dunnetts C等方法。等方法。检验统计量检验统计量 q检验界值表见附表检验界值表见附表10,它有两个自由度,一个,它有两个自由度,一个是是m(k),m指将方差分析中的几组样本均数按指将方差分析中的几组样本均数按从小到大顺序排列后要比较的从小到大顺序排列后要比较的A、B两组所包含的两组所包含的组数组数(包含包含A、B两组本身两组本身);另一个是另一个是=e。误差误差一、一、q检验检验(又称(又称Student-Newman-Keuls法,简称法,简称SNK-q检验检验法法)常用于多个样本均数

22、间每两个均数的比较。常用于多个样本均数间每两个均数的比较。例(续例例(续例3)对三个人群的载脂蛋白作两两比较。)对三个人群的载脂蛋白作两两比较。(1)建立假设建立假设,确定检验水准确定检验水准H0:任任2个人群的载脂蛋白的总体均数相等,即个人群的载脂蛋白的总体均数相等,即A=BH1:AB,=0.05。(2)样本均数排序样本均数排序将将3组样本均数从小到大(或从大到小)顺序排列,编上组样本均数从小到大(或从大到小)顺序排列,编上组次,并注上组别组次,并注上组别.组次组次 1 2 3均数均数 102.39 105.45 122.80组别组别 IGT异常异常 糖尿病患者糖尿病患者 正常人正常人(3)

23、列出两两均数比较的列出两两均数比较的q检验计算表检验计算表从从p值一栏中可以推断出结论,即值一栏中可以推断出结论,即IGT异常异常(1)与正常人与正常人(3)的载脂蛋白有差别的载脂蛋白有差别,糖尿病患者糖尿病患者(2)与正常人与正常人(3)的载的载脂蛋白有差别。脂蛋白有差别。二、二、LSD-t 检验检验 n由由Fisher提出,称为提出,称为最小显著性差异法最小显著性差异法。n在在H0:ij假设下,假设下,t统计量检验统计量检验i与与j是否相同。是否相同。n ,(,(dfdfe)(6-9))/1/1(2jiejinnSXXt可查统计附表可查统计附表7确定概率确定概率P的大小。的大小。常用于多个

24、样本均数间每两个均数的比较。常用于多个样本均数间每两个均数的比较。三、三、Dunnett-t检验检验 常用于常用于多个实验组与一个对照组均数多个实验组与一个对照组均数间的两两比较。间的两两比较。实验组实验组对照组对照组可查统计附表可查统计附表9确定概率确定概率P的大小。的大小。四、四、Bonferroni-t检验检验Bonferron t=(6-12))/1/1(S2ejijinnXX 假设比较次数为假设比较次数为m,则,则=b/m作为每作为每次比较的水平。次比较的水平。调整检验水准法调整检验水准法例例 题题n对小白鼠喂以对小白鼠喂以A、B、C三种不同的营养素三种不同的营养素,了了解不同营养素

25、的增重效果。以窝别作为区组特解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将征,以消除遗传因素对体重增长的影响。现将同系同体重的同系同体重的24只小白鼠分为只小白鼠分为8个区组,每组个区组,每组3只。只。3周后测量增重结果,结果如下表,周后测量增重结果,结果如下表,n问问3种不同营养素喂养后所增体重有无差别?种不同营养素喂养后所增体重有无差别?n方法:方法:应用分层的思想,事先将全部受试对象按某种应用分层的思想,事先将全部受试对象按某种或某些特性分为若干个区组,使每个区组内的观察对或某些特性分为若干个区组,使每个区组内的观察对象与研究对象的水平尽可能相近象与研究

26、对象的水平尽可能相近n目的:减少了个体间差异对结果的影响,比成组设计目的:减少了个体间差异对结果的影响,比成组设计更容易检验出处理因素间的差别,提高了研究效率。更容易检验出处理因素间的差别,提高了研究效率。n是配对资料的扩充。是配对资料的扩充。双因素方差分析双因素方差分析第三节第三节 随机区组(配伍组)设计的多个样随机区组(配伍组)设计的多个样本均数的比较(双因素方差分析)本均数的比较(双因素方差分析)例例 题题n对小白鼠喂以对小白鼠喂以A、B、C三种不同的营养素三种不同的营养素,了了解不同营养素的增重效果。以窝别作为区组特解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的

27、影响。现将征,以消除遗传因素对体重增长的影响。现将同系同体重的同系同体重的24只小白鼠分为只小白鼠分为8个区组,每组个区组,每组3只。只。3周后测量增重结果,结果如下表,周后测量增重结果,结果如下表,n问问3种不同营养素喂养后所增体重有无差别?种不同营养素喂养后所增体重有无差别?分析变异分析变异总变异总变异组间变异组间变异误差(组内)变异误差(组内)变异配伍间变异配伍间变异nSS总总n 总总SS误差误差 误差误差MS误差误差SS组间组间 组间组间MS组间组间变异之间的关系:变异之间的关系:SS总总=SS误差误差+SS组间组间+SS区间区间 总总=误差误差+组间组间+区间区间变异间的关系变异间的

28、关系SS区间区间 区间区间MS区间区间统计量统计量F 的计算的计算 F1=MS组间组间/MS误差误差 F2=MS区间区间/MS误差误差自由度:自由度:组间组间=组数组数-1=3-1=2 区间区间=区数区数-1=8-1=7 误差误差=总总-组间组间-区间区间=23-7-2=14 完整书写方差分析的过程完整书写方差分析的过程n建立假设,确定显著性水平建立假设,确定显著性水平:H0:3种营养素喂养的小白鼠体重增量相等种营养素喂养的小白鼠体重增量相等 1=2=3 H1:3种营养素喂养的小白鼠体重增量不全相等种营养素喂养的小白鼠体重增量不全相等n 常取常取0.05,区分大小概率事件的标准。区分大小概率事

29、件的标准。n 计算统计量计算统计量F:F1=MS组间组间/MS误差误差n 计算概率值计算概率值P:P的含义。的含义。n 做出推论做出推论:统计学结论和专业结论。:统计学结论和专业结论。完整书写方差分析的过程完整书写方差分析的过程n建立假设,确定显著性水平建立假设,确定显著性水平:H0:8窝小白鼠体重增量相等窝小白鼠体重增量相等 1=2=3 H1:8窝小白鼠体重增量不相等或不全相等窝小白鼠体重增量不相等或不全相等n 常取常取0.05,区分大小概率事件的标准。区分大小概率事件的标准。n 计算统计量计算统计量F:F2=MS区间区间/MS误差误差n 计算概率值计算概率值P:P的含义。的含义。n 做出推

30、论做出推论:统计学结论和专业结论。:统计学结论和专业结论。课堂测验(一)课堂测验(一)1.研究人员在某县随机抽取了研究人员在某县随机抽取了225名女婴,测量名女婴,测量其出生体重,均数为其出生体重,均数为3.20kg,标准差为,标准差为0.44kg,请计算:,请计算:n 该县女婴出生体重该县女婴出生体重95参考值范围参考值范围n 该县女婴出生体重总体均数的该县女婴出生体重总体均数的95可信区间可信区间 2.某研究人员从某地随机抽取了部分健康成人,并对某研究人员从某地随机抽取了部分健康成人,并对其进行血红蛋白含量的测定,结果如下表:问该地其进行血红蛋白含量的测定,结果如下表:问该地健康成人男、女间血红蛋白含量有无差别健康成人男、女间血红蛋白含量有无差别?性别例数均数(g/L)标准误(g/L)男25134.51.2女16117.61.3n3.为研究为研究A、B、C三种治疗缺铁性贫血的药物的疗效,三种治疗缺铁性贫血的药物的疗效,某研究者将某研究者将11例患者完全随机地分为三组,分别给予三种例患者完全随机地分为三组,分别给予三种药物,治疗一个疗程后的结果如表药物,治疗一个疗程后的结果如表5.3,请作统计分析。,请作统计分析。n Thank You世界触手可及世界触手可及携手共进,齐创精品工程携手共进,齐创精品工程

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(医学统计学(方差分析)课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|