1、复习(复习(P74)22222122()(1)()(1)niiXXnSE Sn 2(,)XN 21112222()(,)()nnF n nnn 2第一节第一节 单因素方差分析单因素方差分析例例1 用用A、B、C、D4种不同的种不同的配合饲料配合饲料喂养喂养30日龄的小鸡,日龄的小鸡,10天后计算天后计算平均日增重平均日增重.问问4种饲种饲料的效果是否相同?料的效果是否相同?3例例1 两种数据格式两种数据格式4例例1 两种数据格式两种数据格式状态,水平状态,水平实验中变化的条件实验中变化的条件观测值,实验结果,指标观测值,实验结果,指标5例例a a为研究某中药对肿瘤重量的影响,以便选定最为研究某
2、中药对肿瘤重量的影响,以便选定最佳抑癌作用剂量佳抑癌作用剂量.今先将一批小白鼠致癌,然今先将一批小白鼠致癌,然后随机分成四组(每组后随机分成四组(每组1010只)分别实施只)分别实施三种剂三种剂量量的药物注射及适量的的药物注射及适量的生理盐水生理盐水注射,经过相注射,经过相同的实验期之后,测定四组鼠的同的实验期之后,测定四组鼠的肿瘤重量肿瘤重量.状态,水平状态,水平实验中变化的条件实验中变化的条件观测值,实验结果,指标观测值,实验结果,指标61.几个基本概念几个基本概念因素(因素(factor):):因子因子可能影响试验结果,且在试验被考察是否有可能影响试验结果,且在试验被考察是否有作用,试验
3、中变化的条件作用,试验中变化的条件水平(水平(level):):因素在试验中所取的状态因素在试验中所取的状态饲料的配方:高脂,低脂饲料的配方:高脂,低脂药物种类:西药,中药药物种类:西药,中药药物剂量:药物剂量:温度、湿度、温度、湿度、pH值、催化剂种类:值、催化剂种类:性别、年龄组、病情性别、年龄组、病情吸烟情况吸烟情况母乳喂养情况母乳喂养情况71.几个基本概念几个基本概念指标(指标(variable):):响应,变量响应,变量 试验结果,观测数据试验结果,观测数据8例例b考察考察蒸馏水的蒸馏水的pH值值和和硫酸铜溶液浓度硫酸铜溶液浓度对血清对血清中中白蛋白和球蛋白之比白蛋白和球蛋白之比的影
4、响的影响.蒸馏水的蒸馏水的pH取四个值,取四个值,硫酸铜溶液浓度硫酸铜溶液浓度取三个值,取三个值,在在pH值和硫酸铜溶液浓度不同的组合下各做值和硫酸铜溶液浓度不同的组合下各做一次试验,共进行一次试验,共进行12次试验次试验.9例例b 两种数据格式两种数据格式110例例b 两种数据格式两种数据格式2因素因素指标指标白蛋白和球蛋白之比白蛋白和球蛋白之比蒸馏水蒸馏水pH值值硫酸铜浓度硫酸铜浓度B1B2B3A13.52.32.0A22.62.01.9A32.01.51.2A41.40.80.3因素的水平因素的水平11例例c考察医学手术中手术考察医学手术中手术缝合方式缝合方式和和手术缝合后时手术缝合后时
5、间间对对轴突通过率轴突通过率的影响的影响.缝合方式缝合方式(A):外膜缝合外膜缝合(A1)、束膜缝合、束膜缝合(A2);缝合后时间缝合后时间(B):1月月(B1)、2月月(B2).在不同的水平组合下各做在不同的水平组合下各做5次试验次试验.缝合方式缝合方式缝合后时间缝合后时间B1B2A110 10 40 50 1030 30 70 60 30A210 20 30 50 3050 50 70 60 30121.几个基本概念几个基本概念处理处理:试验中实施的因素水平的一个组合试验中实施的因素水平的一个组合 AiBj蒸馏水蒸馏水pH值值硫酸铜浓度硫酸铜浓度B1B2B3A13.52.32.0A22.6
6、2.01.9A32.01.51.2A41.40.80.3缝合方式缝合方式缝合后时间缝合后时间B1B2A110 10 40 50 1030 30 70 60 30A210 20 30 50 3050 50 70 60 3013单因素单因素完全随机化试验完全随机化试验14双因素双因素无重复无重复交叉分组试验交叉分组试验按照因素的水平进行交叉分组后随机安排的按照因素的水平进行交叉分组后随机安排的试验叫做试验叫做交叉分组试验交叉分组试验,析因试验析因试验蒸馏水蒸馏水pH值值硫酸铜浓度硫酸铜浓度B1B2B3A13.52.32.0A22.62.01.9A32.01.51.2A41.40.80.315双因素
7、双因素等重复等重复交叉分组试验交叉分组试验缝合方式缝合方式缝合后时间缝合后时间B1B2A110 10 40 50 1030 30 70 60 30A210 20 30 50 3050 50 70 60 30162.几种试验设计方法几种试验设计方法单因素单因素多因素多因素完全随机化设计完全随机化设计成组成组析因设计析因设计无重复析因设计无重复析因设计等重复析因设计等重复析因设计 (,.,)fAM 指指因因素素水水平平因因素素水水平平区组设计区组设计配对配对拉丁方,正交,拉丁方,正交,17二、二、单因素单因素方差分析解决的问题方差分析解决的问题one wayone way ANOVA ANOVA例
8、例1 用用A、B、C、D4种不同的配合饲料喂养种不同的配合饲料喂养30日龄的小鸡,日龄的小鸡,10天后计算平均日增重天后计算平均日增重.问问4种饲种饲料的效果是否相同?料的效果是否相同?18例例1-描述性统计描述性统计19例例1-条形图条形图20例例1-盒形图盒形图211.1.一些记号:总体一些记号:总体在同一饲料下日增重视为一个总体,记为在同一饲料下日增重视为一个总体,记为Xi(i1,2,1,2,k).).1X234XXX2()(1,2,.,)()()iiiiiiXFxikE XD X 4k 22记号:个体记号:个体在在i个饲料下第个饲料下第j个小鸡日增重记做个小鸡日增重记做xij23x23
9、记号:各组样本量、均值、方差记号:各组样本量、均值、方差112211.11.11.111111()1nnjjjjnxxsxxnn 22.1111()1iinniiijiijijjiinxxsxxnn 1234nnnnn24记号:总样本量、均值、方差记号:总样本量、均值、方差11kNnnn 22.1111inkijijsxxN.111inkijijxxN 2(,)(1,2,;1,2,)ijiixNik jn 2(,)(1,2,)iiXNik 252.单因素方差分析的模型单因素方差分析的模型12(0,)ijijijixN 观测观测 因素因素A的效应的效应随机误差随机误差独立,正态,方差齐性独立,正
10、态,方差齐性012:kAiHH不不全全相相等等262.单因素方差分析的模型单因素方差分析的模型22(0,)iijjiijxN 2(0,)ijijiijxN 1101=kiiiikiik 主效应主效应i:第:第i个水平的平个水平的平均均i与全部的平均与全部的平均之差,之差,对一个因素各水平的平均对一个因素各水平的平均响应的差异的度量响应的差异的度量.27单因素方差分析的原假设和备择假设单因素方差分析的原假设和备择假设2(0,)iijjiijxN 2(0,)ijijiijxN 1101=kiiiikiik 012:;:kAiHH 不不全全相相等等012:;:kAiHH 不不全全相相等等012:;:
11、0kAiHH 不不全全为为0 028两两均值间的比较两两均值间的比较0:(,1,2,3,4,)ijHi jij2(1)2kk kC 012341:;:jHH 不不全全相相等等P(一次检验犯一次检验犯类错误类错误)=0.05)=0.05P(6(6次检验中至少犯次检验中至少犯1 1次次类错误类错误)=1 =1P(6(6次检验中没有犯次检验中没有犯1 1次次类错误类错误)29两两成组比较两两成组比较 增加犯第一类错误的概率增加犯第一类错误的概率2461(1)10.950.2649C 30两两成组比较两两成组比较 增加犯第一类错误的概率增加犯第一类错误的概率2221(1)=1(1)(1)2kCkkCC
12、k k 311231232221231.02.02.29991.370.411.96xxxnnnsss2222(1)(1)112ijijiijjijijijxxxxtnsnsssnnnnn 成组成组t检验结果:检验结果:1 1与与2 2有显著性差异有显著性差异 1 12 2 2 2与与3 3没有显著性差异没有显著性差异 2 23 31,2|2.25t 2,3|0.39t 1 1与与3 3没有显著性差异没有显著性差异 1 13 31,3|1.97t 两两成组比较两两成组比较 矛盾的结果矛盾的结果 323.分析变异分析变异2(0,)ijjiiijxN 观测观测 因素因素A的效应的效应随机误差随机误
13、差分析观测(数据)之间的变异(波动),分析观测(数据)之间的变异(波动),通通过过模型模型,把引起数据变异的不同原因:,把引起数据变异的不同原因:因素因素A的效应的效应随机误差随机误差区分开区分开33例例1 分析变异分析变异组内变异组内变异组间变异组间变异随机误差随机误差!饲料的作用饲料的作用?iijijx 34离差平方和离差平方和 2.11inkijjixx 2.11inkijiijxx 2.11inkiijxx 2.11.jnkiiijijxxxx .1.12jnkijjiiixxxx 35组内均值组内均值iijijx .11=iniijjixxn 11iniijijn .ii .)(ij
14、ix 36总均值总均值.iiijijiixx 1111111111iiinnnkkkijijijiiijijNNNNN .111inkijijxxN.1234nnnnn10kii 373.1 数据的分解:总离差平方和数据的分解:总离差平方和.iiijijiixxx .ijxx.()()ijiiij 2.11inkijijxx 2.11211()iinkijijnkiij TSS SS:Sum of SquareT:Total38总离差平方和总离差平方和.iiijijiixxx 2.122.11111 ()ijinkiinkijinkTijjjjiSSxx 总的变异总的变异饲料的作用饲料的作用
15、随机误差随机误差012:0kH393.2 数据的分解:组内离差平方和数据的分解:组内离差平方和.iiijijiixxx .ijixx .()iiijiiji 组内变异组内变异随机误差随机误差e:Error 22.1111iinnkkijiijiijijxx eSS 403.3 数据的分解数据的分解3:组间离差平方和:组间离差平方和.iiijijiixxx .ixx.()()iiii 22.12.11111()iiinnkkiiijijnkiijxx ASS 组间变异组间变异 饲料的作用饲料的作用 随机误差随机误差A:因素:因素A 012:0kH41三个平方和三个平方和 2.112.12.111
16、jiinkinkiijiijnkijjjixxxxxx 组内变异组内变异随机误差随机误差组间变异组间变异=饲料的作用饲料的作用随机误差随机误差总的变异总的变异=饲料的作用饲料的作用随机误差随机误差总离差平方和总离差平方和组内离差平方和组内离差平方和组间离差平方和组间离差平方和SSTSSeSSA012:0kH用用SST来刻划数据之间的变异(波动)程度,来刻划数据之间的变异(波动)程度,通通过过模型模型,把引起数据变异的不同原因:,把引起数据变异的不同原因:随机误差随机误差组内组内SSe因素因素组间组间SSA区分开,区分开,组间组间变异与变异与组内组内变异进行比较变异进行比较.analysis o
17、f variance,ANOVA424.方差分析的基本思想方差分析的基本思想434.1 计算三个离差平方和计算三个离差平方和1:SSe 2.12.11(1)(51)41.8(51)66.3866iknkeijiiijiiSSxxns 444.1 计算三个离差平方和计算三个离差平方和2:SST 2.11inkTijijSSxx2.(1)ns 2774.55=454.1 计算三个离差平方和计算三个离差平方和3:SSA1908.55=2.11inkAiijSSxx 2.1kiiinxx eATSSSSSS2774.55866eTSSSS 464.2 估计估计2:组内均方:组内均方 2.112.1(1
18、)inkeijikiiijiSSnxsx 221(1)()niinnk 2eSSnk 2(0,)ijjiiijxN eMS 474.2 估计估计2 22.11(1)jnkTijjiSSxxns012:0kH2(0,)ijjiiijxN 2(,)ijxN 02(1)Hn 022.1THsnSS 021AHASMkSS 12348上机上机2 题题6 情形情形12.3211eTAAeAeSSSSSMSnnSSSSMSsnkkS 2222111AesMSSM 2221TAeMSMSSnS 123,不不完完全全相相同同49上机上机2 题题6 情形情形22.3211eTAAeAeSSSSSMSnnSSSS
19、MSsnkkS 2222111AesMSSM 2221TAeMSMSSnS AeFMSMS(1)(2)FF 505.方差分析方差分析xy 1F (1)()AAeekMSSMSSkSSFn (1,)F knkAH0HFP012:0kH22121()1()kAiiieE MSn kE MS 51方差分析表方差分析表 离差离差 离差离差 自由度自由度 均方均方 F F值值 临界值临界值 来源来源 平方和平方和 组间组间 k-1-1 组内组内 n-kASS1 AASSMSkAeMSFMS 1(1,)Fknk eSSeeSSMSnk 012:0:kAiHH不不全全为为0 052例例1 点估计点估计2(0
20、,)ijjjiijXN 11.22.33.44.52.461.864.879.6xxxx 53例例1 方差分析表方差分析表11(11.8)11eeeeAATAAkFP FFSkn kn kSSMSSSSSMSMSSMSnSSa-=-=-拒绝原假设拒绝原假设H0 0(P0.00030.0003),),4 4种配合饲料效种配合饲料效果的差异有统计学意义果的差异有统计学意义.254.1s=01234:0:0AiHH不不全全为为1 0.0511.83.24FF-=54方差分析小结方差分析小结012:kAiHH不不全全相相等等检验多个正态总体均值是否有差异的一种假检验多个正态总体均值是否有差异的一种假设
21、检验方法设检验方法.55a.方差分析模型方差分析模型2(0,)ijjjiijXN 独立,正态,方差齐性独立,正态,方差齐性2(,)iiXN 2(,)(1,2,;1,2,)ijiiXNik jn 前提前提11=kiiiik 2(0,)ijijiijxN 56b.单因素方差分析的模型参数的估计单因素方差分析的模型参数的估计2(0,)ijjijijXN2()()eeESEkSMSn 2eMS .11iniijiijixxn .iix 57c.方差分析思想方差分析思想 2112.112.11jjjnkinnkijjikjjjjjiixxxxxx 用用SST来刻划数据之间的变异(波动)程度,并来刻划数据
22、之间的变异(波动)程度,并把引起数据波动的不同原因(组内、组间)区把引起数据波动的不同原因(组内、组间)区分开,来进行比较分开,来进行比较.eATSSSSSS(1)(1,)()AAeeMSSSMSSkFFSknknk 58d.三个离差平方和的计算三个离差平方和的计算 2.112.12.111jiinkinkiijiijnkijjjixxxxxx eATSSSSSS 2.112.1(1)inkeijikiiijiSSnxsx 22.11(1)jnkTijjiSSxxns 22.111inkkAiiiijieTSSxxnSxSxSS 59两组的比较:成组比较两组的比较:成组比较组间变异组间变异与与
23、组内变异组内变异进行比较进行比较121211(2)TtnXSnnYn 012112:,:HH222112211(1)(1)2nSnSSnn 60e.成组比较与单因素方差分析成组比较与单因素方差分析012:H 独立,正态,方差齐性独立,正态,方差齐性成组成组t检验检验方差分析方差分析61例例2 产科学产科学(生物统计学基础,生物统计学基础,P540)婴儿出生体重一直被怀疑与母亲在妊娠期间的婴儿出生体重一直被怀疑与母亲在妊娠期间的吸烟状态有关吸烟状态有关.调查了调查了1 1个月内在某家医院产个月内在某家医院产前门诊登记的所有母亲的吸烟状态和及其婴儿前门诊登记的所有母亲的吸烟状态和及其婴儿出生体重,
24、检验这个假设出生体重,检验这个假设.母亲被分为母亲被分为4 4组:组:NONNON -不吸烟者不吸烟者EXEX -孕前某段时间吸烟,但怀孕期间未吸烟孕前某段时间吸烟,但怀孕期间未吸烟CUR1CUR1 -每日吸烟少于每日吸烟少于1 1包包CURCUR1 1 -每日吸烟大于等于每日吸烟大于等于1 1包包62例例2 数据数据处理方式处理方式NONEXCUR1CUR17.55.85.96.2婴婴6.27.36.26.8儿儿6.98.25.85.7出出7.47.14.74.9生生9.27.88.36.2体体8.37.27.1重重7.66.25.85.463例例2 描述性统计描述性统计64例例2 方差分析
25、表方差分析表01234:0:AiHH不不全全为为0 01 0.054.4076(3,23)3.028FF 拒绝原假设拒绝原假设H0(P0.0137),),婴儿出生体重与婴儿出生体重与母亲在妊娠期间的吸烟状态有关母亲在妊娠期间的吸烟状态有关.65作业作业66作业作业67作业作业68作业作业P200 4.3上机上机2 题题6预习:预习:P150 多重比较多重比较P188 方差分析需要满足的条件方差分析需要满足的条件P228 相关分析相关分析69Good jobGood job陈启睿陈启睿 王喻王喻 夏热帕提夏热帕提 黄星宇黄星宇 王东岳:题王东岳:题16刘元亘刘元亘 焦霩焦霩 刘泽林刘泽林 祝龙飞
26、祝龙飞 王亮:题王亮:题15吴季霖吴季霖 贾宽宽贾宽宽 杨随杨随 慕创创慕创创 杜长江:题杜长江:题1、4C王璐薇王璐薇 张小奕张小奕 杨迪杨迪 蒲云罡蒲云罡 努尔:题努尔:题1、3、6张楚人张楚人 鲁明星鲁明星 曾文敏曾文敏 陶畅陶畅 王怡平:题王怡平:题4A、6龙靖淼龙靖淼 李若竹李若竹 付肖依付肖依 申舒廷申舒廷 韩诗迪韩诗迪:题:题2、4贾盼盼贾盼盼 李海伟李海伟 李明华李明华 马千程马千程 朱海伦:题朱海伦:题2、3、6李鑫瀛李鑫瀛 高菡高菡 刘航齐刘航齐 靳龙阳:题靳龙阳:题2郑铸彪郑铸彪 李宗博李宗博 张文鑫张文鑫杜佳琳杜佳琳 萧潇雨萧潇雨 李思琦李思琦 李雪嫣:题李雪嫣:题6邓玖珷邓玖珷 王佳雯王佳雯:题:题6沈威宇沈威宇 王宇王宇 赵金山赵金山 张泽恺:题张泽恺:题1B、2、6任振超任振超 张贝宁张贝宁 齐立君齐立君 聂玉瑶:题聂玉瑶:题4曹宏远:独自一人完成曹宏远:独自一人完成6道题道题张美琪张美琪 王宇王宇 谭畅谭畅李诗璐李诗璐 丁敏:题丁敏:题6付佳明:题付佳明:题6黄丽萍黄丽萍 连晓敏连晓敏 曹悦曹悦 朱坤姝:题朱坤姝:题1、2、5花一鸣花一鸣 周润祥周润祥凌鑫宇凌鑫宇 樊志璞樊志璞 祝嵱祝嵱 马学洋马学洋 侯宇:题侯宇:题6黄港黄港 张云帆张云帆 任启迪任启迪 萧宁萧宁 张梦宸张梦宸