1、1假设检验的基本原理假设检验的基本原理n主要用于判断主要用于判断两个或多个参数间的差别两个或多个参数间的差别有无统计学意义有无统计学意义。n首先建立假设,然后看假设的事件发生首先建立假设,然后看假设的事件发生的概率的概率 P,通过比较,通过比较 P 与与 的大小作出的大小作出统计推断。统计推断。2假设检验的假设检验的一般步骤一般步骤1.1.建立检验假设建立检验假设,确立检验水准确立检验水准 n无效假设无效假设 H H0 0:0 0n备择假设备择假设 H H1 1:0 0或或 0 0(0 0 )n检验水准检验水准,是预先规定的概率值,它确定了是预先规定的概率值,它确定了 小概率事件的标准。小概率
2、事件的标准。32.选定检验方法和计算检验统计量选定检验方法和计算检验统计量 根据假设检验的根据假设检验的目的目的和和研究设计的类型研究设计的类型选选用不同的检验方法。检验的具体方法,通用不同的检验方法。检验的具体方法,通常以选定的常以选定的检验统计量检验统计量来命名。来命名。43.确定确定 P 值,做出统计结论值,做出统计结论P值值是指在无效假设是指在无效假设 H0 成立成立的前提下,获得的前提下,获得大于等于(或小于等于)现有统计量的概率。大于等于(或小于等于)现有统计量的概率。P:就是:就是 H0 成立成立的概率。的概率。当当P时,时,按按检验水准,拒绝检验水准,拒绝H0,接受接受H1;当
3、当P时,时,按按检验水准,不拒绝检验水准,不拒绝H0。5第四节第四节 t 检验与检验与 u 检验检验6掌握:掌握:t 检验和检验和u 检验检验(应用条件、方法选择、分析步骤应用条件、方法选择、分析步骤)本节课学习目的与要求本节课学习目的与要求71.u 检验应用条件:检验应用条件:n 已知;已知;未知但未知但 n 较大较大(n100)2.t 检验应用条件:检验应用条件:n 未知且未知且 n 较小较小(n100)时,要求样本来自时,要求样本来自正态正态 总体总体;n 两个小样本均数比较时,要求两样本所属总体两个小样本均数比较时,要求两样本所属总体 的的方差齐方差齐。应用条件应用条件8 单样本单样本
4、(one sample t test)t检验检验 配对样本配对样本(paired t test)两独立样本两独立样本(two independent samples t-test)单样本单样本 两独立样本两独立样本 数值变量数值变量 假设检验假设检验u检验检验9 比较的目的比较的目的是推断样本均数代表的总体均数是推断样本均数代表的总体均数是否与一已知的总体均数是否与一已知的总体均数0相同,相同,0一般为理论值、一般为理论值、标准值或经过大量观察所得的稳定值等。标准值或经过大量观察所得的稳定值等。根据根据 是否已知和样本含量是否已知和样本含量 n 的大小的大小,选用,选用 u 检检验或验或 t
5、检验。检验。一、样本均数样本均数与与总体均数总体均数的比较的比较10=n-1(一)(一)u 检验检验00XXXun 当当 未知而未知而 n 较大时较大时(n100),可用,可用 S 代替代替 估计估计 u 值。值。11例例 某市某年抽查了某市某年抽查了150名名2岁男孩的体重,得平均岁男孩的体重,得平均体重为体重为11.18kg,标准差为,标准差为1.23kg。而同期全国九城。而同期全国九城市大量调查得同龄男孩的平均体重为市大量调查得同龄男孩的平均体重为11kg(此调查(此调查结果可作为总体均数)。问该市结果可作为总体均数)。问该市2岁男孩的平均体重岁男孩的平均体重与全国的同期水平有无差别?与
6、全国的同期水平有无差别?121.建立假设,确定检验水准建立假设,确定检验水准 H0:=0,2岁男孩的平均体重与全国的同期岁男孩的平均体重与全国的同期 水平无差别水平无差别 H1:0 ,2岁男孩的平均体重与全国的同岁男孩的平均体重与全国的同 期水平有差别期水平有差别 =0.052.选定检验方法,计算统计量选定检验方法,计算统计量011.18111.7921.23150Xun133.确定确定 P 值,作出推断结论值,作出推断结论u值值 P 值值 结结 论论 u0.05 0.05 接受接受H0,差别无统计学意义,差别无统计学意义 u0.05 0.05 拒绝拒绝H0,接受,接受H1,差别有,差别有 统
7、计学意义统计学意义14本例本例 u=1.792,u0.05=1.96,u=1.792 u0.05=1.96。因此因此P0.05,说明在,说明在 a=0.05 水准上,接受水准上,接受H0,根据现有样本信息,尚根据现有样本信息,尚不能认为不能认为该市该市 2 岁男孩的岁男孩的 平均体重与全国的同期水平平均体重与全国的同期水平不同不同。15=n-1(二)(二)t 检验检验00XXXtSSn 当当 未知而未知而 n 较小时,样本均数与总较小时,样本均数与总体均数的比较用体均数的比较用 t 检验。检验。16例例14 15例长期服用某种避孕药的妇女,其例长期服用某种避孕药的妇女,其血清胆固醇含量的均数为
8、血清胆固醇含量的均数为6.5 mmol/L,标准差,标准差为为0.7 mmol/L,一般健康妇女血清胆固醇含量,一般健康妇女血清胆固醇含量的均数为的均数为4.4 mmol/L,问长期服用该种避孕药,问长期服用该种避孕药的妇女其血清胆固醇含量的均数与一般健康妇的妇女其血清胆固醇含量的均数与一般健康妇女有无差别?女有无差别?171.建立假设,确定检验水准建立假设,确定检验水准 H0:=0=4.4 H1:0 =0.052.选定检验方法,计算统计量选定检验方法,计算统计量06.54.411.6670.715XtSn11.619183.确定确定 P 值,作出推断结论值,作出推断结论t值值 P 值值 结结
9、 论论 t0.05 0.05 接受接受H0,差别无统计学意义,差别无统计学意义t0.05 0.05 拒绝拒绝H0,接受,接受H1,差别有,差别有 统计学意义统计学意义19v=n-1=15-1=14,查,查 t 界值,界值,t0.05,14=本例本例 t=11.619 t0.05,14,故,故 P0.05。因此在因此在 a=0.05 水准上,拒绝水准上,拒绝H0,接受,接受H1,可,可认为长期服用该种避孕药的妇女其血清胆固醇认为长期服用该种避孕药的妇女其血清胆固醇含量均数与一般健康妇女的差别有统计学意义。含量均数与一般健康妇女的差别有统计学意义。2.145,检验步骤检验步骤首先假定首先假定H H
10、0 0是成立的,是成立的,0.050.05在此前提下计算统计量在此前提下计算统计量根据其分布函数,通过查该分布的界根据其分布函数,通过查该分布的界值表,得到大于或等于此统计量值的值表,得到大于或等于此统计量值的概率概率P P21配对的主要形式有:配对的主要形式有:同源同源配对配对同一同一受试对象处理前后的数据;受试对象处理前后的数据;同一同一受试对象两个部位的数据;受试对象两个部位的数据;同一同一样品用两种方法(仪器)检验的结果;样品用两种方法(仪器)检验的结果;异源异源配对配对配对的配对的两个两个受试对象分别接受两种处理后的数据。受试对象分别接受两种处理后的数据。配对目的:推断两种处理(方法
11、)的结果有无差别。配对目的:推断两种处理(方法)的结果有无差别。二、配对设计的差值均数与总体均数配对设计的差值均数与总体均数0的比较的比较22=n-1 其中其中 为差值的均数,为差值的均数,为差值的标准差,为差值的标准差,为差值的标准误,为差值的标准误,n 为对子数。为对子数。nSdSdSdtddd00ddSdSPaired t test23例例15 按性别、年龄相近、病情相近把按性别、年龄相近、病情相近把 16 例某例某病患者配成病患者配成 8 对,每对分别给予对,每对分别给予A药和药和B药治疗,药治疗,现测得治疗后血沉(现测得治疗后血沉(mm/h)结果如表)结果如表15-8,问不同药物治疗
12、后病人血沉水平是否有差别?问不同药物治疗后病人血沉水平是否有差别?24表表 15 8 不同药物治疗后某病患者的血沉值不同药物治疗后某病患者的血沉值/(mm/h)对子号对子号 A药药 B药药 d d2(1)(2)(3)(4)=(2)-(3)(5)1 10 6 4 16 2 13 9 4 16 3 6 3 3 9 4 11 10 1 1 5 10 10 0 0 6 7 4 3 9 7 8 2 6 36 8 8 5 3 9 d=24 d2=96251.建立假设,确定检验水准建立假设,确定检验水准 H0:d=0 H1:d0 =0.052.选定检验方法,计算统计量选定检验方法,计算统计量()582.48
13、852.130852.11/22nSdSdtnnddSddd263.确定确定 P 值,作出推断结论值,作出推断结论 v=n 1=8 1=7,查,查 t 界值表,界值表,t0.05,7=2.365本例本例 t=4.582 t0.05,7,所以,所以 P0.05。结论:结论:在在 a=0.05 水准上拒绝水准上拒绝 H0,接受,接受 H1,可认为不同药物治疗后病人血沉水平不同。可认为不同药物治疗后病人血沉水平不同。27 例例 有有12名接种卡介苗的儿童,八周后用两批不名接种卡介苗的儿童,八周后用两批不同的结核菌素,一批是标准结核菌素,一批是同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别
14、注射在儿童的前臂,两种新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应直径(结核菌素的皮肤浸润反应直径(mm)如下表,)如下表,问两种结核菌素的反应性有无差别?问两种结核菌素的反应性有无差别?28 12名儿童分别用两种结核菌素皮肤浸润反应结果名儿童分别用两种结核菌素皮肤浸润反应结果被检测者号被检测者号 标准品标准品 新制品新制品 d d2 (1)(2)(3)(4)=(2)-(3)(5)1 12.0 10.0 2.0 4.00 2 14.5 10.0 4.5 20.25 3 15.5 12.5 3.0 9.00 4 12.0 13.0 -1.0 1.00 5 13.0 10.0 3
15、.0 9.00 6 12.0 5.5 6.5 42.25 .12 10.5 9.5 1.0 1.00合计合计 39()195d)(2d291.建立检验假设,确定检验水准建立检验假设,确定检验水准H0:d =0,即两种结果相同,即两种结果相同 H1:d 0,即两种结果不同,即两种结果不同 =0.05(双双侧检验侧检验)2.计算检验统计量计算检验统计量 已知已知:d=39 d2=195 5195.412/4909.225.3/0nSdSdtdd4909.211212/)39(1951/)(222nnddSd25.31239ndd303.确定确定P值,作出推断结论值,作出推断结论=n-1=12-1=
16、11 t0.05(11)=2.201 t0.01(11)=3.106 本例本例t=4.5195 t0.01(11),P0.01,差别有高度差别有高度统计学意义,统计学意义,按按=0.01水准,拒绝水准,拒绝H0,接受接受H1,可认为两种方法皮肤浸润反应结果不同。可认为两种方法皮肤浸润反应结果不同。31例例 设有设有12名志愿受试者服用某减肥药,服药前和名志愿受试者服用某减肥药,服药前和 服药后一个疗程各测量一次体重(服药后一个疗程各测量一次体重(kg),数据),数据 如下表。问此减肥药是否有效?如下表。问此减肥药是否有效?32某减肥药研究的体重(某减肥药研究的体重(kg)观察值)观察值个体号个
17、体号 服药前服药前 服药后服药后 d d2(1)(2)(3)(4)=(3)-(2)(5)1 101 100 -1 1 2 131 136 5 25 3 131 126 -5 25 4 143 150 7 49 5 124 128 4 16 6 137 126 -11 121 7 126 116 -10 100 8 105 115 10 100 9 100 97 -3 9 10 107 97 -10 100 11 94 84 -10 100 12 101 109 8 64 合计合计 d=-16 d2=710331.建立假设,确定检验水准建立假设,确定检验水准 H0:d=0,即该减肥药无效即该减肥
18、药无效 H1:d0 ,即该减肥药有效即该减肥药有效 单侧单侧=0.052.选定检验方法,计算统计量选定检验方法,计算统计量58.01291.733.1091.71/22nSdSdtnnddSddd343.确定确定 P 值,作出推断结论值,作出推断结论 v=n 1=12 1=11,查,查 t 界值表,界值表,t0.05,11=1.796(单侧)(单侧)本例本例 t=0.58 t0.05,11,所以,所以 P 0.05。结论:结论:在在 a=0.05 水准上不拒绝水准上不拒绝 H0,可认为,可认为服用该减肥药前后体重差异无统计学意义。服用该减肥药前后体重差异无统计学意义。35两种类型:两种类型:n
19、 选择一定数量的观察单位,将它们随机分为两组或选择一定数量的观察单位,将它们随机分为两组或多组,分别给予不同处理;多组,分别给予不同处理;n 从两组或多组具有不同特征的人群中,分别随机抽从两组或多组具有不同特征的人群中,分别随机抽取一定取一定 数量的样本,比较某一指标在不同特征人群数量的样本,比较某一指标在不同特征人群中是否相等。中是否相等。比较目的:比较目的:推断两样本各自代表的总体均数推断两样本各自代表的总体均数1 和和2 是否相同。是否相同。三、完全随机设计两个样本均数的比较完全随机设计两个样本均数的比较36=n-1(一)(一)u 检验检验 当两样本含量均较大时,如均大于当两样本含量均较
20、大时,如均大于100,可用下式,可用下式进行进行 u 检验。检验。式中式中 为两样本均数之差的标准误为两样本均数之差的标准误。222121212121nSnSXXSXXuXX21XXS37例例 某医师为研究血清胆固醇水平与职业的关系,某医师为研究血清胆固醇水平与职业的关系,得调查资料如下表,问这两种职业的血清胆得调查资料如下表,问这两种职业的血清胆 固醇水平是否不同?固醇水平是否不同?38两种职业血清胆固醇水平两种职业血清胆固醇水平/(mmol/L)职业类型职业类型 人数人数 均值均值 标准差标准差 教师教师 537 4.8 0.72 工人工人 643 4.6 0.81391.建立假设,确定检
21、验水准建立假设,确定检验水准 H0:1=2,两种职业的血清胆两种职业的血清胆 固醇水平相同固醇水平相同 H1:12,两种职业的血清胆两种职业的血清胆 固醇水平不同固醇水平不同 =0.052.选定检验方法,计算统计量选定检验方法,计算统计量448.464381.053772.06.48.42222212121nSnSXXu403.确定确定 P 值,作出推断结论值,作出推断结论 查查 u 界值表,界值表,u0.05=1.96,u=4.488 u0.05所以,所以,P0.05。结论:结论:在在 a=0.05 水准上,拒绝水准上,拒绝H0,接受,接受H1,两种,两种职业血清胆固醇水平的差异有统计学意义
22、,可认为职业血清胆固醇水平的差异有统计学意义,可认为教师的血清胆固醇水平高于工人。教师的血清胆固醇水平高于工人。41=n-1(二)(二)t 检验检验 t 检验用于检验用于两样本含量两样本含量 n1、n2 较小时,要较小时,要求样本来自求样本来自正态分布正态分布总体,且要求两总体,且要求两总体总体方差相等(又称方差齐性)方差相等(又称方差齐性)。422121XXSXXt2121221nnnnSScXX211212222112nnSnSnSc式中式中 为两样本均数之差的标准误为两样本均数之差的标准误;为两样本合并方差。为两样本合并方差。21XXS2cS43 例例16 某医师分别抽取原发性高血压病人
23、某医师分别抽取原发性高血压病人25例例和脑卒中病人和脑卒中病人27例,测定其尿酸的含量,结果例,测定其尿酸的含量,结果见表见表15-9。问原发性高血压病人和脑卒中病人。问原发性高血压病人和脑卒中病人的尿酸含量有无差别?的尿酸含量有无差别?44表表 15 9 原发性高血压病人与脑卒中病人的尿酸含量(原发性高血压病人与脑卒中病人的尿酸含量(mmol/L)组别组别 例数例数 均数均数 标准差标准差原发性高血压原发性高血压 25 221.7 86.1 脑卒中脑卒中 27 246.5 96.9451.建立假设,确定检验水准建立假设,确定检验水准 H0:1=2,原发性高血压病人和脑卒中原发性高血压病人和脑
24、卒中 病人的尿酸含量无差别病人的尿酸含量无差别 H1:12,原发性高血压病人和脑卒中原发性高血压病人和脑卒中 病人的尿酸含量有差别病人的尿酸含量有差别 =0.0546973.05.255.2467.2212121 XXSXXt5.25272527259.84402121221nnnnSScXX9.8440127259.961271.8612521122212222112nnSnSnSc2.选定检验方法,计算统计量选定检验方法,计算统计量473.确定确定 P 值,作出推断结论值,作出推断结论 v=(n1-1)+(n2-1)=(25-1)+(27-1)=50查查 t 界值表,界值表,t0.05,5
25、0=2.009,t=0.973 t0.05,50 所以,所以,P0.05。结论:结论:在在 a=0.05 水准上,不拒绝水准上,不拒绝H0,尚不能认为,尚不能认为原发性高血压和脑卒中病人的尿酸含量不同。原发性高血压和脑卒中病人的尿酸含量不同。48 单样本单样本(one sample t test)t检验检验 配对样本配对样本(paired t test)两独立样本两独立样本(two independent samples t-test)单样本单样本 两独立样本两独立样本 数值变量数值变量 假设检验假设检验u检验检验49第五节第五节 方差分析方差分析(Analysis of Variance)方
26、差分析由英国统计学方差分析由英国统计学家家R.A.Fisher在在1923年年提出,为纪念提出,为纪念Fisher,以以F 命名,故方差分析命名,故方差分析又称又称 F 检验。检验。50例例17 某研究者将某研究者将 27 只雄性大鼠随机分成只雄性大鼠随机分成三组(每组三组(每组 9 只),给予不同处理后只),给予不同处理后 3 周,周,测定血清中的测定血清中的SOD(超氧化物歧化酶)活性。(超氧化物歧化酶)活性。结果见下表。问三组的结果见下表。问三组的SOD活性是否相同活性是否相同?51三组大鼠血清中三组大鼠血清中SOD活性活性/(mol/L)对照组对照组 环孢素组环孢素组 环孢素环孢素+精
27、氨酸组精氨酸组 365.1 348.3 360.5 394.2 355.2 368.0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.7 352.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4 360.5 350.2 372.1想一想,可否用想一想,可否用 t 检验检验?多次使用多次使用t ttesttest,使犯第使犯第类错误类错误(假阳性错误)的概率增大(假阳性错误)的概率增大;资料的利用率很低,统计量所对应的资料的利用率很低,统计量所对应的自由度减小,结论不可靠;自由度减小,结论
28、不可靠;分裂了原先的整体设计,结论片面。分裂了原先的整体设计,结论片面。试想假设检验时通常检验水平试想假设检验时通常检验水平取取0.05,亦即,亦即弃真概率控制在弃真概率控制在0.05以内,但将以内,但将3个均数作两两个均数作两两比较,要作三次比较,总可靠度成为比较,要作三次比较,总可靠度成为(1-0.05)3=0.8574个均数比较作个均数比较作6次次 (1-0.05)6=0.7355均数比较作均数比较作10次次(1-0.05)10=0.5996均数比较作均数比较作15次次(1-0.05)15=0.463 54 方差分析(方差分析(analysis of variance,ANOVA)又称又
29、称变异数分析变异数分析或或 F 检验检验。主要原理:主要原理:将各组数据的总变异按设计及研将各组数据的总变异按设计及研究目的分为若干部分,再计算各部分的均方,两究目的分为若干部分,再计算各部分的均方,两均方之比为均方之比为 F 值。值。F 值与值与 F 临界值比较,决定临界值比较,决定 P 值大小,再根据值大小,再根据 P 值大小推断结论。值大小推断结论。55基本思想:基本思想:按分析目的和设计把全部数据之间按分析目的和设计把全部数据之间的总变异分成两部分或更多部分,然后借助的总变异分成两部分或更多部分,然后借助F分布作出统计推断。分布作出统计推断。总变异总变异=组间变异组间变异+组内变异组内
30、变异56用途:用途:n 两个或两个以上样本均数的比较;两个或两个以上样本均数的比较;n 分析一个、两个或者多个因素的作用和影响;分析一个、两个或者多个因素的作用和影响;n 分析因素之间的独立作用或交互作用;分析因素之间的独立作用或交互作用;n 两样本或多样本的方差齐性检验。两样本或多样本的方差齐性检验。用途和适用条件用途和适用条件57适用条件:适用条件:n 各样本是相互各样本是相互独立独立的随机样本;的随机样本;n 各样本来自各样本来自正态总体正态总体;n 各处理组各处理组总体方差相等总体方差相等(齐性)。(齐性)。58类型类型n 单因素方差分析单因素方差分析(one-way ANOVA)也称
31、)也称完全完全随机设计随机设计的方差分析,单向或单方式方差分析,的方差分析,单向或单方式方差分析,该设计只能分析一个因素下多个水平对试验结果该设计只能分析一个因素下多个水平对试验结果的影响。的影响。n 双因素方差分析双因素方差分析(two-way ANOVA)也称也称随随机区组设计机区组设计的方差分析,双向或双方式方差分析,的方差分析,双向或双方式方差分析,该设计可分析两个因素。一个为处理因素,一个该设计可分析两个因素。一个为处理因素,一个为区组因素。为区组因素。59n 三因素方差分析三因素方差分析也称拉丁方设计(也称拉丁方设计(Latin square design)的方差分析,该设计可以同
32、时分析三个因)的方差分析,该设计可以同时分析三个因素对试验结果的作用,且三个因素之间相互独立,素对试验结果的作用,且三个因素之间相互独立,不能有交互作用。不能有交互作用。n 析因设计的方差分析析因设计的方差分析(factorial design)当两个)当两个因素或多个因素之间存在相互影响或交互作用时,因素或多个因素之间存在相互影响或交互作用时,可用该设计进行分析。该设计不仅可以分析多个可用该设计进行分析。该设计不仅可以分析多个因素的独立作用,也可分析多个因素之间的交互因素的独立作用,也可分析多个因素之间的交互作用,是一种高效率的方差分析方法。作用,是一种高效率的方差分析方法。60 单因素方差
33、分析(单因素方差分析(one-way ANOVA)也)也称完全随机设计的方差分析,单向或单方式称完全随机设计的方差分析,单向或单方式方差分析,该设计只能分析一个因素下多个方差分析,该设计只能分析一个因素下多个水平对试验结果的影响。水平对试验结果的影响。一、完全随机设计完全随机设计多个样本均数比较多个样本均数比较 方差分析的数据格式方差分析的数据格式 1jX2 jXkjX1X2XkXkn组组 别别 编编 号号1 12 2 k kX X1111X X2121 X Xk1k1X X1212X X2222 X Xk2k2 X X1j1jX X2j2j X Xkjkj n n1 1n n2 2 lXij
34、第第i 个组的第个组的第j 个观察值个观察值li=1,2,klj=1,2,ni ni第第i 个处理组的例数个处理组的例数lni=N,=第第i组的均数组的均数=l =总的均数总的均数=各种符号的意义各种符号的意义jijixn1ijijxN1ixx有关方差分析的几个概念有关方差分析的几个概念什么是方差?什么是方差?离均差离均差 离均差之和离均差之和 离均差平方和离均差平方和 SSj0)(jiji2)(ijijn方差(方差(2,S2)也叫均方()也叫均方(MS)n自由度:自由度:=N-1n关系:关系:MS=SS/=)1/()(2Nijij65基本思想:基本思想:按分析目的和设计把全部数据之间按分析目
35、的和设计把全部数据之间的总变异分成两部分或更多部分,然后借助的总变异分成两部分或更多部分,然后借助F分布作出统计推断。分布作出统计推断。总变异总变异=组间变异组间变异+组内变异组内变异66 三组大鼠血清中三组大鼠血清中SOD活性活性/(mol/L)对照组对照组 环孢素组环孢素组 环孢素环孢素+精氨酸组精氨酸组 365.1 348.3 360.5 394.2 355.2 368.0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.7 352.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4
36、360.5 350.2 372.1从这个表,可以看到从这个表,可以看到三种变异:三种变异:组内数据的变异组内数据的变异 组内变异组内变异 三组之间数据的变异三组之间数据的变异 组间变异组间变异 全部数据间的变异全部数据间的变异 总变异总变异 67 组间变异组间变异主要受到主要受到处理因素处理因素和和个体误差个体误差两方面影两方面影响,响,组内变异组内变异主要受主要受个体误差个体误差的影响。当的影响。当H0为真时,为真时,由于处理因素不起作用,组间变异只受个体误差的影由于处理因素不起作用,组间变异只受个体误差的影响。此时,组间变异与组内变异相差不能太大,两部响。此时,组间变异与组内变异相差不能太
37、大,两部分的均方(方差)也相差不大,分的均方(方差)也相差不大,其比值其比值 F 值接近值接近1。如果比值远远大于如果比值远远大于1,如大于,如大于3-5倍时,则处理因倍时,则处理因素就产生作用,影响了数据的结果。素就产生作用,影响了数据的结果。68 离均差平方和与其自由度之比在方差分析中称为离均差平方和与其自由度之比在方差分析中称为均方均方(记作(记作MS),当),当 H0 为真时,组间均方与组内为真时,组间均方与组内均方相差不大,两者比值均方相差不大,两者比值 F 值约接近于值约接近于1。即。即 F=组间均方组间均方/组内均方组内均方 169 当当H0不成立时,处理因素产生了作用,使得组不
38、成立时,处理因素产生了作用,使得组间均方增大,此时间均方增大,此时 F 1,当大于等于当大于等于F 临界值时,临界值时,则则P0.05,可认为可认为H0不成立,各样本均数不全相不成立,各样本均数不全相等。等。70F 值与值与 F 分布分布n 组间均方与组内均方的比值称为组间均方与组内均方的比值称为 F 统计量,服统计量,服从从 F 分布,即分布,即:n 如果如果 H0 成立,即各处理组的样本来自相同总成立,即各处理组的样本来自相同总体,处理因素没有作用,则组间变异同组内变体,处理因素没有作用,则组间变异同组内变异一样,只反映随机误差作用的大小。异一样,只反映随机误差作用的大小。MSFMS组间组
39、内714.3.3 4.3.3 F F分布分布图图4-3 4-3 不同自由度时的不同自由度时的F F分布曲线分布曲线 F分布有两个自由度,第一自由度分布有两个自由度,第一自由度()是分子的自由是分子的自由度,第二自由度度,第二自由度()是分母的自由度。是分母的自由度。1210221,10521,2110,11021,F F分布是方差比的分布,常用于分布是方差比的分布,常用于方差齐性检验、方差分析等。方差齐性检验、方差分析等。2221SSF 72变异的分割及其意义变异的分割及其意义总变异总变异=组内个体差异组内个体差异+组间差异组间差异73组内变异组内变异(SS 组内组内)组内各个观测值组内各个观
40、测值 X i j 与本组内均值与本组内均值 之差之差的平方和。反映了组内(同一水平下)样本的随的平方和。反映了组内(同一水平下)样本的随机波动。机波动。iX211inkijiijSSXX组内74组间变异组间变异(SS 组间组间)组内均值组内均值 与总均值与总均值 之差的平方和。反之差的平方和。反映了处理因素各个水平组间的差异,同时也包含映了处理因素各个水平组间的差异,同时也包含了随机误差。了随机误差。iX21kiiiSSnXX组间X75总变异总变异(SS 总总)全部测量值大小不同,这种变异称为总变异,全部测量值大小不同,这种变异称为总变异,以各测量值以各测量值 X ij与总均数与总均数 间的差
41、异度量。间的差异度量。211inkijijSSXX总X76总变异、组间变异、组内变异的关系总变异、组间变异、组内变异的关系:SSSSSS总组间组内总组间组内对应自由度的关系对应自由度的关系:77均方均方(mean square)n 离均差平方和大小离均差平方和大小:与变异程度大小有关与变异程度大小有关 与其自由度大小有关与其自由度大小有关n 将各部分离均差平方和除以相应自由度,其比将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方值称为均方差,简称均方(MS)。/k1/nkMSSSSSMSSSSS组间组间组间组间组内组内组内组内组间均方:组内均方:78方差分析表方差分析表79例例1
42、7 某研究者将某研究者将 27 只雄性大鼠随机分成只雄性大鼠随机分成三组(每组三组(每组 9 只),给予不同处理后只),给予不同处理后 3 周,周,测定血清中的测定血清中的SOD(超氧化物歧化酶)活性。(超氧化物歧化酶)活性。结果见下表。问三组的结果见下表。问三组的SOD活性是否相同活性是否相同?80 三组大鼠血清中三组大鼠血清中SOD活性活性/(mol/L)对照组对照组 环孢素组环孢素组 环孢素环孢素+精氨酸组精氨酸组 365.1 348.3 360.5 394.2 355.2 368.0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.7 352
43、.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4 360.5 350.2 372.1从这个表,可以看到从这个表,可以看到三种变异:三种变异:组内数据的变异组内数据的变异 组内变异组内变异 三组之间数据的变异三组之间数据的变异 组间变异组间变异 全部数据间的变异全部数据间的变异 总变异总变异 81 对照组对照组 环孢素组环孢素组 环孢素环孢素+精氨酸组精氨酸组 合计合计 365.1 348.3 360.5 394.2 355.2 368.0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.
44、7 352.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4 360.5 350.2 372.1 ni 9 9 9 27 3358.1 3118.1 3323.1 9799.3 373.1 346.5 369.2 1255770.5 1081872.7 1227682.9 3565326.1iXiX2iX821.建立假设,确定检验水准建立假设,确定检验水准 H0:1=2=3 H1:1、2、3 不等或不全相等不等或不全相等 =0.05832.选定检验方法,计算统计量选定检验方法,计算统计量5062.013735.18-8797.19-
45、3735.183556528.91-93323.13118.13358.1-n8797.193556528.91-3565326.10C-91.3556528273.9799222i2i222组间总组内组间总SSSSSSCXSSXSSNXC848.855210.921867.60210.92245062.011867.6023735.18243-27-2131261-271-组内组间组内组内组内组间组间组间组内组间总MSMSFvSSMSvSSMSkNvkvNv853.确定确定 P 值,作出推断结论值,作出推断结论以以 v组间组间 为为 v1,以,以 v组内组内 为为 v2,查附表,查附表 F
46、界值表,界值表,得得F0.01(2,24)=5.61,本例,本例 F F0.01(2,24),故,故 P0.01。结论:结论:按按 a=0.05 检验水准,拒绝检验水准,拒绝 H0,接受,接受 H1,可认,可认为三组的为三组的 SOD 活性有差别,但不能认为任何两组活性有差别,但不能认为任何两组SOD活性均有差别。活性均有差别。8687P19720088表表 15 12 例例 17 资料的方差分析表资料的方差分析表变异来源变异来源 SS v MS F P 总总 8797.19 26 组间组间 3735.18 2 1867.59 8.854 0.01 组内组内 5062.01 24 210.92
47、89二、二、随机区组设计随机区组设计资料的方差分析资料的方差分析 随机区组设计随机区组设计(randomized block design)又又称为配伍组设计,涉及称为配伍组设计,涉及处理因素处理因素(主要因素)(主要因素)和和区组因素区组因素(配伍组因素,个体特征),故随(配伍组因素,个体特征),故随机区组设计的多个样本均数比较分析又称两因机区组设计的多个样本均数比较分析又称两因素方差分析。素方差分析。90随机区组设计资料常见情况:随机区组设计资料常见情况:n 区组设计资料区组设计资料:先将全部观察对象按某种或某些:先将全部观察对象按某种或某些特征分为若干个区组,每个区组的观察对象数等于特征
48、分为若干个区组,每个区组的观察对象数等于处理组数处理组数 k,然后将同一区组的,然后将同一区组的 k 个对象随机分配个对象随机分配到到 k 个不同的处理组所得到的数据资料;个不同的处理组所得到的数据资料;n 同一个对象的同一个对象的k个部位测定同一指标所得的数据个部位测定同一指标所得的数据资料;资料;n 同一样品用多种不同方法测定同一指标所得的数同一样品用多种不同方法测定同一指标所得的数据资料。据资料。91随机区组设计资料数据结构随机区组设计资料数据结构92变异分解变异分解总变异总变异SST可分解为:可分解为:n 处理因素处理因素的的变异变异SSA SSA 反映了各个水平组间的差异反映了各个水
49、平组间的差异(包含随机误差包含随机误差)n 区组因素区组因素的的变异变异SSB SSB 反映了各个区组间的差异反映了各个区组间的差异(包含随机误差包含随机误差)n 随机误差随机误差SSe SSe 反映了样本的随机波动反映了样本的随机波动三者的关系如下:三者的关系如下:eBATSSSSSSSS93方差分析表方差分析表94例例18 按性别相同、年龄相近、病情相近按性别相同、年龄相近、病情相近把把 33 例某病患者配成例某病患者配成 11 个区组,每区组个区组,每区组 3 个个患者,分别给予患者,分别给予A 药、药、B 药和药和 C药治疗。治疗药治疗。治疗后患者血浆中的后患者血浆中的 IGA 含量见
50、表含量见表15-14。问经三。问经三种不同药物治疗后该病患者血浆中种不同药物治疗后该病患者血浆中IGA含量有含量有无差别?无差别?95区组号区组号 A药药 B药药 C药药 1 1.67 1.77 2.10 5.54 2 2.04 2.03 2.07 6.14 3 1.38 1.45 1.48 4.31 4 1.02 1.09 1.07 3.18 5 1.29 1.15 1.92 4.36 6 1.32 1.05 1.28 3.65 7 1.17 1.26 1.08 3.51 8 2.12 1.87 2.07 6.06 9 1.64 1.72 1.65 5.01 10 1.75 1.85 2.4
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。