1、1 应用多元统计分析 第三章第三章 多元正态总体多元正态总体 参数的假设检验参数的假设检验(二二)2第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验目目 录录(二二)3.3 多总体均值向量的检验多总体均值向量的检验3.4 协差阵的检验协差阵的检验3.5 独立性检验独立性检验3.6 正态性检验正态性检验 第三章所涉及的最大似然估计量小结第三章所涉及的最大似然估计量小结 3第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 当当p1时,因时,因 且相互独立,故有且相互独立,故有 1.两
2、总体协差阵相等两总体协差阵相等(但未知但未知)时均值向量的检验时均值向量的检验 设设X()(1,n)为来自总体为来自总体XNp(1),)的随机的随机样本;样本;Y()(1,m)为来自总体为来自总体Y Np(2),)的随机样本的随机样本,且相互独立且相互独立,未知未知.检验检验.:,:)2()1(1)2()1(0HH),(),(2)2(12)1(1mNYnNX),)11(,(2)2()1(1mnNYX4第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 取检验统计量为取检验统计量为 t(n+m-2)(
3、在在H0成立时成立时),即即 5第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 推广到推广到p元总体元总体,检验统计量的形式类似检验统计量的形式类似,可考虑以下检可考虑以下检验统计量验统计量T2:其中其中A1和和A2是两总体的样本离差阵是两总体的样本离差阵.它们是一元统计中它们是一元统计中的偏差平方和的偏差平方和(X(i)-X)2在在p元情况下的推广元情况下的推广.以下来证以下来证明统计量明统计量T 2 T 2(p,n+m-2).因因),0()(),)11(,0(00pHpHNYXmnnmmnN
4、YX下下6第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 由由Wishart分布的可加性知分布的可加性知 A1+A2Wp(n+m-2,),由由T2统计量的定义统计量的定义3.1.5可知可知),1()()(1)(1nWXXXXApn),1()()(1)(2mWYYYYApn7第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 利用利用T2与与F的关系,检验统计量取为的关系,检验统计量取为 可以证明可以证
5、明T2(或或F)统计量是检验以上假统计量是检验以上假设设H0的似然比统计量的似然比统计量.(见习题见习题3-10)8第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子 例例3.3.1 为了研究日、美两国在华投资企业对中国为了研究日、美两国在华投资企业对中国经营环境的评价是否存在差异经营环境的评价是否存在差异,今从两国在华投资企业今从两国在华投资企业中各抽出中各抽出10家家,让其对中国的政治、经济、法律、文化让其对中国的政治、经济、法律、文化环境进行打分环境进行打分,评分结果见表评分结果见表3.
6、2(表中表中1至至10号为美国在号为美国在华投资企业的代号华投资企业的代号,11至至20号为日本在华投资企业的代号为日本在华投资企业的代号号.数据来源于数据来源于:国务院发展研究中心国务院发展研究中心APEC在华投资企在华投资企业情况调查业情况调查).解解 比较日、美两国在华投资企业对中国多方面的比较日、美两国在华投资企业对中国多方面的经营环境的评价是否有差异问题经营环境的评价是否有差异问题,就是两总体均值向量就是两总体均值向量是否相等的检验问题是否相等的检验问题.(见见yydy331a.sas或或yydy331b.sas)9第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3
7、.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子 10第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子 记美国在华投资企业对中国记美国在华投资企业对中国4个方面的经营环境的个方面的经营环境的评价为评价为4维总体维总体X,并设并设XN4(1),).日本在华投资企日本在华投资企业对中国经营环境的评价为业对中国经营环境的评价为4维总体维总体Y,并设并设YN4(2),).来自两总体的样本容量来自两总体的样本容量n=m=10.检验检验取检验统计量为取检验统计量为 由
8、样本值计算得:由样本值计算得:X(64,43,30.5,63),Y(51.5,51,40,70.5),.:,:)2()1(1)2()1(0HH11第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子进一步计算可得:进一步计算可得:12第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子对给定显著性水平对给定显著性水平=0.01,利用统计软件进行检验时,利用统计软件进行检验时,首先计算首先计算p值值
9、(此时检验统计量此时检验统计量FF(4,15):p=PF6.2214=0.0037.因因p值值=0.00370.01=,故否定故否定H0,即日、美两国在华投即日、美两国在华投资企业对中国经营环境的评价存在显著性差异资企业对中国经营环境的评价存在显著性差异.在这种在这种情况下情况下,可能犯第一类错误可能犯第一类错误,且犯第一类错误的概率为且犯第一类错误的概率为0.01.13第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两个两个p元正态总体元正态总体 2.两总体协差阵不等时均值向量的检验两总体协差阵不等时均值向量的检验 在一元统
10、计中在一元统计中(p=1时时),当,当12 22时时,检验检验H0:(1)(2)也没有很好的方法,以下介绍实用中的几种方法也没有很好的方法,以下介绍实用中的几种方法.当当n=m时时,作为成对数据进行处理作为成对数据进行处理.令令Z(i)=X(i)-Y(i)(i=1,n),化为单个化为单个p元总体元总体Z的均值检的均值检验问题验问题 H0:(1)(2)H0:Z0 利用前面介绍的方法进行检验利用前面介绍的方法进行检验.注意:在这里两组样本相互独立的信息没有利用注意:在这里两组样本相互独立的信息没有利用.14第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检
11、验多总体均值向量的检验-两个两个p元正态总体元正态总体 当当nm时时(不妨设不妨设nm):想法也是化为单个想法也是化为单个p元元新总体的均值检验问题新总体的均值检验问题.若只取若只取n对数据按方法处理对数据按方法处理,又将损失一些信息又将损失一些信息.改进的办法是利用改进的办法是利用X(i)(i=1,n)和和Y(j)(j=1,m),构造新总体构造新总体Z的样本的样本Z(i),令令可以证明:可以证明:)2()1()2()1()2()2()2()1()(1)(mnmnnmnmnZE15第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验
12、-两个两个p元正态总体元正态总体所以所以Z(i)N p(1)-(2),Z)(i1,n),且相互独立且相互独立.利用利用前面介绍的单个正态总体均值向量的检验方法进行检前面介绍的单个正态总体均值向量的检验方法进行检验验.当当1,2相差甚大时相差甚大时,可构造近似检验统计量进可构造近似检验统计量进行检验行检验(见参考文献见参考文献1).21mnZ其中其中16第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析 多个正态总体均值向量的检验问题也称为多元方差多个正态总体均值向量的检验问题也称为多元方差分析分析.设有设有
13、k个个p元正态总体元正态总体Np(t),)(t1,k),样品样品 (t1,k,1,nt)是来自是来自Np(t),)的随机样的随机样本,检验本,检验 H0:(1)(k),H1:至少存在至少存在ij使得使得(i)(j)(即即(1),(k)中至少有一对不等中至少有一对不等).当当p=1时时,此检验问题就是一元方差分析问题此检验问题就是一元方差分析问题,比如比比如比较较k个不同品牌的同类产品中一个质量指标个不同品牌的同类产品中一个质量指标X(如耐磨度如耐磨度)有无显著差异的问题有无显著差异的问题,我们把不同品牌对应不同总体我们把不同品牌对应不同总体(假假定为正态总体定为正态总体),这种多组比较问题就是
14、检验问题这种多组比较问题就是检验问题.)()(tX17第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析 从第从第i个总体抽取容量为个总体抽取容量为ni的随机样本如下的随机样本如下(i=1,k;记记n=n1+n2+nk):18第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析(p=1)当当p=1时时,利用一元方差分析的思想来构造检验统计量利用一元方差分析的思想来构造检验统计量.记记 则有则有平方和分解公式:平方和分解公式
15、:SSTSSA+SSE 19第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析(p=1)直观考察直观考察,若若H0成立成立(即即k个总体均值个总体均值无显著差异无显著差异),当当总偏差平方和总偏差平方和SST固定不变时固定不变时,应有组间偏差平方和应有组间偏差平方和 SSA小小,而组内偏差平方和而组内偏差平方和 SSE大大,因而比值因而比值SSA/SSE应应很小很小.检验统计量取为检验统计量取为 给定显著性水平给定显著性水平,按传统检验方法按传统检验方法,查查F分布临界值表分布临界值表得得F满足:满足:PF
16、F,否定域否定域WFF.20第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析 推广到推广到k个个p元总体元总体Np(t,)(假定假定k个总体的协差阵相个总体的协差阵相等,且记为等,且记为),记第记第i个个p元总体的数据阵为元总体的数据阵为对总离差阵进行分解:对总离差阵进行分解:)()()()(11)()(XXXXTijkinjiji)()()()()()(11)()()()(XXXXXXXXiiijkinjiiiji),1()()()()()()1()()(1)(1)(11)(kiXXxxxxXiniip
17、ninipiipniiii21第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析 其中其中 称为组间离差阵称为组间离差阵.0)()(1)()(injijXXi因故交叉项故交叉项=OkinjiikinjiijiijiiXXXXXXXX11)()(11)()()()()()()()(kiiiikiiXXXXnA1)()(1)(kiiiiXXXXnB1)()()(kiiAA1称为组内离差阵称为组内离差阵.22第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向
18、量的检验多元方差分析多元方差分析 根据直观想法及用似然比原理得到检验根据直观想法及用似然比原理得到检验H0的统计量为的统计量为 由由Wishart分布的定义容易得出分布的定义容易得出:因因 Ai Wp(ni-1,)且相互独立且相互独立(i1,k),由可加性由可加性可得可得AA1+AkWp(n-k,)(n=n1+nk).在在H0下,下,TWp(n-1,).还可以证明在还可以证明在H0下下,BWp(k-1,),且且B与与A相互独相互独立立.23第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析多元方差分析根据根据分布的定义
19、,可知分布的定义,可知 给定显著性水平给定显著性水平,查查Wilks分布临界值表分布临界值表,可得可得,使使 P,故否定域故否定域W.当手头没有当手头没有Wilks临界值表时临界值表时,可用可用2分布或分布或F分布来分布来近似近似,即由即由的函数的近似分布进行检验的函数的近似分布进行检验(见参考文献见参考文献1或或2).24第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验多元方差分析的例子多元方差分析的例子 例例3.3.2 为了研究某种疾病为了研究某种疾病,对一批人同时测量了对一批人同时测量了四个指标四个指标:脂蛋白脂蛋白(X1
20、),甘油三酯甘油三酯(X2),脂蛋白脂蛋白(X3),前前脂蛋白脂蛋白(X4).按不同年龄、不同性别分为三组按不同年龄、不同性别分为三组(20至至35岁的女性、岁的女性、20至至25岁的男性和岁的男性和35至至50岁的男性岁的男性),数据数据见书中表见书中表3.3.试问这三组的四项指标间有无显著性差试问这三组的四项指标间有无显著性差异异?解解 比较三个组比较三个组(k=3)的的4项指标项指标(p=4)间是否有差异间是否有差异问题,就是多总体均值向量是否相等的检验问题问题,就是多总体均值向量是否相等的检验问题.设设第第i组为组为4维总体维总体N4(i),)(i=1,2,3).来自来自3个总体的样本
21、个总体的样本容量容量n1=n2=n3=20.检验检验 H0:(1)(2)(3)H1:(1),(2),(3)至少有一对不相等至少有一对不相等.(见见yydy332?.sas)25第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-两总体均值检验例子两总体均值检验例子 26第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子多元方差分析的例子 因似然比统计量因似然比统计量(p,n-k,k-1),此例中此例中k-1=2,可以可以利用利用统计量与统计量与F统
22、计量的关系统计量的关系,取检验统计量为取检验统计量为F统计统计量:量:由样本值计算得:由样本值计算得:X=(259.08,84.12,32.37,17.8),27第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子多元方差分析的例子)()()()(11)()(XXXXTtktntt28第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子多元方差分析的例子进一步计算可得进一步计算可得对给定对给定=0.01,利用统计软件利用统计软件(如
23、如SAS系统系统),首先计算首先计算p值值(此时检验统计量此时检验统计量FF(8,108):p=PF3.09007=0.003538.因因p值值=0.0035380.01=,故否定故否定H0,这表明三个组的指这表明三个组的指标之间有显著的差异标之间有显著的差异.在这种情况下在这种情况下,可能犯第一类错误可能犯第一类错误,且第一类错误的概率为且第一类错误的概率为0.01.29第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子多元方差分析的例子 进一步地若还想了解三个组指标间的差异究竟是哪进一步地若还想了解三个组指
24、标间的差异究竟是哪几项指标引起的几项指标引起的,可以对可以对4项指标逐项用一元方差分析项指标逐项用一元方差分析方法进行检验方法进行检验,我们将发现三组指标间只有第一项指标我们将发现三组指标间只有第一项指标X1有显著差异有显著差异.事实上事实上,用一元方差分析检验第一项指标用一元方差分析检验第一项指标X1在三个组在三个组中是否有显著差异时中是否有显著差异时,因因 12111)(111SST)(kiniixXt1211)(1)(111SSE)(kiniiixXa30第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.3 多总体均值向量的检验多总体均值向量的检验-多元方差分析的例子
25、多元方差分析的例子其中其中t11和和a11分别是分别是T和和A中的第一个对角元素中的第一个对角元素.p1=PF18.8780=0.0004401(检验统计量检验统计量F1F(2,57)p值值=0.0004401显著地小于显著地小于0.01,故第一项指标故第一项指标X1在三个组中有显著差异在三个组中有显著差异.31第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-单个单个p元正态总体元正态总体 设设X()(=1,n)为来自为来自p元正态总体元正态总体Np(,)(0未知未知)的随机样本的随机样本,检验检验 H0:0(00为已知阵为已知阵),
26、H1:0 1.当当0 Ip时检验时检验H0:Ip,H1:Ip 利用似然比原则来导出检验统计量利用似然比原则来导出检验统计量1 当当Ip成立时成立时,似然函数似然函数L(,Ip)在在X达最大值达最大值.32第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-单个单个p元正态总体元正态总体 所以所以似然比统计量似然比统计量 其中其中 33第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-单个单个p元正态总体元正态总体 利用定理利用定理3.2.1可知可知,当当n很大且很大且H0成立时成立
27、时,=-2ln1的近似分布为的近似分布为2(p(p+1)/2),参数空间参数空间 的维数为的维数为p+p(p+1)/2,而而 0的维数为的维数为p,故卡方分布的自由度故卡方分布的自由度为为p(p+1)/2.取取作为检验统计量作为检验统计量,按传统检验方法按传统检验方法,对对给定显著性水平给定显著性水平,否定域为否定域为 2,其中其中2 满足:满足:P 2=.34第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-单个单个p元正态总体元正态总体 2.当当0 I p时检验时检验H0:0,H1:0 因因00,存在存在p阶非退化阵阶非退化阵D,使
28、使D0DI p,令令 Y()=DX()(1,n),则则Y()N p(D,DD)=N p(*,*)检验检验H 0:0 H0:*I p 从新样本从新样本Y()(=1,n)出发,检验出发,检验H0:*Ip的检验统计量取为的检验统计量取为记为记为35第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-单个单个p元正态总体元正态总体 其中其中 若注意到若注意到D0DI p,即即,)(101110DDDDDD)(tr)(tr)(tr)(tr10*ADDADDAA|10*ADADDDAA.,)()(XDYDXY36第三章第三章 多元正态总体参数的假设检
29、验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-单个单个p元正态总体元正态总体 研究似然比统计量研究似然比统计量2的抽样分布是很困难的的抽样分布是很困难的.通常根通常根据定理据定理3.2.1由由2的近似分布来构造检验法的近似分布来构造检验法.当样本容量当样本容量n很大,在很大,在H0成立时,成立时,-2ln2 的极限分布为的极限分布为2(p(p+1)/2).除此外在不同适用范围下还有其它近似分布可用来除此外在不同适用范围下还有其它近似分布可用来构造检验法构造检验法.则似然比统计量则似然比统计量2还可以表示为还可以表示为 37第三章第三章 多元正态总体参数的假设检验多元正态
30、总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-单个单个p元正态总体元正态总体 3.检验检验H0:20(2 未知未知)当当0 Ip 时此检验常称为球性检验时此检验常称为球性检验.利用似然比利用似然比原则来导出检验统计量原则来导出检验统计量3:当当2给定时给定时,似然函数似然函数L(,20)在在=X达最大值达最大值,且且38第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-单个单个p元正态总体元正态总体 可得出可得出 39第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验
31、-单个单个p元正态总体元正态总体 所以似然比统计量所以似然比统计量 或等价于或等价于 当样本容量当样本容量n很大,在很大,在H0为真时有以下近似分布:为真时有以下近似分布:40第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-多个多个p元正态总体元正态总体 设有设有k个总体个总体Np(t,t)(t=1,k),X(t)()(t1,k;1,n t)来自第来自第t个总体个总体Np(t),t)的随机样本的随机样本,记记nn1+n2+nk.检验检验H0:1=2=k,H1:1,2,k不全相等不全相等.样本样本 X(t)()的似然函数为的似然函数为似
32、然比统计量似然比统计量4为为),(),()(1)(1)1(ttkttkkLL),(max),(max)(1)1(0,)()1(0,4)()(kkkLLiii41第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-多个多个p元正态总体元正态总体),;,(),()()()(1)()1()()1(iinkiikixxfLiiiniiiinkipnxx1)()()()()(1212)(21etr|)2()(21etr|)2()()()()(1212iiiiiinkipnXXnAii),(),(max的分母1)()(1)1(0,4)(ktttttk
33、knAXLLiiktnttnpnppnnttktpnttttnAeenA12222212)2()2(42第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-多个多个p元正态总体元正态总体 则似然比检验统计量为则似然比检验统计量为)()(21etr|)2(1)()()()(1122kiiiiiiknnpXXnAA),(),(21etr|)2()()1()()1(122nAXXLXXLAkknnp222)()1(0,4)2(),(max的分子)(nnpnpknAeLi(其中其中 A=A1+Ak)43第三章第三章 多元正态总体参数的假设检验多元
34、正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-多个多个p元正态总体元正态总体 根据无偏性的要求进行修正根据无偏性的要求进行修正,将将4中的中的ni用用ni-1替代替代,n用用n-k替代替代.然后对然后对4取对数取对数,可得到统计量:可得到统计量:当样本容量当样本容量n很大时很大时,在在H0为真时为真时M有以下近似分布:有以下近似分布:(1-d)M=-2(1-d)ln4*2(f)其中其中 f=p(p+1)(k-1)/2,44第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-多个多个p元正态总体元正态总体(例例)例例3.3
35、.1 对例对例3.2.3表表3.3中给出的身体指标化验数据中给出的身体指标化验数据,试判断三个组试判断三个组(即三个总体即三个总体)的协差阵是否相的协差阵是否相(=0.10)?解解 这是三个这是三个4维正态总体的协差阵是否相等的检验维正态总体的协差阵是否相等的检验问题问题.设第设第i组为组为4维总体维总体N4(i),i)(i=1,2,3).来自三个总体来自三个总体的样本容量的样本容量n1=n2=n3=20.检验检验H0:123,H1:1,2,3至少有一对不相等至少有一对不相等.在在H0成立时成立时,取近似检验统计量为取近似检验统计量为2(f)统计量:统计量:由样本值计算三个总体的样本协差阵:由
36、样本值计算三个总体的样本协差阵:45第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-多个多个p元正态总体元正态总体(例例)46第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-多个多个p元正态总体元正态总体(例例)47第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协差阵的检验协差阵的检验-多个多个p元正态总体元正态总体(例例)进一步计算可得进一步计算可得 48第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 协
37、差阵的检验协差阵的检验-多个多个p元正态总体元正态总体(例例)对给定对给定=0.10,利用统计软件利用统计软件(如如SAS系系统统),首先计算,首先计算p值值(设检验统计量设检验统计量2(20):p=P 20.331621=0.4373646.因因p值值=0.43736460.10=,故故H0相容相容,这这表明三个组的协差阵之间没有显著的差表明三个组的协差阵之间没有显著的差异异.49第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 -多个正态总体均值向量和协差阵的同时检验多个正态总体均值向量和协差阵的同时检验 设有设有k个总体个总体Np(t),t)(t=1,k)
38、,X(t)()(t1,k;1,nt)来自第来自第t个总体个总体Np(t,t)的随机样本的随机样本,记记nn1+n2+nk.检验检验 H0:(1)=(2)=(k)=,1=2=k=,H1:(1),(2),(k)或或1,2,k不全相等不全相等.记记 50第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 -多个正态总体均值向量和协差阵的同时检验多个正态总体均值向量和协差阵的同时检验 似然比统计量似然比统计量5为为),(max),(max)(1)1(0,0,5)(kkLLii2220,|1|)2(),(),(maxnpnnpeTnnTXLL51第三章第三章 多元正态总体参
39、数的假设检验多元正态总体参数的假设检验3.4 3.4 -多个正态总体均值向量和协差阵的同时检验多个正态总体均值向量和协差阵的同时检验 则检验以上假设则检验以上假设H0的样本的样本 X(t)()似然函数为似然函数为),(),(max)(1)(1)1(0,)(ttkttkkLLii21221)(|)2(),(npktnttnpktttttenAnAXLt52第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 -多个正态总体均值向量和协差阵的同时检验多个正态总体均值向量和协差阵的同时检验 若用若用表示当协差阵均相同时检验表示当协差阵均相同时检验k个总体均值向个总体均值向
40、量是否相等的似然比统计量,将发现这里的检验统量是否相等的似然比统计量,将发现这里的检验统计量计量5=4.在实际应用中我们采用类似的修正方法,在在实际应用中我们采用类似的修正方法,在5中用中用nt-1替代替代nt,用用n-k替代替代n.修正后的统计量记为修正后的统计量记为5*:53第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 -多个正态总体均值向量和协差阵的同时检验多个正态总体均值向量和协差阵的同时检验 当样本容量当样本容量n很大,在很大,在H0为真时为真时5*有以下近似分布:有以下近似分布:其中其中 54第三章第三章 多元正态总体参数的假设检验多元正态总体参
41、数的假设检验3.4 3.4 -多个正态总体均值向量和协差阵的同时检验多个正态总体均值向量和协差阵的同时检验 例例3.3.2 对例对例3.2.3表表3.3给出的身体指标化验数据给出的身体指标化验数据,试判断三个组,试判断三个组(即三个总体即三个总体)的均值向量和协差阵是的均值向量和协差阵是否全都相等否全都相等(=0.05)?解解 这是三个这是三个4维正态总体的均值向量和协差阵是维正态总体的均值向量和协差阵是否同时相等的检验问题否同时相等的检验问题.取近似检验统计量为近似取近似检验统计量为近似2统统计量:计量:=-2(1-b)ln5*2(f).由样本值计算三个总体的样本协差阵见例由样本值计算三个总
42、体的样本协差阵见例3.3.1,所有所有样本的总离差阵样本的总离差阵T见例见例3.2.3.进一步计算可得进一步计算可得55第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.4 3.4 -多个正态总体均值向量和协差阵的同时检验多个正态总体均值向量和协差阵的同时检验 对给定对给定=0.05,利用统计软件利用统计软件(如如SAS系统系统),首先计算首先计算p值值(设检验统计量设检验统计量 2(28):p=P 43.1408=0.03373.因因p值值=0.033730.05=,故否定故否定H0,这表明三个组的均这表明三个组的均值向量和协差阵之间有显著的差异值向量和协差阵之间有显著的
43、差异.在这种情况下在这种情况下,可可能犯第一类错误能犯第一类错误,且第一类错误的概率且第一类错误的概率0.05.56第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.5 3.5 独立性检验独立性检验 设总体设总体XNp(,),将将X剖分为剖分为k个子向量个子向量,而而和和也也相应剖分为相应剖分为其中其中p=p1+pk,且知且知pt维子向量维子向量X(t)Npt(t),tt)(t1,k).若若k个随机子向量相互独立个随机子向量相互独立,把把p维维(高维高维)随机向量的随机向量的问题化为问题化为k个低维随机向量的问题来处理,在处理多元个低维随机向量的问题来处理,在处理多元统计分
44、析的许多问题中将带来极大的方便统计分析的许多问题中将带来极大的方便.57第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.5 3.5 独立性检验独立性检验 在第二章我们已介绍过若在第二章我们已介绍过若X(1),X(k)相互独立相互独立,则有则有ij O(对一切对一切ij).因此检验因此检验X(1),X(k)是否相互独立的是否相互独立的问题等价于检验对任二个子向量问题等价于检验对任二个子向量,其协差阵其协差阵ij 是否等于是否等于O(对一切对一切ij).在正态总体下,独立性检验可化为检验在正态总体下,独立性检验可化为检验H0:ij O(一切一切ij),H1:ij O,至少有一
45、对至少有一对ij.设设X(t)(t1,n,np)为来自总体为来自总体X的随机样本的随机样本.将将样品样品X(t),样本均值样本均值X和样本离差阵和样本离差阵A作相应剖分为作相应剖分为58第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.5 3.5 独立性检验独立性检验 用似然比原理用似然比原理,在在H0成立时成立时,X(t)()Npt(t),tt)(t1,k;1,n)且相互独立,故样本的似然函数为且相互独立,故样本的似然函数为 所以似然比统计量的分子为所以似然比统计量的分子为59第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.5 3.5 独立性检验独立
46、性检验 似然比统计量为似然比统计量为Box证明了证明了,在在H0成立下当成立下当n时时,-blnV2(f),其中其中 .ln2ln,ln2lnnVVn60第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.5 3.5 独立性检验独立性检验-例例 例例3.4.1 试检验例试检验例3.2.1女性汗液数据中随机向量女性汗液数据中随机向量X的三个分量是否相互独立的三个分量是否相互独立(=0.05).解解 记随机向量记随机向量X=(X1,X2,X3),假定假定XN3(,),且记且记=(ij).检验检验 H0:12=0,13=0,230,H1:12,13,23不全为不全为0.取检验统计量
47、为取检验统计量为 当当X的三个分量相互独立,且样本容量的三个分量相互独立,且样本容量n很大时很大时,近近似于似于2(f).61第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.5 3.5 独立性检验独立性检验-例例 由表由表3.1的样本值计算样本离差阵的样本值计算样本离差阵A,可得:可得:此例中此例中n=20,p=3,p1=p2=p3=1,k=3.进一步计算可得进一步计算可得:b=17.1667,f=3,62第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.5 3.5 独立性检验独立性检验-例例 对给定显著性水平对给定显著性水平=0.05,用统计软件用统
48、计软件SAS系系统计算时,通过计算统计算时,通过计算p值进行检验:值进行检验:p=P9.7555=0.02076.因因p值值=0.020760.05=,故否定故否定H0,即随机向即随机向量的三个分量不相互独立量的三个分量不相互独立.在这种情况下,可能在这种情况下,可能犯第一类错误,且第一类错误的概率为犯第一类错误,且第一类错误的概率为0.05.7555.9)5665.0ln(1667.17lnVb63第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.6 3.6 正态性检验正态性检验 在均值和协差阵的检验中在均值和协差阵的检验中,以及以后将介绍的一些以及以后将介绍的一些统计方
49、法中都是假定样本来自统计方法中都是假定样本来自p元正态总体元正态总体.所作统计所作统计推断的结论是否正确推断的结论是否正确,在某种意义上取决于实际总体与在某种意义上取决于实际总体与正态总体接近的程度如何正态总体接近的程度如何?因此建立一些方法来检验多因此建立一些方法来检验多元观测数据与多元正态数据的差异是否显著是十分必元观测数据与多元正态数据的差异是否显著是十分必要的要的.设设X()(X1,Xp)(1,n)是来自是来自p元总体元总体X的样的样本本,试问总体试问总体X是否服从是否服从Np(,)分布分布?若总体若总体X(X1,Xp)Np(,),利用多元正态分布的利用多元正态分布的一些性质可知一些性
50、质可知(记记=(1,p),=(ij)pp):64第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.6 3.6 正态性检验正态性检验 每个分量每个分量XiN(i,ii)(i1,p).任二个分量任二个分量(Xi,Xj)二元正态分布二元正态分布.设设l=(l1,lp)为任给的为任给的p维常向量维常向量,令令lX,则则N1(l,ll).令令=(X-)-1(X-),则则2(p).正态随机向量正态随机向量X的概率密度等高线为椭球的概率密度等高线为椭球.若总体若总体X为多元正态总体为多元正态总体,必具有以上所列的几条性必具有以上所列的几条性质质.如果如果X具有以上这些性质具有以上这些性质