1、 应用多元统计分析 第三章第三章 多元正态总体多元正态总体 参数的假设检验参数的假设检验(一一)1第1页,共62页。北大北大数学学院数学学院3.1 几个重要统计量的分布几个重要统计量的分布 一、一、正态变量二次型的分布正态变量二次型的分布 二、二、威沙特分布威沙特分布 三、三、霍特林霍特林T2分布分布 四、四、威尔克斯统计量威尔克斯统计量3.2 单总体均值向量的检验及置信域单总体均值向量的检验及置信域3.3 多总体均值向量的检验多总体均值向量的检验第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验目目 录录(一一)2第2页,共62页。北大北大数学学院数学学院 一元统计中一元统计
2、中,参数参数,2 2的检验涉的检验涉及到一个总体、二个总体及到一个总体、二个总体,乃至多个乃至多个总体的检验问题总体的检验问题;推广到推广到p元统计分析中元统计分析中,类似地对类似地对参数向量参数向量和参数矩阵和参数矩阵 涉及到的涉及到的检验也有一个总体、二个总体检验也有一个总体、二个总体,乃至乃至多个总体的检验问题。多个总体的检验问题。第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3第3页,共62页。北大北大数学学院数学学院 在一元统计中,用于检验在一元统计中,用于检验,2 2的抽样分的抽样分布有布有2 2分布分布,t 分布分布,F分布等分布等,它们都是由它们都是由来自总
3、体来自总体N(N(,2 2)的样本导出的检验统计的样本导出的检验统计量量.推广到多元统计分析后,也有相应于以上推广到多元统计分析后,也有相应于以上三个常用分布的统计量三个常用分布的统计量:Wishart,Wishart,Hotelling Hotelling T 2 2,Wilks,Wilks 统计量统计量,讨论这些统讨论这些统计量的分布是多元统计分析所涉及的假设计量的分布是多元统计分析所涉及的假设检验问题的基础检验问题的基础.第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验4第4页,共62页。北大北大数学学院数学学院 设设Xi N N1 1(i ,2 2)()(i=1,.=
4、1,.,n),),且相互独立,记且相互独立,记第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-分量独立的正态变量二次型分量独立的正态变量二次型一般情况一般情况(i 0 0,2 2 11时时),),结论结论1 15第5页,共62页。北大北大数学学院数学学院 结论结论2 2 当当i0(0(i=1,=1,n),),2 2=1 1时时,XX的分布的分布常称为非中心常称为非中心2 2分布分布.第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-分量独立的正态
5、变量二次型分量独立的正态变量二次型 定义定义3.1.13.1.1 设设n维随机向量维随机向量XN Nn(,In)(0),0),则称随机变量则称随机变量XX为服从为服从 n个自由度个自由度,非中心参数非中心参数的的2 2分布,记为分布,记为 )(),(22nXXnXXnii 126第6页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-分量独立的正态变量二次型分量独立的正态变量二次型则则 结论结论3 3 设设XNn(0,2 2In),A为为n阶对称方阵阶对称方阵,rk(rk(A)=)=r
6、,则二次型则二次型 XAX/22 2(r)A2 2A(A为对称幂等阵为对称幂等阵).2221),(1其中nXXYY特例特例:当当A=In时时,)(/222nXXXIXn7第7页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-非中心非中心 t 分布和分布和F F分布分布定义定义3.1.23.1.2定义定义3.1.33.1.38第8页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分
7、布-非中心非中心t t分布的应用分布的应用 一元统计中,关于一个正态总体一元统计中,关于一个正态总体N(N(,2 2)的均值检的均值检验中,检验验中,检验H H0 0:0 0时,检验统计量时,检验统计量否定域为否定域为|T|,其中其中满足:满足:P|P|T|=(显著性水平显著性水平).).9第9页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-非中心非中心t分布的应用分布的应用 当否定当否定H H0 0时,可能犯第一类错误,且时,可能犯第一类错误,且 第一类错误的概率第一类错误的概率
8、P P“以真当假以真当假”P P|T|0 0 显著性水平显著性水平.当当H H0 0相容时,可能犯第二类错误,且相容时,可能犯第二类错误,且 第二类错误的概率第二类错误的概率P P“以假当真以假当真”P P|T|=1 1 0 0 =.此时检验统计量此时检验统计量Tt(n-1,-1,),利用非中心利用非中心 t t分布分布可以计算第二类错误可以计算第二类错误的值的值.10第10页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-WishartWishart分布分布(威沙特分布威沙特分布)
9、Wishart分布是一元统计中分布是一元统计中2分布的推广分布的推广.多元正态总体多元正态总体Np(,)中中,常用样本均值向量常用样本均值向量X作为作为的估计,样本协差阵的估计,样本协差阵SA/(n-1)作为作为的的估计估计.由第二章的定理由第二章的定理2.5.2已给出了已给出了XNp(,/n).S?.一元统计中,用样本方差一元统计中,用样本方差作为作为2的估计,而且知道的估计,而且知道niiXXns12)(2)(11)1()(1212)(2nXXnii11第11页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计
10、量的分布几个重要统计量的分布-WishartWishart分布分布(威沙特分布威沙特分布)推广到推广到p元正态总体元正态总体,样本协差阵样本协差阵SA/(n-1)及随及随机矩阵机矩阵A(离差阵离差阵)的分布是什么的分布是什么?设设X()(1,n)为来自为来自Np(0,)的随机样本的随机样本,考虑考虑随机矩阵随机矩阵的分布的分布.当当p=1时时,pnnpnnnXXXXXXXXW)()1()()1(1)()(,).(,2211)()1()()1(12)(nXXXXXXXWnnnnn12第12页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.
11、1 3.1 几个重要统计量的分布几个重要统计量的分布-WishartWishart分布分布(威沙特分布威沙特分布)推广到推广到p维正态总体时,随机矩阵维正态总体时,随机矩阵W的分布是什么的分布是什么?定义定义3.1.4 设设X()Np(0,)(1,n)相相互独立,则称随机矩阵互独立,则称随机矩阵的分布为的分布为Wishart分布分布(威沙特分布威沙特分布),记,记为为WWp(n,).显然显然p=1时时 ,即即XXXXWn1)()()(2122)(nXWn13第13页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计
12、量的分布几个重要统计量的分布-WishartWishart分布分布(威沙特分布威沙特分布)一般地一般地,设设X()Np(,)(1,n)相互独立相互独立,记记则称则称WXX服从非中心参数为服从非中心参数为的非中心的非中心Wishart分布分布,记为记为WWp(n,).其中其中14第14页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-WishartWishart分布分布(威沙特分布威沙特分布)当当X()Np(,)(1,n)相互独立时,非中心相互独立时,非中心参数参数这里这里其中其中p为
13、随机矩阵为随机矩阵W的阶数的阶数,n为自由度为自由度,一元统计中一元统计中的的2对应对应p元统计中的协差阵元统计中的协差阵.15第15页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-WishartWishart分布分布的性质的性质 性质性质1 设设X()Np(,)(1,n)相互独立,则样相互独立,则样本离差阵本离差阵A服从服从Wishart分布,即分布,即 证明证明 根据第二章根据第二章2.5的定理的定理2.5.2知知而而ZNp(0,)(=1,n-1)相互独立相互独立,由定义由定义
14、 3.1.4可知可知AWp(n-1,).),1()()(1)(nWXXXXApnZZAn1116第16页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-WishartWishart分布分布的性质的性质 由于由于Wishart分布是分布是2分布的推广分布的推广,它具有它具有2分布分布的一些性质的一些性质.性质性质2 关于自由度关于自由度n具有可加性:具有可加性:设设Wi Wp(ni,)(i1,k)相互独立,则相互独立,则 性质性质3 设设p阶随机阵阶随机阵WWp(n,),C是是mp常数
15、阵常数阵,则则m阶随机阵阶随机阵CWC也服从也服从Wishart分布分布,即即CWCWm(n,CC).),(11kkipinnnnWW其中17第17页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-WishartWishart分布分布的性质的性质证明证明其中其中 ZNp(0,)(=1,n)相互独立相互独立.令令Y=CZ,则则YNm(0,CC).故故 ).,(),(1CCnWCCWCCnWYYmmn故CCWCZCZYYnnd11由定义由定义3.1.4有有:),(因1dnWZZWpn18
16、第18页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-WishartWishart分布分布的性质的性质 aWWp(n,a)(a0,为常数为常数).在性质在性质3 中只须取中只须取Ca1/2 Ip,即得此结论即得此结论.特例:特例:设设l(l1,lp),则则 lWl W1(n,ll),即即 22(n)(其中其中2ll).在性质在性质3中只须取中只须取Cl,即得此结论即得此结论.思考思考:试问随机阵试问随机阵W的对角元素的对角元素Wii的分布?的分布?19第19页,共62页。北大北大数
17、学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-WishartWishart分布分布的性质的性质 性质性质4 4 分块分块Wishart矩阵的分布矩阵的分布:设设X()Np(0,)(1,n)相互独立,其中相互独立,其中又已知随机矩阵又已知随机矩阵则则(习题习题3-4)rpr22211211),(W222112111)()(nrprWWWWXXWpn20第20页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统
18、计量的分布-WishartWishart分布分布的性质的性质 性质性质5 设随机矩阵设随机矩阵WWp(n,),则则 E(W)n.证明证明:由定义由定义3.1.4,知知),(1dnWZZWpn其中其中ZNp(0,)(=1,n)相互独立相互独立.则则.)(D)(E)(E11nZZZWnn21第21页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布分布 一元统计中一元统计中,若若XN(0,1),2(n),X与与 相互独立相互独立,则随机变量则随机变量下面把下面
19、把 的分布推广到的分布推广到p元总体元总体.设总体设总体XNp(0,),随机阵随机阵W Wp(n,),我们来讨论我们来讨论T2nXW-1 X的分的分布布.XXnnXt122).(ntnXt22第22页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布分布 定义定义3.1.5 设设XNp(0,),随机阵随机阵WWp(n,)(0,np),且且X与与W相互独立相互独立,则称统计量则称统计量T2nXW-1 X 为为Hotelling T2 统计量统计量,其分布称其
20、分布称为服从为服从n个自由度的个自由度的T2 分布分布,记为记为T2 T2(p,n).更一般地更一般地,若若XNp(,)(0),则称则称T2 的分的分布为布为非中心非中心Hotelling T2 分布,记为分布,记为 T2 T2(p,n,).23第23页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布的性质分布的性质 性质性质1 设设X()Np(,)(1,n)是来自是来自p元总体元总体Np(,)的随机样本的随机样本,X和和A分别为总体分别为总体Np(,)
21、的样本的样本均值向量和离差阵均值向量和离差阵,则统计量则统计量事实上事实上,因因 )1,()()()()(1(2112npTXSXnXAXnnT).,0()(),1,(ppNXnnNX则24第24页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布的性质分布的性质 而而AWp(n-1,),且且A与与X相互独立相互独立.由定义由定义 3.1.5知知)1,()()()()()1()()()1(21112npTXSXnXAXnnXnAXnnTAnS1125第25
22、页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布的性质分布的性质 性质性质2 T2与与F分布的关系分布的关系:设设T2T2(p,n),则则在一元统计中在一元统计中)1,(12pnpFTnppn).,1(/1/则),(若22nFnXtntnXt且相互独立),(),1,0(设2nNX26第26页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Ho
23、telling T 2分布的性质分布的性质当当p=1时时,一维总体一维总体XN(0,2),所以所以 注意注意:因因nnpnpnp1,1这是性质这是性质2的特例的特例:即即p=1时时,T2F(1,n).)(即),(222112)(1)()(dnnWXXXWnn27第27页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布的性质分布的性质一般地:一般地:(性质性质2的严格证明见参考文献的严格证明见参考文献2)其中其中X-1 X2(p,)(0),还可以证明还可以
24、证明2(n-p+1),且且与与独立独立.28第28页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布的性质分布的性质 性质性质3 设设XNp(,),随机阵随机阵WWp(n,)(0,np),且且X与与W相互独立相互独立,T2nXW-1 X为非中心为非中心Hotelling T2 统计量统计量(T2 T2(p,n,).21(,1,)npFTF p npnp1则则其中非中心参数其中非中心参数 .29第29页,共62页。北大北大数学学院数学学院第三章第三章 多元
25、正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布的性质分布的性质 或 性质性质3 设设X()Np(,)(1,n)是来自是来自p元总元总体体Np(,)的随机样本的随机样本,X 和和A分别为样本均值向量分别为样本均值向量和离差阵和离差阵.记记.),(1,)1(1212 npnpFnTppnXAXnnT其中则30第30页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布的性质
26、分布的性质 一元统计中一元统计中(p=1时时),t 统计量与参数统计量与参数2无关无关.类似类似地有以下性质地有以下性质.性质性质4 T2统计量的分布只与统计量的分布只与p,n有关有关,而与而与无关无关.即即则相互独立和又设独立相互和设;),(),0(;),(),0(00WXnWWNXWUInWWINUpppppp).,(21d10npTXWXnUWUn31第31页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Hotelling T 2分布的性质分布的性质 事实上事实上,因因XNp
27、(0,)(0),WWp(n,),则则-1/2XNp(0,Ip),因此因此32第32页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 分布的定义分布的定义 一元统计中一元统计中,设设2(m),2(n),且相互独立且相互独立,则则 在总体在总体N(1,2(x)和和N(2,2(y)方差齐性检验中方差齐性检验中,设设X(i)(i=1,m)为来自总体为来自总体N(1,2(x)的样本的样本,Y(j)(j=1,n)为为来自总体来自总体N(2,2(y)的样本的样本.取取2(x)和和2(y
28、)的估计量的估计量(样本方差样本方差)分别为分别为njjymiixYYnsXXms12)(212)(2,)(11,)(11).,(/nmFnmF33第33页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 分布的定义分布的定义检验统计量检验统计量 p元总体元总体Np(,)中中,协差阵协差阵的估计量为的估计量为A/(n-1)或或A/n.在检验在检验H0:12时时,如何用一个数值来描述如何用一个数值来描述估计矩阵的离散程度呢估计矩阵的离散程度呢.一般可用矩阵的行列式、迹一般可用
29、矩阵的行列式、迹或特征值等数量指标来描述总体的分散程度或特征值等数量指标来描述总体的分散程度.)1,1(下220nmFssFHyx34第34页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 分布的定义分布的定义 定义定义3.1.6 设设XNp(,),则称协差阵的行列则称协差阵的行列式式|为为X的广义方差的广义方差.若若X()(1,n)为为p元总体元总体X的随机样本,的随机样本,A为样本离差阵为样本离差阵,有了广义方差的概念后有了广义方差的概念后,在多元统计的协差阵齐在多元
30、统计的协差阵齐次检验中次检验中,类似一元统计类似一元统计,可考虑两个广义方差之可考虑两个广义方差之比构成的统计量比构成的统计量Wilks统计量的分布统计量的分布.35第35页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 分布的定义分布的定义 定义定义3.1.7 设设A1Wp(n1,),A2Wp(n2,)(0,n1p),且且A1与与A2独立独立,则称广义方差之比则称广义方差之比为为Wilks(或或)统计量统计量,其分布称为其分布称为Wilks(威尔威尔克斯克斯)分布分布,
31、记为记为 (p,n1,n2)(或或p,n1,n2)|211AAA36第36页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 统计量的统计量的性质性质 在实际应用中在实际应用中,常把常把统计量化为统计量化为T2统计量统计量,进而化进而化为为F统计量统计量,利用我们熟悉的利用我们熟悉的F统计量来解决多元统统计量来解决多元统计分析中有关检验的问题计分析中有关检验的问题.结论结论1 当当n21时时,设设n1=np,则则注意注意:在这里记号在这里记号(p,n,1)有两重含义有两重含
32、义:统计量统计量(也是随机也是随机变量变量);其其分布是参数为分布是参数为p,n,1的威尔克斯分布的威尔克斯分布.37第37页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 统计量的统计量的性质性质或或 证明证明 设设X()(1,n,n+1)相互独立同相互独立同Np(0,)分布分布,显然有显然有38第38页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilk
33、s 统计量的统计量的性质性质由定义由定义3.1.7,知,知),()(1)(1nWXXWpn),1()1()1(1)(11)(nWXXWXXWpnnn).1,(1npWW39第39页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 统计量的统计量的性质性质利用分块矩阵求行列式的公式利用分块矩阵求行列式的公式(见附录的推论见附录的推论4.1):,)1()1(1nnXXWW又因|1)1(11)1()1(1)1(11)1(1)1()1(1WXXWXWXWpXXWnnnnnn2112
34、212112212111212211AAAAAAAAAAA40第40页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 统计量的统计量的性质性质所以所以结论结论2 当当n22时时,设设n1np,则则),(11111|)1,(2d)1(11)1(1dnpTnXWXWWnpnn41第41页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 统计量的统计量的性质
35、性质 结论结论3 当当p=1时,则时,则因因p=1时时,(1,n1,n2)就是就是(n1/2,n2/2)利用贝塔分布与利用贝塔分布与F分布的关系分布的关系,即有以上即有以上结论结论.42第42页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.1 3.1 几个重要统计量的分布几个重要统计量的分布-Wilks 统计量的统计量的性质性质结论结论4 当当p=2时,则时,则 结论结论5 当当n22,p2时时,可用可用2统计量或统计量或F统计量近统计量近似似.Box(1949)给出以下结论:给出以下结论:设设(p,n,n2),则当则当n时,时,-r
36、ln2(p n2),其中其中r=n-(p-n2+1)/2.(二个重要结论不要求二个重要结论不要求)43第43页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验 在多元统计分析中在多元统计分析中,考虑的总体是考虑的总体是p维正态维正态总体总体Np(,),关于均值向量的检验问题经常关于均值向量的检验问题经常是需要的是需要的.p元正态随机向量的每一个分量都是一元正态变量元正态随机向量的每一个分量都是一元正态变量,关于均值向量的检验问题能否化为关于均值向量的检验问题能否化为 p个一元正态的均个一元正态
37、的均值检验问题呢值检验问题呢?显然这是不完全的显然这是不完全的.因为因为p个分量之间往个分量之间往往有互相依赖的关系往有互相依赖的关系,分开作检验分开作检验,往往得不出正确的往往得不出正确的结论结论.但我们可以构造出类似于一元统计中的统计量但我们可以构造出类似于一元统计中的统计量,用来对均值向量进行检验用来对均值向量进行检验.44第44页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验关于均值向量的检验包括关于均值向量的检验包括:一个一个p元正态总体元正态总体Np(,),检验检验 H0:0;二
38、个二个p元正态总体元正态总体Np(1,1)和和Np(2,2),检验检验H0:12 k个个p元正态总体元正态总体Np(i,)(i1,k),当协当协差阵相等时检验差阵相等时检验k个均值向量是否全相等个均值向量是否全相等(即多元方差分析即多元方差分析).45第45页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验 设总体设总体XNp(,),随机样本随机样本X()(1,n).检验检验H0:0(0为已知向量为已知向量),H1:01.当当0已知时均值向量的检验已知时均值向量的检验利用二次型分布的结论利用二
39、次型分布的结论(“2.结论结论1”)知知).,0()(),1,(00ppNXnnNX因46第46页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验取检验统计量为取检验统计量为 按传统的检验方法按传统的检验方法,对给定的显著水平对给定的显著水平,查查2分布临界值表得分布临界值表得:47第47页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验 由样本值由样本值x()(1,n),计算计算X及及T20
40、值值,若若T20,则否定则否定H0,否则否则H0相容相容.利用统计软件利用统计软件(如如SAS系统系统),还可以通过计算显著还可以通过计算显著性概率值性概率值(p值值)给出检验结果给出检验结果,且由此得出的结论更丰且由此得出的结论更丰富富.假设在假设在H0成立情况下成立情况下,随机变量随机变量T20 2(p),由样由样本值计算得到本值计算得到T20的值为的值为d,可以计算以下概率值:可以计算以下概率值:p=P T20 d,常称此概率值为常称此概率值为显著性概率值显著性概率值,或简称为,或简称为p值值.48第48页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正
41、态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验 对给定的显著性水平对给定的显著性水平,当当p值值时时(即即d值大值大,X与与偏差大偏差大),则在显著性水平则在显著性水平下否定假设下否定假设H0;在这种在这种情况下情况下,可能犯可能犯“以真当假以真当假”的第一类错误的第一类错误,且且就就是犯第一类错误的概率是犯第一类错误的概率.当当p值值时时(即即d值小值小,X与与偏差小偏差小),则在显著性水平则在显著性水平下下H0相容;在这种情况下,可能犯相容;在这种情况下,可能犯“以假当真以假当真”的的第二类错误第二类错误,且犯第二类错误的概率且犯第二类错误的概率为为 =P T20|当
42、当=10,其中检验统计量其中检验统计量T20 2(p,),非中心参数非中心参数 =n(1-0)(0)-1(1-0).49第49页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验 p值的直观含义可以这样看值的直观含义可以这样看,检验统计量检验统计量T20的大的大小反映小反映X与与0的偏差大小的偏差大小,当当H0成立时成立时T20 值应较小值应较小.现在由观测数据计算现在由观测数据计算T20值为值为d;当当H0 成立时统计量成立时统计量T20 2(p),由由2分布可以计算该统计量分布可以计算该统计
43、量d的概率值的概率值(即即p值值).比如比如p值值=0.02=0.05,表示在表示在 0的假设下,的假设下,观测数据中极少会出现观测数据中极少会出现T20的值大于等于的值大于等于d值的情况值的情况,故在,故在0.05的水平下有足够的证据否定原假设,的水平下有足够的证据否定原假设,即认为即认为与与0 有显著地差异有显著地差异.50第50页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验 又比如当又比如当p值值=0.22=0.05时时,表示在表示在0的假设下,观测数据中经常会出的假设下,观测数据中
44、经常会出现现T20的值大于等于的值大于等于d值的情况,故在值的情况,故在0.05的水平下没有足够的证据否定原假的水平下没有足够的证据否定原假设,设,即认为即认为与与0 没有显著地差异没有显著地差异.51第51页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验 2.当当未知时均值向量的检验未知时均值向量的检验 当当p=1时时(一元统计一元统计),取检验统计量为,取检验统计量为 或等价地取检验统计量或等价地取检验统计量 52第52页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数
45、的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验推广到多元推广到多元,考虑统计量考虑统计量因因离差阵离差阵53第53页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验由定义由定义3.1.5可知可知利用利用T 2与与F分布的关系,检验统计量取为分布的关系,检验统计量取为54第54页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验例例3.2.1 例例3.2.1
46、人的出汗多少与人体内钠和钾的含量有一定的人的出汗多少与人体内钠和钾的含量有一定的关系关系.今测量了今测量了20名健康成年女性的出汗量名健康成年女性的出汗量(X1)、钠的含量钠的含量(X2)和钾的含量和钾的含量(X3)(数据见表数据见表3.1).试检验试检验 H0:=0=(4,50,10),H1:0.55第55页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验例例3.2.1 解解 记随机向量记随机向量X=(X1,X2,X3),假定假定XN3(,).检验检验 H0:0,H1:0.取检验统计量为取检
47、验统计量为926.6816.107372.3498.3795190.190708.54,)965.9,40.45,64.4(AX由样本值计算得由样本值计算得:56第56页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验例例3.2.157第57页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验例例3.2.1 对给定对给定=0.05,按传统的检验方法按传统的检验方法,可查可查F分布临界值表得分布临
48、界值表得=F3,17(0.05)=3.2,比较由样本值计算得到的比较由样本值计算得到的F值及临界值值及临界值,因因F值值=2.90453.2,故故H0相容相容.利用统计软件进行检验时利用统计软件进行检验时,首先计算首先计算p值值(此时检验统计此时检验统计量量FF(3,17):p=PF2.9045=0.06493.因因p值值=0.064930.05=,故故H0相容相容.在这种情况下,可能犯在这种情况下,可能犯第二类错误第二类错误,且第二类错误的概率为且第二类错误的概率为 =P F3.2|=X=0.3616(假定总体均值假定总体均值=10,取取1=X).58第58页,共62页。北大北大数学学院数学
49、学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验例例3.2.1proc iml;n=20;p=3;m0=4 50 10;use d321;/*使用使用SAS数据集数据集d321中的中的3个变量个变量*/xa=x1 x2 x3;read all var xa into x;/*把把 d321中三个变量的所有观测数据读入矩阵中三个变量的所有观测数据读入矩阵X*/ln=20 1;/*行向量行向量ln由由20个均为个均为1的元素组成的元素组成*/x0=(ln*x)/n;/*计算样本均值行向量计算样本均值行向量X*/xm=x0-m0;
50、以上计算结果可以用以上计算结果可以用SAS/IML计算计算,SAS程序如下程序如下(假设表假设表3.1的数据已生成名为的数据已生成名为d321的的SAS数据集数据集):(yydy321a.sas)59第59页,共62页。北大北大数学学院数学学院第三章第三章 多元正态总体参数的假设检验多元正态总体参数的假设检验3.2 单总体均值向量的检验单总体均值向量的检验例例3.2.1 mm=i(20)-j(20,20,1)/n;/*计算矩阵计算矩阵(In-J/n)*/a=x*mm*x;/*x表示计算矩阵表示计算矩阵X的转置的转置*/ai=inv(a);/*计算样本离差阵计算样本离差阵A和和A的逆的逆*/dd
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。