1、多元统计分析研究的对象 一元统计分析是研究一个随机变量统计规律性的学科。多元统计分析是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。它的内容既包括一元统计学中某些方法的直接推广,也包括多个随机变量特有的一些问题。多元统计分析是一类范围很广的理论和方法。多元统计分析研究的内容和方法简化数据结构(降维问题)箱式数据箱式数据平面数据平面数据变换主成分分析主成分分析Principle Analysis因子分析因子分析FactorAnalysis按观测点分类或按变量分组 分类比较是一切科学比较的基础和开端 对观测点分类:银行发放贷款 对各企业财务指标、信用状况进行分析 对变量分组:股
2、票市场是宏观经济的晴雨表 经济指标与股票市场各种指标间的群组关系多元统计分析研究的内容和方法聚类分析聚类分析判别分析判别分析Cluster AnalysisDiscriminant Analysis多元统计分析研究的内容和方法变量间的依存关系、相互关系寻找变量间的依存关系是一切科学研究的主要内容寻找一般的规律:预测、控制Regression AnalysisCanonical correlatinal analysis多元数据的统计推断关于参数估计和假设检验问题。特别是多元正态分布的均值向量及协方差阵的估计和假设检验等问题。多元统计分析的理论基础 包括多维随机向量及多维正态随机向量,及由此定义
3、的各种多元统计量,推导其分布和性质,研究它们的抽样分布理论。多元统计分析研究的内容和方法多元统计分析的应用 多元统计分析是解决实际问题的有效的数据处理法。它已广泛地应用于自然科学、社会科学的各个方面。如:教育学、医学、气象学、环境科学、地质学、考古学、服装工业服装的定形分类问题、经济学、农业、社会科学、文学、体育科学、军事科学、心理学、生物学、生态学、火警预报、地震预报、保险科学等领域。内容提要多元正态分布与参数估计1多元正态总体参数的检验2 回归分析 3 判别分析45 主成分分析6 因子分析7 聚类分析 典型相关分析8教学内容结构多元正态参数估计、检验OneTwoThree回归分析聚类分析判
4、别分析主成分分析因子分析多元统计分析典型相关分析(高惠旋 编著)北京大学出版社 Prentice Hall.2001,(4th ed).(张尧庭 方开泰 编著)科学出版社第一章多元正态分布与参数估计多元正态分布与参数估计1随机向量及其数字特征2多元正态分布的定义与基本性质3条件分布与独立性5多元正态分布的参数估计1 随机向量及其分布 P维随机向量 联合分布函数 联合密度函数.),(21pXXXX).,(),(221121pppxXxXxXPxxxF 1),()3(0),()2(),(),()1(21212121212112pppx xxpppdxdxdxxxxfxxxfdxdxdxxxxfxx
5、xFp特征函数一元随机变量 的特征函数:二元随机向量 的特征函数:P元随机向量 的特征函数:X).()(itXeEt ),(21XXX).()(),(221121Xt iXitXiteEeEtt),(21pXXXX).()(),(221121Xt iXitXitXitpeEeEtttpp.;0,0,0,),(21)(2121其它xxcexxfxx),(21XXX2X1X求1.边缘密度.2.与 是否相互独立?3.的特征函数例例1条件分布与独立性两随机向量间的条件分布)2()1(XXX),(1)1(qXXX),(1)2(pqXXXX),(1pxxF),(1pxxf).,(1ptt )1(X)2(X
6、),(11qxxF),(12pqxxF),(11qxxf),(12pqxxf).,(11qtt ).,(12pqtt.),(),()(121)2()1(1pqpxxfxxfxxf)2(X)1(X的D.F d.f c.f的D.F d.f c.f的D.F d.f c.f给定 时,的条件密度函数条件分布与独立性 两随机向量独立的充分必要条件t 与 相互独立t 相互独立 不成立)1(X)2(X.21FFF21fff21 ).()()1(1)2()1(1xfxxfnXXX,21.)(,独立jiXXji 随机向量的数字特征随机向量的数学期望随机向量X的方差阵或协方差阵.)(,),(),()(21pXEXE
7、XEEppijppppppXXXXXXXXXXXXXXXXXXEXXEXXEXD)(),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov()()(212221212111 标准差矩阵:).,(112/1ppdiagV .)()(,12/112/12/12/1VVRRVV qpqpppqqYXYXYXYXYXYXYXYXYXEYYEXXEYXCOV),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov(),cov()(),(212221212111ppXXXXXXXXXXXXppppR111212121
8、21,.)()(),cov(,jijiXXXDXDXXji 随机向量的数字特征两随机向量间的协方差阵随机向量X的相关系数阵随机向量的数字特征的性质 随机向量X与Y不相关:若X,Y 相互独立,则 ;反之不一定 成立。均值向量和协方差阵的性质:.),(OYXCovOYXCov),(CBXAECAXBE)()()()()(YBEXAEBYAXE)(),(XDXXCovBYXACovBYAXCov),(),(.)()()(AXADAXDbAXD),()()(),(XYCovEYEXYXEYXCov对称、非负定矩阵随机向量的数字特征的性质 其中L 为非负定矩阵.当矩阵 (正定)时,矩阵L称为 的平方根矩
9、阵,记为 协方差阵 还可分解为 (A 为可逆阵),2L02/1LAA 2 多元正态分布的定义与基本性质一元正态分布一元正态分布密度函数形式特征函数形式一般正态与标准正态之间的关系多个独立正态变量的线性组合仍为正态变量多元正态分布的定义与基本性质定义1 p 维标准正态分布 设 独立同分布于 ,则称随机向量 服从p 维正态分布,记pYYY,21)1,0(N),(21pYYYY).,(ppINY).21exp()2(1)(21exp)2(1),(222221221yyyyyyyyfppppY ).21exp()(21exp),(2222121t tttttttppY 特征函数:密度函数:多元正态分布
10、的定义与基本性质定义2 p 维一般正态分布 设 ,A为 实数矩阵,为 p 维实数向量,则 是 p 维正态分布,记为:其中 为非负定阵。),(qqNYqp11pqqpYAX),(ppNXAAp多元正态分布的定义与基本性质t性质1 若 服从 ,则 (1),(2),(pN EX.DX).()21exp()(Ottt itX X定义3 若p 维随机向量X 的特征函数为 则称X 服从p 元正态分布,记为).()21exp()(Ottt itX ).,(pNX多元正态分布的定义与基本性质t 性质2:若 服从 (1)令 ,为 实数矩阵,为 维实数向量,则 服从 (2)服从 ,c 为实数.t 性质3:服从 为
11、一元正态随机变量.定义4:设 为p 维随机向量,若 ,为一元正态随机变量,则称 X 服从p 元正态分布,记为),(pNdBXZZ).,(BBdBNs Bpsd1scX),(2ccNp X用于验证X.),(ppRLN XL),(21pXXXXpRLXL).,(pNX用于验证多元正态分布的定义与基本性质 定义5:若p 维随机向量 的联合密度函数为 其中 ,则称 X 服从p 元正态分布,记为),(21pXXXX)()(21exp)2(1),;(1212xxxfpO),(pNXt 性质4:若 为正定矩阵,则 服从 具有密度函数X),(pNX)()(21exp)2(1),;(1212xxxfp多元正态分
12、布的四个等价定义 其中 为一元正态随机变量 特征函数 密度函数),(ppNX11pqqpYAX),(qqNYpRLXL)21exp()(ttt itX)()(21exp)2(1),;(1212xxxfp0多用于验证多用于证明二元正态分布的密度函数),(221NXXX),(21.)()(2)()1(21exp1)2(1)()(21exp)2(1),(22222221112111222112121 xxxxxxxxf).0()()(2)(),(22222222111211121aaxxxxCxxf 二元正态分布的等高线(面)是一族中心在 的椭圆.,0,222121212221121121p元正态分
13、布密度函数的等高面1)()(1XX),(pNX)()(21exp)2(1),;(1212xxxfp p元正态分布密度函数的等高面为椭球面,即在距离 的平方为常数的表面上多元正态密度是常数,这些密度曲线称为轮廓线。常数概率密度轮廓线=满足 的所有x=中心在 的椭球的表面。常数密度的每个椭球面的中心在u且轴在 的特征向量的方向上,而且其长度是与 的特征值的平方根的倒数成比例的。21)()(cXX 1(11=1,22=1,12=0)二元正态分布曲面二元正态分布曲面(11=1,22=1,12=0)二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面(11=2,22=4,12=0.75
14、)二元正态分布曲面(11=2,22=4,12=0.75)二元正态分布曲面剖面(11=1,22=1/2,12=0.75)3 条件分布与独立性t定理1 若 服从 ,(1)服从 ,服从 ;(2)与 相互独立 .(不相关)2()1(XXX),(22211211)2()1(pN)1(X),(11)1(qN)2(X),(22)2(qpN)1(X)2(X1221,XX),(11111 qNX.00,2211212121 qqNXXt定理2 若 相互独立,且 则.),(22222 qNX条件分布与独立性ppkkkkkpkNXXX1111)()1()()1(,)()1(,kXX).(jiOij说明正态总体独立性
15、与不相关性是等价的t推论2 若 ,则 相互独立t推论1 若 对角阵,则 相互独立.),(),(21NXXXXppXXX,21t推论3:若 不服从正态分布,则 不服从正 态分布.)1(X)2()1(XXX条件分布与独立性定理3 设 则 Y与Z相互独立定理4 设 则Y与Z相互独立,),(11mpmnpnppXBZXAYIONX,0,0BBAA.0BA,),(11mpmnpnpeXBZdXAYNX.0BA?),0)(,(22211211)2()1()2()1(pNXXX)2(X)1(X.),(211221211211)2()2(12212)1(21X),()|(21121)2()1(rNXX定理5
16、设 则当 给定时,的条件分布为 其中 p元正态分布的性质o 每一个变量均服从正态分布。o 变量的线性组合服从正态分布。o p 元正态分布中的任意 k(0km)个变量服 从 k 元正态分布。o p元正态分布的条件分布仍服从正态分布。o 协方差为0的变量间相互独立。5 多元正态分布的参数估计多元样本及数字特征多元样本的概念P维随机样本 P维总体 的一个容量为n的样本:npnnnppXXXXXXXXXXXX21)(22221)2(11211)1(,),(21pXXX 的样本1X 的样本pX样本数据阵(样本资料阵),(1)()2()1(212221212111pnnpppnnXXXXXXXXXXXXX
17、样本均值npnnppXXXXXXXXX212222111211,niipniiniipXnXnXnXXXX1121121111nXnX11其中)1,1,1(1nppijnppnppnppnppnnnppnnnnnnaXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXnIXXXnXXXXXXA)()()()()()()()()()()111 ()(121221111221222111221111221112111)()(样本离差阵样本离差阵样本方差阵)(1111)(1)(XXXXnAnSn样本方差阵其中),2,1()(1121)(pixxnsniiii为 的样本方差;称为 的样本标准
18、差.iXiXiis样本相关系数阵1)()()()()()()()()(1)()()()()()()()()(122222221121122222221122211222211112222112211XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXRipipipipipipipippipipipiiiiipipipipiiiiijjiiijjjiiijijppijsssaaarrR ,)(与 的样本相关系数1XpX多元正态均值向量及协方差阵的极大似然估计定理1 设 是 p 元正态总体 的随机样本,则 为 的极大似然估计,即 ),2,1()(niXi
19、pn)1,(AnX),(niiinnpniiipxxxxL1)(1)(2/2/1)(1)(2/12/)()(21exp)2(1 )()(21exp)2(1),(X)(11)(1)(XXXXnAninii),(pN样本 的似然函数),2,1()(niXi2/2/2/2/0,)2n()1,()2nln(ln2)2ln(1(2),(lnmax)1,(lnnnpnnpXAeAnXLAenAnnpXLAnXL多元正态均值向量及协方差阵的极大似然估计定理2 当 时,的极大似然估计是0)(10)(10)(iniiXXn极大似然估计量的性质定理3 若 和 分别是正态总体 的样本均值和样本离差阵,则 (1)(2
20、),其中 独立同分布于 (3)与 相互独立 (4)证明:设 是n阶正交阵,)1,(nNXpXnnrrrrnnnn/1/1)1(1)1(111XA)0(),(pNA11niiiZZA11,nZZ),0(pNpnAP1)0(,)()1(1XXXZZZnn令极大似然估计量的性质 0)()()(),(01,),1(),(1)()(1111)()()1(1)(1)()1(iniiiiiniinitininitiitittntniititntntrrXXErrEZZEZZEZZCovntnntnrnrEXrEZpZXXpZntXrrrXXZ维正态变量,且也是线性组合,维正态变量是即:.,)(,)3()()
21、(),()2()1,(1 ),(1 )1(111111)(1)(1)()(1)()(111)()(1111)(相互独立与相互独立,故与而的函数是的函数,是且AXZZZZXnZXZZZZAAXXXXXXnXXZZXXZZXXXXXXZZZZZZZZnNZnXnNXnXnZnnnnnniiiiniiniiinnniiiniiiniiinnniiipnnipin极大似然估计量的性质.0)0(,|00 ,|,.)1,1(,0)0(),0(),0(),0(),0(0.,.1)(,)(,0 )()(.1)(),()(1)0(,),()4(22122212111111)1(11 EpzZzZZPEpzZzZ
22、zzZPEpZZZPpZZZZZPZZPpBPniZPNZNZpBPpnnnpBrpArABrArpnpBrPBrArpnAPBBAZZBpppppppipiiipiipinpn使的线性组合可表成的线性组合可表成的线性组合可表成线性相关列线性相关的前即,非零常向量列线性相关的前只须证设时当只须证下证则记极大似然估计量的性质极大似然估计量的性质定理4 ,若 为正定矩阵,则 21)()(pXXn可作为检验统计量可作为检验统计量)1,(nNXp极大似然估计量的性质t无偏性 与 分别是 和 的无偏估计,即t有效性 与 分别是 和 的最小方差无偏 估计量.t相合性(一致性)当 时 与 分别是 和 的强相
23、合估计.t充分性 与 分别是 和 的充分统计量.XAnS11)(XE1()1EAn XnAnS11XAn1XAn1第二章多元正态总体参数的假设检验多元正态总体参数的假设检验1几个重要统计量的分布2单总体均值向量的检验3多总体均值向量的检验5独立性检验66 正态性检验及其SAS实现1 几个重要统计量的分布一、正态变量二次型的分布 1.分量独立的n维随机向量X的二次型定义1 中心 分布与矩阵表达 设 独立同分布于 ,则 若记 ,且 则 推广:若 则 2nXXX,21)1,0(N)(212nXnii),(21nXXXX),(nnINX)(2nXX),(),(21nnnINXXX)(122nXX分量独
24、立的 n 维随机向量 X 的二次型2,),(21nXXXX),0)(,(nnINX)(2nXXXXnii12).,(2nXX1,0),(),(221nnnINXXX).,(122nXXYY,),(21nXXXX.1 ),(.,221niNdi iXXXiinniniiXZ122)()(niii12.)(定义2 非中心 分布与矩阵表达设且则随即变量 服从自由度为 n,非中心参数为的卡方分布,并记为 或推广:若 则若则其中分量独立的 n 维随机向量 X 的二次型t性质 (i)设 相互独立,则 (ii)设 则 (iii)(iv)若 则X 特征函数为 ,21pXXX)(2nX),(11221pipii
25、ipnXXX.,),()2()1()2()1(12nnnXXXINX.2,1),()()(2)()(inXXiiiii.42)(,)(22nDnEnn21exp)21()(2ititittn,1),(2kinXiii分量独立的 n 维随机向量 X 的二次型定理1 设 则 (A为对称幂等阵)证明:,)(,),(2rArAAIONXnn.)(/222AArAXX,1,)21()21(.)21(/),(/.)21(/)1()1(/),0(.,/.),().00,(,)(,2112/12/2/222112/122222211222221rriirrririiiiirriiinnrtiititAXXrA
26、XXtiYniYNdi iYYYYAYAXXYXIONXYdiagArArAA的特征函数为的特征函数为且独立,则令使正交阵分量独立的 n 维随机向量 X 的二次型 ).(11 ),1(),0(.1111 ),(),()(.,.,)00,1,1(212222122222221222rYAXXriNYYYOOOIYYAYAXXIONIONYYXXYYYOOOIAAAAAAAAAAAdiagriiiriirnnnnnr且独立,则令,使正交阵分量独立的 n 维随机向量 X 的二次型 定理2 设 则 (A为对称幂等阵)其中 ).(,)(,),(2nrrArAAINXnn.),(/222AArAXX.12
27、A o 对称幂等阵的性质:1.I-A是对称幂等的;2.A的特征值是1或0;3.r(A)=tr(A)21exp)21(21exp)21(1222/12/riiiiirtititiitititrIAPP11r),(),(21nnnIPNXPYYYPYX)(/)()(/2122222rriiYAPYPYPYAPYAXXAArAPP)(/212222rriiiYAPYPYAXX2 AAIrr证明要点:若A是对称幂等的,则存在正交矩阵P,使 令 ,若 ,则存在正交矩阵P,使 2212/)()()/()/()/(AEXAEXEYAPPEYEYrii分量独立的 n 维随机向量 X 的二次型定理3 设 则定理
28、4 设 则 BXZAXXBAAINXnmnn,),(2令.0BAAXXBX相互独立和,),(2BBAAINXnn.0ABAXXBXX相互独立和分量独立的 n 维随机向量 X 的二次型定理5 (Cochran定理)已知 (1)服从 (2)为 阶实对称阵;且 (3)则 服从 与 服从 且相互 独立 ),(ppINXAXXAXXX2121,AApp11)(rArank22)(rArankXAX1XAX2121r222rprr21X分量独立的 n 维随机向量 X 的二次型定理6 设 (1)(2)(3)非负定 则 且与 相互独立.2Z21ZZZ,Z,2121ppZ21ppZ1Z2,1,),(iXCXZC
29、XXZINXiipp一般 p 维正态随机向量的二次型定理1 若 则 (1),其中 (2),0 ),(pNX)(21pXX.1)()()(21pXX用于构造检验统计量并检验异常点定理2 若 则.)(,0 ),(rArAANXp.)()()(2AAArXAX定理3 若 则.,0 ),(BBAANXp.)()()()(OBAXBXXAX独立与非中心 t 分布和非中心 F 分布 当 时,F服从自由度为m,n中心F分布记为:)1,(NX)(2nY,YnXT).,(ntT),(2mX)(2nY,/nYmXT).,(nmFF).(ntT00).,(nmFF定义3 非中心 t 分布设 与 相互独立,令则随机变
30、量T 服从自由度为n,非中心参数为 非中心t 分布,并记为:当 时,T服从自由度为n中心t 分布记为:定义4 非中心 F 分布设 与 相互独立,令 则随机变量F 服从自由度为m,n,非中心参数为 非中心F分布,并记为:非中心 分布、非中心t分布和非中心F分布2 利用非中心 分布、非中心t分布和非中心F分布可以计算一元统计检验中犯第二类错误的概率。2例 未知,检验 检验统计量为22),(NX00:H),1()(0ntSXnT犯第一类错误的概率为犯第二类错误的概率为.|0 TPP以真当假.|)()(|10110SXnPTPP 以假当真)./)(),1(01nntT威沙特(Wishart)分布定义1
31、 随机矩阵的分布定义2(中心Wishart分布)设服从且相互独立,则称随机矩阵服从中心Wishart 分布,并记为 ,其中定义3(非中心Wishart分布)设服从 且相互独立,则称随机矩阵 服从非中心Wishart 分布,并记为 其中 为非中心参数,)(iX)(iX),(pNniiiXXW1)()(),(nWWp),(ipNniiiXXW1)()(),(ZnWWpniiiZ1.1,),(1niipiipnnXXXX),()()2()1(威沙特(Wishart)分布性质 结论1 分布是Wishart分布的特例 结论2 性质1 若 且相互独立,则性质2 若(1)且 独立同分布于 (2)是秩为 r
32、的实对称阵,则 ).,0(),1()(11)()(pipniiiNZnWZZA),1(),(kinWWipi.),(11kPkiinnnnWWpnnXXXX),()()2()1()()2()1(,nXXX),(pNnnA),(rWAXXpAA 22威沙特(Wishart)分布性质性质3 设p阶随机阵 是常数阵,则 特例 (1)(2)设 则性质4 设 相互独立,其中 则 (1)(2)当 时,pmpCnWW ),().,(CCnWCCWm).,0(),(常数aanWaWp),(1plll).(),(),(2221llnllnWWll ),1(),0()(nNXp),(.222112111)()(2
33、2211211nWWWWWXXWprrpnrrp);,(),(22221111nWWnWWrprO12.2211独立相互与WW威沙特(Wishart)分布性质性质5 设p阶随机阵 .)(),(nWEnWWp则性质6(Cochran定理)若 (1)且 独立同分布于 (2)为 阶实对称阵;且 (3)则 服从 与 服从 且 相互独立 pnnXXXX),()()2()1()()2()1(,nXXX),(pN21,AAnn11)(rArank22)(rArankXAXXAXXX21XAX1XAX2),(1rWp),(2rWp12rrpXsXnT122)(服从正态分布服从正态分布服从卡方分布服从卡方分布X
34、WXnT12服从多元正态分布服从多元正态分布服从服从Wishart分布分布推广推广服从服从1,1nF霍特林(Hotelling)T2分布Hotelling 分布 定义1 设 且相互独立,则称 服从自由度为n的霍特林T2分布。若 则称 服从自由度为n的非中心霍特林T2分布。结论1 分布是t分布的推广 性质1 独立同分布于 ,则 2T),0(),(),(pnnWWNXpp)()2()1(,nXXX),(pN).1,()()(1(212npTXAXnnT).,(212npTXWXnT2T),1()1,(nWAnNXpp),0(),(pNX).,(212npTXWXnT分布与 分布之间的关系2TF性质
35、2 若 和 是 的样本均值和样本离差阵,记 则 XA),(pN).1,()()(1(212npTXAXnnT).,()1()1()1()1(22pnpFTpnpnTpnpnF)()()()()()()1(111XAXXXXXnn2p2T2pn霍特林(Hotelling)T2分布性质4 若 和 是 的样本均值和样本离差阵,记 则 其中性质5 T2统计量的分布只与p,n有关,而与 无关.性质6 T2统计量对可逆变换保持不变.XA).,1,()1(212npTXAXnnT),(pN).,()1()1()1()1(22pnpFTpnpnTpnpnF.1 n性质3 若 和 是 的样本均值和样本离差阵,记
36、 则XA),(pN).1,()()(212npTXSXnT).,()1()1()1()1(22pnpFTpnpnTpnpnF威尔克斯(Wilks)统计量及分布 威尔克斯 分布定义1 设 则称协方差阵的行列式 为X的广义方差.若 为p 元总体X 的随机样本,A为样本离差阵,则称 或 为样本广义方差.定义2 设 则称广义方差比为威尔克斯统计量或 统计量,其分布称为威尔克斯分布,记为),(pNX),1()(nXAn 11An1 ,21独立与且AA),0(),(),(12211pnnWAnWApp211AAA).,(21nnp2T 统计量与 或 F统计量的关系,)1,()1,(1),(,),(111
37、)1,(1 2212npnpnnpTnpTnnppnnnd或,则设时,当).1,(1112pnpFppnTnppnFd结论1 2T 统计量与 或 F统计量的关系结论2,则设时,当pnnn12 2 ).1(2,2()2,()2,(11pnpFnpnpppnFd结论3).,(),1(),1(1 1 12212121nnFnnnnnnFpd则时,当结论4).1(2,2(),2(),2(11 2 12212121nnFnnnnnnFpd则时,当结论5.2,2 22计量近似统统计量或可用时,当Fpn一元正态总体参数的假设检验 设 来自总体 第一步:建立零假设 第二步:寻找检验统计量及其在 下的分布第三步
38、:依据小概率原理建立检验准则 若 则拒绝零假设.nXXX,21),(2N0:0H1ntsXnT)1(2/ntsXn0HXsXnT122)(一元正态总体参数的假设检验 设 来自总体 第一步:建立零假设 第二步:寻找检验统计量及其在 下的分布第三步:依据小概率原理建立检验准则 由于 ,故若 则拒绝零假设.nXXX,21)1,(N0:0H)1,0(NXnU)(2uXnP,2uXn0H不应含有未知数不应含有未知数单总体均值向量的检验及置信域单总体均值向量的检验 设总体 随机样本 检验 1.当 已知时,均值向量的检验),(pNX),1()(nX.:,)(:0100HH已知0).()()1()(),0()
39、(),1,(2100pXnXNXnnNXpp 检验统计量及其分布是:)()()(201002pXXn2.当 未知时,均值向量的检验单总体均值向量的检验 检验统计量是:),1,()()(1(20102npTXAXnnT).,()1(2pnpFTpnpnF且p值的计算p值通常由下面公式计算而得到:p=P|W|W0|=2 P W|W0|(拒绝域为两边对称的区域时)p=minPW W0,PW W0 (拒绝域为两边非对称区域时)p=PW W0 (拒绝域为右边区域时)p=PW W0 (拒绝域为左边区域时)只需根据SAS计算出的p值,就可以在指定的显著水平下 ,作出拒绝 或不能拒绝 原假设的决定.)(p)(
40、p似然比统计量 设p元总体的密度函数为 其中 是未知参数,且 )10(.);(max);(max0XLXL),(xf).;();,();()(1)()1(xfxxLXLnn.,0),1()(nX 是来自总体X的容量为n 的样本,检验o样本的似然函数为o 似然比统计量为.:,:0100HHo否定域.,()()1(nXX似然比统计量定理1 当样本容量n 很大时,其中 ).();(max);(maxln2ln220fXLXL.dimdim0f多元总体均值向量的检验两个正态总体均值向量的检验)1,()()()(11pmnpFYXAAYXmnnmppmnFYX零假设 情形1 i.i.d于 i.i.d于(
41、1)正定且已知时,检验统计量及其分布(2)正定且未知时,检验统计量及其分布.:,:)2()1(1)2()1(0HH)()2()1(,nXXX)()2()1(,mYYY),()1(pN),()2(pN相互独立相互独立212)()(pYXYXmnnm212(2)()()()(,2).XYnmTnmXYAAXYTp nmnm例1.两组贫血患者的血红蛋白浓度(%,X1)及红细胞计数(万/mm3,X2)A组组B组组X1X2X1X23.92104.82704.21904.71803.72405.42304.01704.52454.42204.62705.22304.42202.71605.92902.42
42、605.52203.62404.32905.51805.13102.92003.3300o检验假设o或两个正态总体均值向量的检验 :2121121210BABAHH 00:00:2211122110 BABABABAHH o检验统计量.10 ,12 ,2 )1,()()()(1 )2(112BAYXnmnnppmnpFYXAAYXmnnmppmnTpmnpmnF )6667.216 8167.3(AX由样本值得 )5.252 92.4(BY6667.178663333.943333.946967.9XA5000.146625000.225000.225560.2YA两个正态总体均值向量的检验1
43、667.325298333.718333.712527.12YXAA)()()(2(12BAYXBABABABAYXAAYXnnnnnnT 9184.16 8333.351033.10006229.00036518.00036518.06537027.18333.351033.110121012 8333.351033.1458335.1626591665.3591665.3612635.08333.351033.11012101212 T0362.8)2(12TpnnpnnFBABAp=0.0030.两个正态总体均值向量的检验两正态总体协方差阵不等时均值向量的检验情形2 i.i.d于 i.i
44、.d于 检验统计量及其分布(1)构造新样本:(2)构造统计量:)()2()1(,nXXX)()2()1(,nYYY),(1)1(pN),(2)2(pN21相互独立),0(21)()()(piiiNYXZ),0(21pNZn),1(21nWApZ相互独立)1,()1(212npTZAZnnTZ),()(1pnpFZAZppnnFZ两正态总体协方差阵不等时均值向量的检验21情形3 i.i.d于 i.i.d于 检验统计量及其分布(1)构造新样本:(2)构造统计量:)()2()1(,nXXX),(1)1(pN)()2()1(,mYYY),(2)2(pN相互独立),0(111)(1)()()()(zpm
45、jjnjjiiiNYmYmnYmnXZ.21mnz且 相互独立.)()(,jiZZ)1,()1(212npTZAZnnTZ),()(1pnpFZAZppnnFZ多个正态总体均值向量的检验多元方差分析多元方差分析oMultivariate analysis of variance,MANOVAo一元方差分析的基本思想:n对方差的分解o多元方差分析的基本思想:n对方差-协方差阵的分解。一元方差分析k 个一元正态总体均值向量的检验零假设 .:;:)()(1)()2()1(0jikjiHH使,)1()()1()2()1()1(1nXXX),()1(pN),()(kpN相互独立相互独立i.i.d于i.i
46、.d于,)()()()2()()1(knkkkXXXiinjijiikinjijkiXnXXnX1)()()(11)()(),1(1 ,1总偏差平方和.)(;)(;)(12)(2)(11)()(211)()(kiiiikinjijkinjijXXnSSAXXSSEXXSSTii组内偏差平方和组间偏差平方和一元方差分析平方和分解公式 SST=SSA+SSE).().,1()/()1/(10kHnnnknkFknSSEkSSAF多元方差分析设第i个p元正态总体 的数据阵为).,1)(,()(kiNip).,1()()()()1()()()()1()()1()()11()(kiXXXXXXXinii
47、pninipiiiii总离差阵T的分解.)()()()()(1)(1)()()()()()(11)()()()(11)()(BAXXXXnAXXXXXXXXXXXXTikiiikiiiiijiikinjijijkinjijii总离差阵T=组内离差阵A+组间离差阵B.k 个p元正态总体均值向量的检验零假设 .:;:)()(1)()2()1(0jikjiHH使检验统计量及其分布).1,(0kknpTABAAH否定域 .W 例2.三组贫血患者的血红蛋白浓度(%,X1)及红细胞计数(万/mm3,X2)A组组B组组C组组X1X2X1X2X1X23.92104.82704.42504.21904.7180
48、3.73053.72405.42302.92404.01704.52454.53304.42204.62703.32305.22304.42204.51952.71605.92903.82752.42605.52203.73103.62404.32905.51805.13102.92003.3300检验假设不等或不全相等 ,:32132132113213213210CBACBAHH 设第i 组为2元正态总体 来自3个总体的样本容量检验:),3,2,1(),()(2iNi.8,10,12321nnn,21,27,2 ).1,(0kknpkknpTABAAH结论2,则设时,当pnnn12 2 ).
49、1(2,2()2,()2,(11pnpFnpnpppnFd结论4).1(2,2(),2(),2(11 2 12212121nnFnnnnnnFpd则时,当k 个p元正态总体均值向量的检验取检验统计量).30,2,3(.),2(),2(111)(2121npknnnnkknF例2.(续)o三组的均向量和离差矩阵 )6667.216 8167.3(AX )5.252 92.4(BX )266.88 85.3(CX 6667.178663333.943333.946967.9ASS 5000.146625000.225000.225560.2BSS 8750.148962500.182500.184
50、000.2CSSo三组的离差矩阵之和(组内变异)o总离差矩阵o组间离差矩阵47426.041753.5833853.5833814.6527SSSSSSCBAA61180.140068.899968.899922.5787T13754.0983122.4833122.48337.9260ATB例2.(续)多元方差分析表变异来源SSCPn组间Bn1=k-1组内An2=n-k总Tn-15027.08310.13766203896.694044BAAop=2,k=3,n=30:n1=n-k=27,n2=k-1=2;2n2=4,2(n1-1)=52.p=0.001161.3353.55027.0502
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。