1、多元正态分布的假设检验多元正态分布的假设检验 4.1 单个总体均值向量的推断单个总体均值向量的推断 nproc iml;n n=20;p=3;n x=3.7 48.5 9.3,5.7 65.1 8.0,3.8 47.2 10.9,n 3.2 53.2 12.0,3.1 55.5 9.7,4.6 36.1 7.9,n 2.4 24.8 14.0,7.2 33.1 7.6,6.7 47.4 8.5,n 5.4 54.1 11.3,3.9 36.9 12.7,4.5 58.8 12.3,n 3.5 27.8 9.8,4.5 40.2 8.4,1.5 13.5 10.1,n 8.5 56.4 7.1,
2、4.5 71.6 8.2,6.5 52.8 10.9,n 4.1 44.1 11.2,5.5 40.9 9.4 ;n m0=4 50 10;n ln=20 1;n x0=(ln*x)/n;print x0;n xm=x0-m0;print xm;n mm=i(20)-j(20,20,1)/n;n a=x*mm*x;print a;n ai=inv(a);print ai;n dd=xm*ai*xm;d2=(n-1)*dd;n t2=n*d2;n f=(n-p)*t2/(n-1)*p);n print dd d2 t2 f;n p0=1-probf(f,p,n-p);n print p0;n f
3、a=finv(0.95,p,n-p);n beta=probf(fa,p,n-p,t2);n print fa beta;nquit;n The SAS System 08:48 Wednesday,March 10,2008 4n X0n 4.64 45.4 9.965n XMn 0.64 -4.6 -0.035n An 54.708 190.19 -34.372n 190.19 3795.98 -107.16n -34.372 -107.16 68.9255n AIn 0.0308503-0.001162 0.0135773n -0.001162 0.0003193-0.000083n 0
4、.0135773-0.000083 0.0211498n DD D2 T2 Fn 0.0256283 0.4869386 9.7387729 2.9045463n P0n 0.0649283n FA BETAn 3.1967768 0.3616381二二 单个总体均值分量间结构关系的检验单个总体均值分量间结构关系的检验是取自该总体的样本。检验:(,)pNx1,2(,)p,12nx xx01:pH1:ijH至少有一对1、问题引入例 设与上面的假设等价的是,寻找常数矩阵110010101001C0:HC01:HC0 注:矩阵C不是唯一的,110001100001C 在例4.2.1中,假定人类的体形
5、有这样一个一般规律的身高、胸围和上臂围平均尺寸比例为6:4:1。检验比例是否符合这一规律。检验:012311:64H112311:,64H 至少有两个不等230106C求则上面的假设可以表达为 0:HC01:HC02、统计量及方法 其中C为一已知的kp阶矩阵,kF(2,6-2)=6.9443,.0.05nkFTk n查表所以拒绝原假设 犯第一类错误的概率为2()(,1)TnT k n1Cx)CSC(Cxproc iml;s=31.600 8.040 0.500,8.040 3.172 1.310,0.500 1.310 1.900;mu=82.00 60.20 14.50;c=2-3 0,1
6、0-6;a=c*t(mu);d=c*s*t(c);g=inv(d);T=6#(t(a)*g*a);f=(6-2)/(2*(6-1)*T;Print T,f;p0=1-probf(f,2,6-2);print p0;fa=finv(0.95,2,6-2);print fa;Quit;T47.143The SAS System 08:48 Wednesday,March 10,2008 18 T 47.143404 F 18.857362 P0 0.0091948 FA 6.94427194.2 两个总体均值的检验两个总体均值的检验一、两个独立样本的情形一、两个独立样本的情形 与一元随机变量的情形
7、相同,常常我们需要检验两个总体的均值是否相等。设从总体 ,中各自独立地抽取样本 和 ,。1(,)pN 和2(,)pN112(,)nx xxx212(,)ny yyy 0 考虑假设 012:H112:H 根据两个样本可得1和2的无偏估计量为1111ninixx2121niniyy2211,()pNnnXY0121122122(1)(1)(2,)pnnnnW nnpSSS又1212,pnnNnnXY0其中111(1)()()niin1iSxx xx2221(1)()()niiniSyy yy21212()()n nTnn1pxy Sxy统计量当原假设为真的条件下,21212121(,1)(2)nn
8、pFTF p nnpp nn检验的规则为:21212121(,1),(2)nnpTFp nnpp nn拒绝原假设;21212121(,1),(2)nnpTFp nnpp nn接受原假设;ndata d331;n input type x1-x4;n cards;n 1 65 35 25 60n 1 75 50 20 55n 1 60 45 35 65n 1 75 40 40 70n 1 70 30 30 50n 1 55 40 35 65n 1 60 45 30 60n 1 65 40 25 60n 1 60 50 30 70n 1 55 55 35 75n 2 55 55 40 65n 2
9、50 60 45 70n 2 45 45 35 75n 2 50 50 50 70n 2 55 50 30 75n 2 60 40 45 60n 2 65 55 45 75n 2 50 60 35 80n 2 40 45 30 65n 2 45 50 45 70n;n proc iml;n n=10;m=10;p=4;n use d331(obs=10);n xx=x1 x2 x3 x4;n read all var xx into x;print x;n ln=10 1;n x0=(ln*x)/n;print x0;n mx=i(n)-j(n,n,1)/n;n a1=x*mx*x;print
10、 a1;n use d331(firstobs=11);n read all var xx into y;print y;n lm=10 1;n y0=(lm*y)/m;print y0;n my=i(m)-j(m,m,1)/m;n a2=y*my*y;print a2;n a=a1+a2;xy=x0-y0;n ai=inv(a);print a ai;n dd=xy*ai*xy;d2=(m+n-2)*dd;n t2=n*m*d2/(n+m);n f=(n+m-1-p)*t2/(n+m-2)*p);n print d2 t2 f;n pp=1-probf(f,p,m+n-p-1);n prin
11、t pp;n quit;n The SAS System 08:48 Wednesday,March 10,2008 20n Xn 65 35 25 60n 75 50 20 55n 60 45 35 65n 75 40 40 70n 70 30 30 50n 55 40 35 65n 60 45 30 60n 65 40 25 60n 60 50 30 70n 55 55 35 75n X0n 64 43 30.5 63n A1n 490 -170 -120 -245n -170 510 10 310n -120 10 322.5 260n -245 310 260 510n Yn 55 5
12、5 40 65n 50 60 45 70n 45 45 35 75n 50 50 50 70n 55 50 30 75n 60 40 45 60n 65 55 45 75n 50 60 35 80n 40 45 30 65n 45 50 45 70n Y0n 51.5 51 40 70.5n A2n 502.5 60 175 -7.5n 60 390 50 195n 175 50 450 -100n -7.5 195 -100 322.5n A AI 992.5 -110 55 -252.5 0.0011142-0.000091 -0.00016 0.0004239 -110 900 60 5
13、05-0.000091 0.0016972 0.0000975-0.001076n 55 60 772.5 160 -0.00016 0.0000975 0.0013754-0.000372-252.5 505 160 832.5 0.0004239-0.001076-0.000372 0.0020539n n D2 T2 Fn 5.9724991 29.862495 6.2213532n PPn 0.0037058二、成对试验的T2统计量 n 前面我们讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的。例如当讨论男女职工的工资收入是否存在差异;一种新药的疗效等。
14、思考:两独立样本和成对样本的观测值有何不同。设(xi,yi),),i=1,2,3,n,时成对的试验数据,由于总体X X和Y Y均服从p维正态分布,且协方差相等。12,(,),iiipdNidxyd令则。假设检验 012112:,:HH01:0,:0HH 检验的统计量为 2dTn1d S d 其中 dxy11()()1niiindSdd dd 当原假设为真时2(,)(1)npFTF p npp n2(,),(1)npTFp npp n拒绝原假设2(,),(1)npTFp npp n接受原假设例1 一组学生共5人,采用两种不同的方式进行教学,然后对5个学生进行测验,得如下得分数:学生序号 教学方式
15、AB数学物理数学物理189908285298888083375696170476706766590766365分析不同的教学方式是否有差异。data a;input x1 x2 y1 y2;cards;89 90 82 85 98 88 80 83 75 69 61 70 76 70 6766 90 76 63 65;data d;set a;x12=x1-y1;y12=x2-y2;proc corr cov;var x12 y12;run;proc iml;s=63.50 21.000,21.00 18.200;mu=15.00,4.800;g=inv(s);r=t(mu)*g*mu;pri
16、nt r;run;4.3 两个总体均值分量间结构关系的检验两个总体均值分量间结构关系的检验 一、问题提出 设从总体 ,中各自独立地抽取样本 和 ,。他们的均值向量差为:1(,)pN 和2(,)pN112(,)nx xxx212(,)ny yyy 011211222212pp1 例 在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题:(1)你对伴侣的爱情的“热度”感觉如何?(2)伴侣对你的爱情的“热度”感觉如何?(3)你对伴侣的爱情的“可结伴”水平感觉如何?(4)伴侣对你的爱情的“可结伴”水平感觉如何?回答采用没有、很小、有些、很大和非常大5个等级,得
17、到结果如表。丈夫对妻子丈夫对妻子妻子对丈夫妻子对丈夫 X1 X2 X3 X4 X1 X2 X3 X4235544555544455545554455434445553355445533453344344443544455345545554454443334444455455555445555 现在我们关心均值分量间的差异是否满足某种结构关系。比如每个指标均值间的差异是否相等。1、丈夫对妻子以及妻子对丈夫的回答在0.05显著水平上没有差异。2、在四个指标上他们是否会有相同的分数。即检验四个分数的平均值是否相等。二、统计量与检验 检验012:()HC 112:()HC 在原假设为真的条件下,检验的
18、统计量为:121212(pn nTnnC xy)CS CC xy)2121212(1)(,1)(2)nnkFTF k nnkk nndata a;input x1 x2 x3 x4 class;cards;数据行省略;run;proc anova;class class;model x1-x4=class;manova h=class m=(1-1 0 0,1 0-1 0,1 0 0-1);run;H=Anova SSCP Matrix for class E=Error SSCP Matrix S=1 M=0.5 N=27 Statistic Value F Value Num DF Den
19、 DF Pr F Wilks Lambda 0.87857261 2.58 3 56 0.0626 Pillais Trace 0.12142739 2.58 3 56 0.0626 Hotelling-Lawley Trace 0.13820985 2.58 3 56 0.0626 Roys Greatest Root 0.13820985 2.58 3 56 0.0626proc iml;sigma1=0.5758620690 0.3758620690 -.1034482759 -.1655172414,0.3758620690 0.5850574713 -.0919540230 -.15
20、86206897,-.1034482759 -.0919540230 0.4367816092 0.4137931034,-.1655172414-.1586206897 0.4137931034 0.4551724138;mu1=3.90000,3.96667,4.33333,4.40000;sigma2=0.4885057471 -.0172413793 0.0402298851 0.0229885057,-.0172413793 0.4379310345 0.0724137931 0.1172413793,0.0402298851 0.0724137931 0.2402298851 0.
21、2022988506,0.0229885057 0.1172413793 0.2022988506 0.2574712644;mu2=3.83333,4.10000,4.63333,4.53333;c=1-1 0 0,1 0-1 0,1 0 0-1;mu=(mu1+mu2)/2;a=c*mu;sigma=29#(sigma1+sigma2)/58;t2=60#t(a)*inv(c*sigma*t(c)*a;print t2;225.441254T 212125725.448.192946(1)3 59nnkFTk nn第一节 单因素方差分析问题的提出统计的模型及检验方法多重比较检验问题的提出
22、某工厂实行早、中、晚三班工作制。工厂管理部门想了解不同班次工人劳动效率是否存在明显的差异。每个班次随机抽出了7个工人,得工人的劳动效率(件/班)资料如表。分析不同班次工人的劳动效率是否有显著性差异。a=0.05,0.01。早班中班晚班344939374740355142334839335041355142365140 为什么各值 会有差异?可能的原因有两个。一是,各个班次工人的劳动效率可能有差异,从而导致了不同水平下的观察值之间差异,即存在条件误差。二是,随机误差的存在。如何衡量两种原因所引起的观察值的差异?总平均劳动效率为:kinijijnyyi1/)(571.412140423734三个班
23、次工人的平均劳动效率分别为:714.341y571.492y429.403y总离差平方和sskinjijiyy112)(222)571.4140()571.4137)571.4134(1429.835201211n自由度:组间离差平方和(条件误差)ssAkiiiyyn12)(22)571.41571.49(7)571.41714.34(72)571.41429.40(7286.786组内离差平方和(随机误差)ssekinjiijiyy112)(22)714.3436()714.3434(22)571.4151()571.4149(857.38)429.4040()429.4039(221832
24、1kn自由度 统计量FknSSkSSeA1118.18218857.382286.786把计算的F值与临界值比较,当F F时,拒绝原假设,不同水平下的效应有显著性差异;当F F 时,接受原假设。kiiiyyn12)(1k1kSSAknSSkSSeA1 kinjiijiyy112)(knknSSe kinjijiyy112)(1n方 差 来 源离差平方和自由度方差F值 组间A 组内E 总和 NEXT查F分布表得临界值因为 故应拒绝原假设,即不同班次工人的劳动效率有显著的差异。554.3)18,2(05.0F013.6)18,2(01.0F013.6)18,2(118.18201.0FF 方差分析
25、:比较3个或3个以上的总体均值是否有显著性差异。用组间的方差与组内方差相比,据以判别误差主要源于组间的方差(不同组工人的产量,条件误差),还是源于组内方差(随机误差)。NEXT 50家上市公司,按行业计算其1999年底的资产负债情况,如下:序号制造业商业运输业公用事业房地产业165905025702559565307535090584560445936350805409264406565890602570760855830728758856307698090603568106092552566平均58.890.558.933.570.2 多重比较检验 1、多重比较检验 前面的F检验只能说明在单
26、一因素的影响下,不同水平是否存在显著性的差异,但不能断言哪些总体之间存在差异,在方差分析中否定了原假设,并不意味着接受了假设:),2,1,(kjijiji因而还应该进一步讨论到底是哪些总体之间存在差异。Scheffe检验),2,1,(:0kjijiHji)某些jiHji(:1),1()1)(11(21knkFknnknSSeij定义:jiijxxD定义:检验的结论:。个水平间有显著性差异水平与第即第,则拒绝jiHSDijij,0第二节 多元方差分析一、假设012:kH1:1,2,iHak不完全相同二、多元方差分析的离差平方和的分解总离差平方和()()11()()ankaaiiaiSSTxxxx
27、()()()()()()11()()ankaaaaaaiiaixxxxxxxx()()()()()()111()()()()ankkaaaaaaiiaaiaxxxxn xxxx()()()()()1111()()()()aannkkaaaaaiiiaiaixxxxxxxx由于交叉乘积项为零,故组间叉积矩阵组内叉积矩阵总叉积矩阵()()()()11()()ankaaaaiiaiSSExxxx组内叉积矩阵:主要由随机因素构成()()1()()kaaaaSSAnxxxx组间叉积矩阵:主要由系统因素构成 SSE和SSA之和等于总离差平方和SST。当SSE在SST中占有较大的份额时,可以认为随机因素影响
28、过大,反之SSE所占份额小,SSA所占份额就大,不同试验间的观测值会有显著性差异。,1,(,1)p kn kSSEp nk kSSESSR三、统计量对给定的显著性水平,检验规则为:,1,1,p kn kp kn k,1,1,p kn kp kn k 拒绝原假设;接受原假设;注:关于统计量与F统计量的换算,参看附录。例4.6.1n 有四种不同的商品x1,x2,x3和x4,按三种不同的方式销售,有数据如程序数据行,检验三种消费方式是否有显著性差异。proc iml;csscp=49290.8500 8992.2500 -36444.0000 28906.8000,8992.2500 9666.58
29、33 -4658.3333 4859.0000,36444.0000 -4658.3333 429509.3333 -58114.0000,28906.8000 4859.0000 -58114.0000 175644.4000;mu1=90.80000 58.65000 404.50000 230.65000;mu2=72.90000 51.45000 417.75000 253.15000;mu3=94.15000 55.15000 403.75000 292.00000;mu=85.95000 55.08333 408.66667 258.60000;bcsscp=20#(t(mu1-m
30、u)*(mu1-mu)+t(mu2-mu)*(mu2-mu)+t(mu3-mu)*(mu3-mu);icsscp=csscp-bcsscp;ht=det(csscp);hi=det(icsscp);lamda=hi/ht;print lamda;1.地域文化因历史悠久,富有人文内涵,在今天仍发挥重要作用,因而颇受老百姓喜爱。2.在当下,地域文化不仅丰富了人们的精神生活,而且直接促进了社会生产力的快速发展。3.大力发展文化产业,形成地域与文化、经济互促式发展模式,需要多个方面的积极参与。4.加强历史文物古迹保护、恢复还原古景、开发历史人文景观等是彰显地域文化魅力的重要途径。5.作为文化产业的重要
31、载体和平台,“农家乐”等生态休闲旅游项目利于改变我国山区落后的经济状况。6项,“取决于该城市对本地历史文化、民间传统艺术等的挖掘利用程度”不正确,由第五段内容可知,切实保护历史文物古迹,深入挖掘、开发本地历史文化,只是彰显地域文化特色的有效途径。7善于抓住景物前面的修饰语及后面的动词、形容词,把握景物特征,从特征中捕捉背后的情感特征。8本诗构思别致,主客对答,情节性强,先总起写劝酒场面,接着两句是客人表白心怀,于是主人再次劝酒致辞,客人最后再作回应。9.古代以亲属关系的远近制定丧服的轻重。期,穿一周年孝服的人;功,穿七个月大功服、穿五个月小功服的亲族。“外无期功强近之亲”中的“期功”指关系比较近的亲属。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。