假设检验的基本思想与概念课件.ppt

上传人(卖家):晟晟文业 文档编号:4748891 上传时间:2023-01-06 格式:PPT 页数:144 大小:3.75MB
下载 相关 举报
假设检验的基本思想与概念课件.ppt_第1页
第1页 / 共144页
假设检验的基本思想与概念课件.ppt_第2页
第2页 / 共144页
假设检验的基本思想与概念课件.ppt_第3页
第3页 / 共144页
假设检验的基本思想与概念课件.ppt_第4页
第4页 / 共144页
假设检验的基本思想与概念课件.ppt_第5页
第5页 / 共144页
点击查看更多>>
资源描述

1、PageChapter 7 假设检验7.1 假设检验的基本思想与概念7.2 正态总体参数假设检验7.3 其它分布参数的假设检验7.4 分布拟合检验PageChapter 7 假设检验统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验7.1 假设检验的基本思想与概念 PageChapter 7 假设检验参数估计和假设检验参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。PageChapter 7 假设检

2、验若对若对参数参数有所有所了解了解但有怀但有怀疑猜测疑猜测需要证需要证实之时实之时用假设用假设检验的检验的方法来方法来 处理处理若对参数若对参数一无所知一无所知用参数估计用参数估计的方法处理的方法处理PageChapter 7 假设检验假设检验的一般问题一、什么是假设检验二、假设检验的基本思想三、双侧检验和单侧检验四、假设检验中的拒绝域和接受域五、假设检验的两类错误六、假设检验中的P值七、假设检验的步骤PageChapter 7 假设检验 假设检验是指施加于一个或多个总体的假设检验是指施加于一个或多个总体的概率分布或参数的假设概率分布或参数的假设.所作假设可以是正所作假设可以是正确的确的,也可

3、以是错误的也可以是错误的.为判断所作的假设是否正确为判断所作的假设是否正确,从总体从总体中抽取样本中抽取样本,根据样本的取值根据样本的取值,按一定原则按一定原则进行检验进行检验,然后作出接受或拒绝所作假设然后作出接受或拒绝所作假设的决定的决定.何为何为假设检验假设检验?PageChapter 7 假设检验假设检验是推论统计的重要内容,是先对总体的未知数量特征作出某种假设,然后抽取样本,利用样本信息对假设的正确性进行判断的过程。n统计假设有参数假设、总体分布假设、相互关系假设(两个变量是否独立,两个分布是否相同)等。PageChapter 7 假设检验二、假设检验的基本思想假设检验所依据的基本原

4、理是小概率原理。什么是小概率?q概率是01之间的一个数,因此小概率就是接近0的一个数q著名的英国统计家Ronald Fisher 把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率qFisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的PageChapter 7 假设检验什么是小概率原理?小概率原理发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原

5、来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。检验中使用的小概率是检验前人为指定的。PageChapter 7 假设检验m m=50PageChapter 7 假设检验假设检验的基本思想是 小概率反证法小概率思想是指小概率事件(P0.01或P2.776,故拒绝原假设,认为该厂生产的铝材的长度不满足设定要求。若取=0.05,则 t0.975(4)=2.776.239.5,0.4,xs故PageChapter 7 假设检验总体标准差总体标准差 是否已知?是否已知?样本容量样本容量nz 检验检验 t 检验检验z 检验检验nS

6、XZ0 用样本标准差用样本标准差S代替代替PageChapter 7 假设检验检验法条件检验统计量拒绝域u 检验已知t 检验未知原假设0H备择假设1H000mmmmmm000mmmmmm11/2|uuuuuu0/xunm0/xtsnm11/2(1)(1)|(1)t tnt t nt tn000mmmmmm000mmmmmm表7.2.1 单个正态总体的均值的检验问题PageChapter 7 假设检验三、假设检验与置信区间的关系 这里用的检验统计量与6.5.5节中置信区间所用的枢轴量是相似的。这不是偶然的,两者之间存在非常密切的关系。设 是来自正态总体 的样本,现在 未知场合讨论关于均值m 的检

7、验问题。考虑双侧检验问题:1,nxx2(,)Nm 0010:HvsHmmmmPageChapter 7 假设检验它可以改写为1/201/2(1)(1)ssWxtnxtnnnm并且有0()1,PWm若让m0 在(-)内取值,就可得到m 的1-信区间:这里m0并无限制.1/2(1)sxtnn01/2|(1)sWxtnnm则水平为的检验接收域为 PageChapter 7 假设检验00:Hmm关于 的水平为的显著性检验。00:Hmm是一一对应的。类似地,“参数m 的1-置信上限”与“关于00:Hmm 的单侧检验问题的水平的检验”反之若有一个如上的1-置信区间,也可获得所以:“正态均值m 的1-置信区

8、间”与“关于 的双侧检验问题的水平的检验”参数m 的1-置信下限与另一个单侧检验也是一一对应的。是一一对应的。PageChapter 7 假设检验7.2.2 两个正态总体均值差的检验检验法条件原假设备择假设检验统计量拒绝域u检验已知t 检验未知0H1H12,12,121212mmmmmm121212mmmmmm2212xyumn11/2|uuuuuu11wxytsmn11/2(2)(2)|(2)t tm nt t m nt tm n 121212mmmmmm121212mmmmmm12PageChapter 7 假设检验大样本检u 验 未知m,n充分大近似t 检验未知m,n不很大12,12,2

9、2yxxyussmn11/2|uuuuuu22yxxytssmn11/2(1)(1)|(1)ttlttlttl121212mmmmmm121212mmmmmm121212mmmmmm121212mmmmmm444022/,11yxsslsmmnn2220/xyssmsnPageChapter 7 假设检验例7.2.3 某厂铸造车间为提高铸件的耐磨性而 试制了一种镍合金铸件以取代铜合金铸件,为此,从两种铸件中各抽取一个容量分别为 8和9的样本,测得其硬度为 镍合金:76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34铜合金:73.66 64.27 69.

10、34 71.37 69.77 68.12 67.27 68.07 62.61 根据经验,硬度服从正态分布,且方差保持不变。试在显著性水平下判断镍合金的硬度是否有明显提高。PageChapter 7 假设检验解:用X 表示镍合金的硬度,Y 表示铜合金的硬 度,则由假定,21(,),XNm 22(,).YNm 要检验的假设是:012112:HvsHmmmm经计算,89221173.39,68.2756,()205.7958,()91.1552iiiixyxxyy从而1(205.795891.1552)4.4494892ws PageChapter 7 假设检验73.3968.27562.22101

11、14.449478t查表知0.95(15)1.7531,t由于0.95(15)tt故拒绝原假设,可判断镍合金硬度有显著提高。PageChapter 7 假设检验7.2.3 正态总体方差的检验一、单个正态总体方差的检验 设 是来自 的样本,对方差亦可考虑如下三个检验问题:1,nxx2(,)Nm 22220010:HvsH22220010:HvsH22220010:HvsH通常假定m 未知,它们采用的检验统计量是PageChapter 7 假设检验相同的,均为 若取显著性水平为,则对应三个检验问题的拒绝域依次分别为22201,ns2211;Wn221;Wn222221211Wnn或PageChap

12、ter 7 假设检验例7.2.4 某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过 0.016(kg2)。现从某天生产的钢板中随机抽取 25块,得其样本方差S2=0.025(kg2),问该天生 产的钢板重量的方差是否满足要求。解:原假设为20:0.016,H备择假设为21:0.016,H此处n=25,若取=0.05,则查表知20.952436.415PageChapter 7 假设检验2220124 0.02537.536.4150.016ns由此,在显著性水平0.05下,我们拒绝原假设,认为该天生产的钢板重量不符合要求。现计算可得PageChapter 7 假设检验

13、二、两个正态总体方差比的F 检验 设 是来自 的样本,是来自 的样本。考虑如下三个假设检验问题 1,mxx211(,)Nm 1,nyy222(,)Nm 22220010:HvsH22220010:HvsH22220010:HvsH通常 ,均未知,记 ,分别是由算得的 的无偏估计和由 算得的 的无偏估计.1m2m2xs2ys1,nyy1,mxx2122PageChapter 7 假设检验可建立检验统计量:22xysFs三种检验问题对应的拒绝域依次为11,1 WFFmn1,1WFFmn21,1WFFmn121,1FFmn。或PageChapter 7 假设检验例7.2.5 甲、乙两台机床加工某种零

14、件,零件 的直径服从正态分布,总体方差反映了加工 精度,为比较两台机床的加工精度有无差别,现从各自加工的零件中分别抽取7件产品和8 件产品,测得其直径为 X (机床甲)16.2 16.4 15.8 15.5 16.7 15.6 15.8Y (机床乙)15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0PageChapter 7 假设检验这就形成了一个双侧假设检验问题,原假设是 备择假设为 此处 m=7,n=8,经计算22012:,H22112:H20.2729,xs 0.27291.2610.2164F 查表知0.9756,75.12F于是 ,若取 =0.05,20.

15、2164,ys 0.0250.975110.1757,65.70FF其拒绝域为0.175 5.12WFF或 PageChapter 7 假设检验由此可见,样本未落入拒绝域,即在0.05水平下可以认为两台机床的加工精度一致。PageChapter 7 假设检验7.3 其他分布参数的假设检验7.3.1 指数分布参数的假设检验 设 x1,x2,xn 是来自指数分布的样本,关于 的如下检验问题:0010:HvsH(7.3.1)拒绝域的形式是 ,由于在=0时,Wxc2202(2)nxn所以拒绝域为 2212WnPageChapter 7 假设检验例7.3.1 设我们要检验某种元件的平均寿命不小 于600

16、0小时,假定元件寿命为指数分布,现取 5个元件投入试验,观测到如下5个失效时间:395,4094,119,11572,6133。解:由于待检验的假设为 01:6000:6000HvsH若取=0.05,则检验拒绝域为:220.05103.94,PageChapter 7 假设检验201010 4462.67.43776000 x故接受原假设,可以认为平均寿命不低于6000小时.经计算得PageChapter 7 假设检验7.3.2 比例的检验比例 p 可看作某事件发生的概率。作 n 次独立试验,以 x 记该事件发生的次数,则 。我们可以根据 x 检验关于 p 的一些假设:,xb n p(1)直观

17、上看拒绝域为:,由于x 只 取整数值,故c 可限制在非负整数中。0010:,HppvsHppWxcPageChapter 7 假设检验00;1,nn iioi cnP xc pppi 这是在对离散总体作假设检验中普遍会遇到的问题.一般情况下,对给定的,不一定能正好取到一个正整数c 使下式成立:PageChapter 7 假设检验一般较常见的是找一个c0,使得 0000111nnn in iiiooi ci cnnppppii (2)0010:HppvsHpp检验的拒绝域为:,Wxcc 为满足001cn iioinppi 的最大正整数。PageChapter 7 假设检验(3)0010:Hppv

18、sHpp检验的拒绝域为:1Wxc2xc或其中c1为满足下式的最大正整数:10012cn iioinppi c2为满足下式的最小正整数:12012nn iioi cnppiPageChapter 7 假设检验例7.3.2 某厂生产的产品优质品率一直保持在 40%,近期对该厂生产的该类产品抽检 20 件,其中优质品7件,在 下能否认为 优质品率仍保持在40%?0.05解:以p 表示优质品率,x 表示20件产品中的优质 品件数,则 ,待检验的假设为20,xbp01:0.4:0.4HpvsHp拒绝域为1Wxc或2xcPageChapter 7 假设检验由于下求c1与c2:30.01600.02540.

19、0510,P xP x故取 c1=3,又因为110.05650.025120.0210,P xP x从而c2=12,拒绝域为附带指出,该拒绝域的显著性水平实际上不是0.05,而是0.0160+0.021=0.0370。由于观测值没有落入拒绝域,故接受原假设。3Wx或12x PageChapter 7 假设检验7.3.3 大样本检验 在二点分布参数 p 的检验问题中,临界值的确定比较繁琐,使用不太方便。如果样本量较大,我们可用近似的检验方法大样本检验。大样本检验一般思路如下:设1,nxx是来自某总体的样本,又设该总体均值为,方差为 的函数,记为 ,譬如,对二点分布b(1,),其方差(1-)是均值

20、 的函数,则在样本容量n 充分大时,2()2(,()/)xNn PageChapter 7 假设检验故可采用如下检验:020()(0,1)()n xuN由此近似地确定拒绝域。统计量 PageChapter 7 假设检验例7.3.3 某厂产品的不合格品率为 10%,在 一次例行检查中,随机抽取80件,发现有 11件不合格品,在下能否认为不合 格品率仍为10%?解:这是关于不合格品率的检验,假设为:01:0.1:0.1HvsHPageChapter 7 假设检验若取,则u0.975=1.96,故拒绝域为 故不能拒绝原假设。|1.96,Wu因为n=80 比较大,可采用大样本检验方法。检验统计量为11

21、80(0.1)801.1180.1 0.9uPageChapter 7 假设检验例 7.3.4 某建筑公司宣称其麾下建筑工地平均每 天发生事故数不超过 0.6 起,现记录了该公司 麾下建筑工地 200天的安全生产情况,事故数 记录如下:天数102 59 30 8 010 200一天发生的事故数01 2 3 45合计6试检验该建筑公司的宣称是否成立(取)。PageChapter 7 假设检验解:以X 记建筑工地一天发生的事故数,可认 为 ,要检验的假设是:()XP01:0.6:0.6HvsH由于n=200很大,可以采用大样本检验,泊松分布的均值和方差都是,这里 ,检验统计量为0.74x()200

22、(0.740.6)2.5560.6n xuPageChapter 7 假设检验若取,则 u0.95=1.645,拒绝域为1.645Wu如今 u=2.556 已落入拒绝域,故拒绝原假设,认为该建筑公司的宣称明显不成立。PageChapter 7 假设检验大样本检验是近似的:近似的含义是指检验的实际显著性水平与原先设 定的显著性水平有差距,这是由于诸如(7.3.12)中 u 的分布与N(0,1)有距离。如果n 很大,则这种差 异就很小。实用中我们一般并不清楚对一定的n,u 的分布与N(0,1)的差异有多大,因而也就不能 确定检验的实际水平与设定水平究竟差多少。在 区间估计中也有类似问题。因此,大样

23、本方法是 一个“不得已而为之”的方法。只要有基于精确分布的方法一般总是首先要加以考虑的。PageChapter 7 假设检验7.3.4 检验的 p 值假设检验的结论通常是简单的:在给定的显著水平下,不是拒绝原假设就是保留原假设。然而有时也会出现这样的情况:在一个较大的显著水平(下得到拒绝原假设的结论,而在一个较小的显著水平()下却会得到相反的结论。这种情况在理论上很容易解释:PageChapter 7 假设检验因为显著水平变小后会导致检验的拒绝域变小,于是原来落在拒绝域中的观测值就可能落入接受域。但这种情况在应用中会带来一些麻烦:假如这时一个人主张选择显著水平,而另一个人主张选,则第一个人的结

24、论是拒绝H0,而后一个人的结论是接受H0,我们该如何处理这一问题呢?PageChapter 7 假设检验例7.3.5 一支香烟中的尼古丁含量X 服从正态 分布N(m,1),质量标准m 规定不能超过1.5毫 克。现从某厂生产的香烟中随机抽取20支测 得其中平均每支香烟的尼古丁含量为 毫克,试问该厂生产的香烟尼古丁含量是否 符合质量标准的规定。1.97x 这是一个假设检验问题:H0:m1.5,H1:m 1.5,采用u检验,计算得:01.97 1.52.10/1/20 xunmPageChapter 7 假设检验对一些的显著性水平,表7.3.1列出了相应的拒绝域和检验结论。表7.3.1 例7.3.5

25、中的拒绝域显著性水平拒绝域u=2.10对应的结论=0.05u1.645拒绝H0=0.025u1.96拒绝H0=0.01u2.33接受H0=0.005u2.58接受H0我们看到,不同的有不同的结论。PageChapter 7 假设检验现在换一个角度来看,在m=1.5时,u的分布是N(0,1)。此时可算得,P(u2.10)=0.0179,若以0.0179为基准来看上述检验问题,可得 当2.10。于是2.10就不在 中,此时应接受原假设H0;当0.0179时,2.10。于是2.10就落在 中,此时应拒绝H0。1u1uu1uu由此可以看出,0.0179是能用观测值2.10做出“拒绝H0”的最小的显著性

26、水平,这就是p值。1uPageChapter 7 假设检验定义7.3.1 在一个假设检验问题中,利用观测 值能够做出拒绝原假设的最小显著性水平称 为检验的p 值。引进检验的p 值的概念有明显的好处:第一,它比较客观,避免了事先确定 显著水平;其次,由检验的p 值与人们心目中的显 著性水平进行比较可以很容易 作出检验的结论:PageChapter 7 假设检验 如果 p,则在显著性水平下拒绝 H0;如果 p,则在显著性水平下保留 H0.p 值在应用中很方便,如今的统计软件中对检验问题一般都会给出检验的p 值。PageChapter 7 假设检验例7.3.7 某工厂两位化验员甲、乙分别独立地用 相

27、同方法对某种聚合物的含氯量进行测定。甲 测9次,样本方差为0.7292;乙测11次,样本方 差为0.2114。假定测量数据服从正态分布,试 对两总体方差作一致性检验:222201:,:,HvsH乙乙甲甲PageChapter 7 假设检验检验统计量为22/Fss乙甲,在原假设成立下,F F(8,10),拒绝域为 128,10FF28,10FF如今我们不是把拒绝域具体化,而是由观测值算得F=0.7292/0.2114=3.4494,再去计算该检验的p 值。或PageChapter 7 假设检验首先,我们用F 分布算得(3.4494)0.0354P F 其次考虑到双侧检验的拒绝域W分散在两端,且两

28、端尾部概率相等(见图7.3.2),据此可定出p 值为 2(3.4494)0.0708.pP F此p 值不算很小,若=0.05,则接收两方差相等的假设。在这种双侧检验情况下,如何由观测值 F=3.4494 算得 p 值呢?PageChapter 7 假设检验图7.3.2 观测值F=3.4494对应的p值 由两端尾部概率之和确定PageChapter 7 假设检验7.4 分布拟合检验PageChapter 7 假设检验前面所介绍的各种检验法,是在总体分布类型已知前面所介绍的各种检验法,是在总体分布类型已知的情况下,对其中的未知参数进行检验统称为的情况下,对其中的未知参数进行检验统称为参数参数检验检

29、验.在实际问题中,有时我们并不能确切预知总体服从在实际问题中,有时我们并不能确切预知总体服从何种分布,这时就需要根据来自总体的样本对总体何种分布,这时就需要根据来自总体的样本对总体分布进行推断,以判断总体服从何种分布分布进行推断,以判断总体服从何种分布.解决这类问题的工具是英国统计学家解决这类问题的工具是英国统计学家K.K.皮尔逊在皮尔逊在19001900年发表的一篇文章中引进的年发表的一篇文章中引进的 检验法检验法不少人把此项工作视为近代统计学的开端不少人把此项工作视为近代统计学的开端.2PageChapter 7 假设检验检验法的检验法的核心思想核心思想检验法是在总体检验法是在总体 X X

30、的分布未知时的分布未知时,根据来自总根据来自总体的样本体的样本,检验关于总体分布的假设的检验方法。检验关于总体分布的假设的检验方法。然后根据样本的经验分布和所假设的理论分布之间然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设的吻合程度来决定是否接受原假设,这种检验通常这种检验通常称作称作拟合优度检验拟合优度检验,它是它是_检验检验.一般地,一般地,我们总是根据样本观察值用直方图和经验我们总是根据样本观察值用直方图和经验分布函数,分布函数,推断出可能服从的分布,推断出可能服从的分布,然后作检验然后作检验.22PageChapter 7 假设检验7.4.1 总体分布只取有

31、限个值的情况 设总体X 可以分成k 类,记为 ,现对该总体作了n 次观测,k 个类出现的频数分别为:1,kAA1.kiinn检验如下假设:n1,nk,且0:(),1,2,.iiHP Apik其中诸0ip 且11.kiipPageChapter 7 假设检验一、诸 pi 均已知如果H0 成立,则对每一类Ai,其频率ni/n与概率pi 应较接近。即观测频数ni 与理论频数npi 应相差不大。据此,英国统计学家K.Pearson提出如下检验统计量:221kiiiinnpnp(7.4.2)并证明在H0 成立时对充分大的n,(7.4.2)给出的检验统计量近似服从自由度为k-1的 分布。2拒绝域为:221

32、1WkPageChapter 7 假设检验例7.4.1 为募集社会福利基金,某地方政府发 行福利彩票,中彩者用摇大转盘的方法确定 最后中奖金额。大转盘均分为20份,其中金 额为5万、10万、20万、30万、50万、100万 的分别占2份、4份、6份、4份、2份、2份。假定大转盘是均匀的,则每一点朝下是等可 能的,于是摇出各个奖项的概率如下:PageChapter 7 假设检验概率0.10.20.30.20.10.1额度5万10万20万 30万 50万 100万现20人参加摇奖,摇得5万、10万、20万、30万、50万和100万的人数分别为2、6、6、3、3、0,由于没有一个人摇到100万,于是

33、有人怀疑大转盘是不均匀的,那么该怀疑是否成立呢?这就需要对转盘的均匀性作检验。PageChapter 7 假设检验解:这是一个典型的分布拟合优度检验,总体 共有6类,其发生概率分别为0.1、0.2、0.3、0.2、0.1和0.1,这里k=6,检验拒绝域为:2215,由本例数据可以算出若取=0.05,则查附表3知22222222264663432023.75246422=20.95511.07.PageChapter 7 假设检验由于 未落入拒绝域,故接受原假设,23.75没有理由认为转盘不均匀。在分布拟合检验中使用p 值也是方便的。本例中,以T 记服从 (5)的随机变量,则使用统计软件可以算出

34、 23.750.5859.pP T这个p 值就反映了数据与假设的分布拟合程度的高低,p 值越大,拟合越?(why?)。PageChapter 7 假设检验二、诸 pi 不完全已知 若诸 由r(r=115720338352553240827313945271060.02090.08070.15620.20150.19500.15090.09730.05380.02600.01120.00430.002254.5210.5407.4525.5508.6393.5253.8140.367.829.211.25.70.11470.26721.46140.00051.07660.53431.45250.

35、01207.66730.16580.12580.0158合计26081.00002068 =12.89672iniipinp2/iiinnpnpPageChapter 7 假设检验本例中 =12.896718.307,故接受原假设。使用统计软件可以计算出此处检验的p 值是0.2295。若取=0.05,则211kr 20.951018.307.2PageChapter 7 假设检验列联表是将观测数据按两个或更多属性(定性变量)分类时所列出的频数表。7.4.2 列联表的独立性检验PageChapter 7 假设检验男53565女38218性别视觉正常色盲几个分类特征?例如,对随机抽取的1000人按

36、性别(男或女)及色觉(正常或色盲)两个属性分类,得到如下二维列联表,又称22表或四格表。PageChapter 7 假设检验一般,若总体中的个体可按两个属性A与B分类,A 有r 个类 ,B 有c个类从总体中抽取大小为n的样本,设其中有 个个体既属于 类又属于 类,称为频数,将rc个 排列为一个r行c列的二维列联表,简称rc表(表7.4.3)。1,rAA1,cBBijniAjBijnijnPageChapter 7 假设检验表7.4.3 rc列联表1111111111jciijicirrjrcrjcA Bjcnnnninnnnrnnnnnnnn和和PageChapter 7 假设检验列联表分析的

37、基本问题是:考察各属性之间有无关联,即判别两属性是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在rc表中,若以 和 分别表示总体中的个体仅属于 ,仅属于 和同时属于 与 的概率,可得一个二维离散分布表(表7.4.4),则“A、B两属性独立”的假设可以表述为,ijppijpiAjBiAjB0:,1,1,ijijHpp pirjcPageChapter 7 假设检验表7.4.4 二维离散分布表11111111111jciijicirrjrcrjcA Bjcppppipppprppppppp行和列和PageChapter 7 假设检验这就变为上一小节中诸 不完全已知时的分布拟合检验。

38、这里诸 共有rc个参数,在原假设H0成立时,这rc个参数 由r+c个参数 和 决定。在这r+c后个参数中存在两个约束条件:ijpijpijp1,rpp1,cppijp所以,此时 实际上由r+c-2个独立参数所确定。据此,检验统计量为 111,1rcijijppPageChapter 7 假设检验2211()rcijijijijnnpnp在H0成立时,上式服从自由度为rc-(r+c-2)-1的 分布。其中诸 是在H0成立下得到的 的极大似然估计,其表达式为 2ijpijpjiijijnnpp pnn 对给定的显著性水平,检验的拒绝域为:221(1)(1).WrcPageChapter 7 假设检

39、验例7.4.3 为研究儿童智力发展与营养的关系,某 研究机构调查了1436名儿童,得到如表7.4.5的 数据,试在显著性水平0.05下判断智力发展与 营养有无关系。表7.4.5 儿童智力与营养的调查数据营养良好营养不良合计 智 商合计342367266329130456402013216423382286345143680 8090 9099 100r=?c=?PageChapter 7 假设检验解:用A表示营养状况,它有两个水平:表示 营养良好,表示营养不良;B表示儿童智商,它有四个水平,分别表示表中四种 情况。沿用前面的记号,首先建立假设 H0:营养状况与智商无关联,即A与B独立的。统计表

40、示如下:1A2A1234,B B B B0.:,1,2,1,2,3,4.ijijHpp pij在原假设H0成立下,我们可以计算诸参数的极大似然估计值:PageChapter 7 假设检验121304/14360.9081,132/14360.0919,pp1234423/14360.2946,382/14360.2660,286/14360.1992,345/14360.2403,pppp 进而可给出诸 ,如 ijijnpnp p111436 0.9081 0.2496384.1677np其它结果见表7.4.6 PageChapter 7 假设检验表7.4.6 诸 的计算结果 ijnp.ip营

41、养良好 384.1677 346.8724 259.7631 313.3588 0.90810.29460.26600.19920.2403营养不良 38.877935.103626.288131.71200.0919.jp7.815,故拒绝原假设,认为营养状况对智商有影响。本例中检验的p 值为0.0002。20.95(3)7.815PageChapter 7 假设检验7.4.3 正态性检验正态分布是最常用的分布,用来判断总体分布是否为正态分布的检验方法称为正态性检验,它在实际问题中大量使用。一、正态概率纸正态概率纸可用来作正态性检验,方法如下:利用样本数据在概率纸上描点,用目测方法看这些点是

42、否在一条直线附近,若是的话,可以认为该数据来自正态总体,若明显不在一条直线附近,则认为该数据来自非正态总体。PageChapter 7 假设检验例7.4.4 随机选取10个零件,测得其直径与标 准尺寸的偏差如下:(单位:丝)9.4 8.8 9.6 10.2 10.1 7.2 11.1 8.2 8.6 9.6 在正态概率纸上作图步骤如下:(1)首先将数据排序:7.2 8.2 8.6 8.8 9.4 9.6 9.8 10.1 10.2 11.1;(2)对每一个i,计算修正频率 (i-0.375)/(n+0.25),i=1,2,n,PageChapter 7 假设检验(3)将点 逐一点在正态概率纸上

43、,(4)观察上述n个点的分布:()(,(0.375)/(0.25),1,2,ixinin 若诸点在一条直线附近,则认为该批数 据来自正态总体;若诸点明显不在一条直线附近,则认为 该批数据的总体不是正态分布。PageChapter 7 假设检验从图7.4.2可以看到,10个点基本在一条直线附近,故可认为直径与标准尺寸的偏差服从正态分布。PageChapter 7 假设检验如果从正态概率纸上确认总体是非正态分布时,可对原始数据进行变换后再在正态概率纸上描点,若变换后的点在正态概率纸上近似在一条直线附近,则可以认为变换后的数据来自正态分布,这样的变换称为正态性变换。常用的正态性变换有如下三个:对数变

44、换 、倒数变换 和根号变换 。lnyx1/yxyxPageChapter 7 假设检验图7.4.3 给出这10个点在正态概率纸上的图形,这10个点明显不在一条直线附近,所以可以认为该电子元件的寿命的分布不是正态分布。例7.4.5 随机抽取某种电子元件10个,测得其寿 命数据如下:110.47,99.16,97.04,77.60,4269.82,539.35,179.49,782.93,561.10,286.80.PageChapter 7 假设检验 图7.4.3 例7.4.5 的正态概率纸PageChapter 7 假设检验对该10个寿命数据作对数变换,结果见表7.4.8 表7.4.8 对数变

45、换后的数据 1 32.623.4849 0.061 6286.80 5.6588 0.5492 97.04 4.5752 0.159 7539.35 6.2904 0.6463 99.16 4.5967 0.256 8561.10 6.3299 0.7434 110.47 4.7048 0.354 9 782.936.6630 0.8415 179.49 5.1901 0.451 10 2269.82 7.7275 0.939ii()ix()ix()lnix()lnix0.3750.25in0.3750.25inPageChapter 7 假设检验利用表7.4.8 中最后两列上的数据在正态概率

46、纸上描点,结果见图7.4.4,从图上可以看到10个点近似在一条直线附近,说明对数变换后的数据可以看成来自正态分布。这也意味着,原始数据服从对数正态分布PageChapter 7 假设检验图7.4.4 变换后数据的正态概率纸PageChapter 7 假设检验二、夏皮洛威尔克(Shapiro-Wilk)检验 夏皮洛威尔克检验也简称W 检验。这个检验当8n50时可以利用。过小样本(n8)对偏离正态分布的检验不太有效。W 检验是建立在次序统计量的基础上。检验统计量为:2()122()11()()()()niiinniiiiaaxxWaaxx(7.4.5)其中系数ai 可查附表6。PageChapte

47、r 7 假设检验拒绝域为:WW。其中分位数 可查附表7.W系数 还具有如下几条性质:1121(1),1,2,/2.(2)0.(3)1.ininiiniiaainaa 1,naaPageChapter 7 假设检验2/2(1)()12()1()()niniiiniia xxWxx 据此可将(7.4.5)简化为PageChapter 7 假设检验例7.4.6 某气象站收集了44个独立的年降雨量数 据,资料如下(已排序):520 556 561 616 635 669 686 692 704 707 711713 714 719 727 735 740 744 745 750 776 777786

48、786 791 794 821 822 826 834 837 851 862873 879 889 900 904 922 926 952 963 10561074我们要根据这批数据作正态性检验。PageChapter 7 假设检验首先由这批数据可算得:442()1785.114,()630872.43.iixxx我们将计算W 的过程列于表7.4.9中。为便于计算,值 ,和 安排在同一行。()kx(1)nkx(1)()knkkdxx PageChapter 7 假设检验表7.4.9 某一气象站收集的年降雨量 152010745540.3872255610565000.266735619634

49、020.232346169523360.207256359262910.186866699222530.169576869042180.1542k()kx(1)nkx kdkaPageChapter 7 假设检验k()kx(1)nkx kdka86929002080.140597048891850.1278107078791720.1160117118731620.1049127138621490.0943137148511370.0842147198371180.0745157278341070.0651PageChapter 7 假设检验k()kx(1)nkx kdka16735826910.056017740822820.047118744821770.038319745794490.029620750791410.021121776786100.01262277778690.0042PageChapter 7 假设检验从表7.4.9可以计算出W 的值:2(0.38725540.26675000.00429)0.982630872.43W由于计算得到的W 值大于该值,所以在显著性水平=0.05上不拒绝零假设,即可以认为该批数据服从正态分布。0.050.944W若取 =0.05,查附表7,在n=44时给出:

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(假设检验的基本思想与概念课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|