第四章参数估计与假设检验教学课件.ppt(123页)

上传人(卖家):ziliao2023 文档编号:7956921 上传时间:2024-09-10 格式:PPT 页数:123 大小:1.24MB
下载 相关 举报
第四章参数估计与假设检验教学课件.ppt(123页)_第1页
第1页 / 共123页
第四章参数估计与假设检验教学课件.ppt(123页)_第2页
第2页 / 共123页
第四章参数估计与假设检验教学课件.ppt(123页)_第3页
第3页 / 共123页
第四章参数估计与假设检验教学课件.ppt(123页)_第4页
第4页 / 共123页
第四章参数估计与假设检验教学课件.ppt(123页)_第5页
第5页 / 共123页
点击查看更多>>
资源描述

1、9/22/20231第五章第五章 参数估计与假设检验参数估计与假设检验 5.1 参数估计参数估计 5.2 假设检验假设检验 5.3 非参数检验非参数检验 9/22/20232什么是参数估计?什么是参数估计?参数是刻画总体某方面概率特性的数量参数是刻画总体某方面概率特性的数量.当此数量未知时当此数量未知时,从总体抽出一个样本,从总体抽出一个样本,用某种方法对这个未知参数进行估计就用某种方法对这个未知参数进行估计就是参数估计是参数估计.例如,例如,X N(,2),点估计点估计区间估计区间估计若若,2未知未知,通过构造样本的函数通过构造样本的函数,给出给出它们的估计值或取值范围就是参数估计它们的估计

2、值或取值范围就是参数估计的内容的内容.9/22/20233参数估计在统计方法中的地位参数估计在统计方法中的地位参数估计参数估计假设检验假设检验v统计方法描述统计描述统计推断统计推断统计9/22/20234参数估计的类型参数估计的类型点估计点估计 估计未知参数的值估计未知参数的值区间估计区间估计 估计未知参数的取值范围,估计未知参数的取值范围,并使此范围包含未知参数并使此范围包含未知参数 真值的概率为给定的值真值的概率为给定的值.9/22/20235点估计的思想方法点估计的思想方法设总体X 的分布函数的形式已知,但含有一个或多个未知参数:1,2,k设 X1,X2,Xn为总体的一个样本构造 k 个

3、统计量:),(),(),(21212211nknnXXXXXXXXX随机变量点估计方法点估计方法9/22/20236当测得样本值(x1,x2,xn)时,代入上述方程组,即可得到 k 个数:),(),(),(21212211nknnxxxxxxxxx数 值称数1,k为未知参数1,k的估计值7-6对应统计量 为未知参数的估计量1,k并建立k个方程。9/22/20237q 频率替换法频率替换法利用事件A 在 n 次试验中发生的频率/An n作为事件A 发生的概率 p 的估计量pnnpA7-7三种常用的点估计方法三种常用的点估计方法9/22/20238 方法方法用样本 k 阶矩作为总体 k 阶矩的估计

4、量,建立含有待估参数的方程,从而解出待估参数7-9一般,不论总体服从什么分布,总体期望 与方差 2 存在,则它们的矩估计量分别为11niiXXn2122)(1nniiSXXnq 矩法矩法 9/22/202397-10事实上,按矩法原理,令niiXnX11)(12122XEXnAniiX)()(222XEXE22 A2211niiXXn212)(1nniiSXXn9/22/2023107-11设待估计的参数为k,21设总体的 r 阶矩存在,记为),()(21krrXE样本 X1,X2,Xn 的 r 阶矩为nirirXnB11kr,2,1令),(21krniriXn11 含未知参数 1,2,k 的

5、方程组9/22/2023117-12解方程组,得 k 个统计量:11212(,)(,)nknX XXX XX 未知参数 1,k 的矩估计量111212(,)(,)nkknx xxx xx 代入一组样本值得 k 个数:未知参数 1,k 的矩估计值9/22/202312q 极大似然估计法极大似然估计法 思想方法思想方法:一次试验就出现的 事件有较大的概率 例如:有两外形相同的箱子,各装100个球 一箱 99个白球 1 个红球 一箱 1 个白球 99个红球现从两箱中任取一箱,并从箱中任取一球,结果所取得的球是白球.答答:第一箱.7-17问问:所取的球来自哪一箱?9/22/202313一般,设 X 为

6、离散型随机变量,其分布律为,),()(21uuxxfxXP则样本 X1,X2,Xn的概率分布为),(2211nnxXxXxXP),(),(),(21nxfxfxf12,1,2,ixu uin7-21)(),(21LxxxLn记为或称 L()为样本的似然函数9/22/202314),(21nxxxL),(),(),(max21nxfxfxf称这样得到的 ),(21nxxxg为参数 的极大似然估计值极大似然估计值称统计量),(21nXXXg为参数 的极大似然估计量极大似然估计量7-22MLE简记mle简记选择适当的=,使 取最大值,即L()极大似然法的思想9/22/202315若 X 连续,取 f

7、(xi,)为Xi 的密度函数niixfL1),()(似然函数为注注1 1注注2 2 未知参数可以不止一个,如1,k 设X 的密度(或分布)为1(,)kf x则定义似然函数为111(,)(,)nkikiLf x,1,2,ixin1(,)k11(,;,)nkL xx9/22/202316若11(,;,)nkLxx关于1,k可微,则称0),;,(2121knrxxxL为似然方程组kr,2,1若对于某组给定的样本值 x1,x2,xn,参数 使似然函数取得最大值,即k,2111(,;,)nkL xx),;,(max2121),(21knxxxLk则称1,k为1,k 的极大似然估计值9/22/202317

8、显然,),(21nrxxxgkr,2,1称统计量),(21nrXXXgkr,2,1为1,2,k 的极大似然估计量极大似然估计量7-259/22/202318极大似然估计方法极大似然估计方法1)写出似然函数 L2)求出k,21,使得),;,(2121knxxxL),;,(max2121),(21knxxxLk7-289/22/2023190),;,(2121knrxxxLkr,2,1可得未知参数的极大似然估计值k,21然后,再求得极大似然估计量.7-29 L是 的可微函数,解似然方程组1,k若若 L不是 的可微函数,需用其它方法求极大似然估计值.1,k若若9/22/202320引例引例 已知 X

9、 N(,1),不同样本算得的 的估计值不同,因此除了给出 的点估计外,还希望根据所给的样本确定一个随机区间,使其包含参数真值的概率达到指定的要求.的无偏、有效点估计为X随机变量常数区间估计区间估计9/22/202321如引例中,要找一个区间,使其包含 的真值的概率为0.95.(设 n=5)51,NX1,051NX取05.0查表得96.12/z9/22/202322这说明即称随机区间为未知参数 的置信度为0.95的置信区间.95.05196.15196.1XXP05.096.151XP5196.1,5196.1XX9/22/202323 反复抽取容量为5的样本,都可得一个区间,此区间不一定包含未

10、知参数 的真值,而包含真值的区间占95%.若测得 一组样本值,它可能包含也可能不包含 的真值,反复则得一区间(1.86 0.877,1.86+0.877)抽样得到的区间中有95%包含 的真值.86.1x算得置信区间的意义置信区间的意义9/22/202324)51,51(22zXzX当置信区间为时区间的长度为5122z 达到最短?2/z为何要取9/22/20232597.3)13.2(84.13321zz92.3)96.1(96.1221zz32z31z-2-1120.10.20.30.4取 =0.052z21z-2-1120.10.20.30.49/22/202326设 为待估参数,是一给定的

11、数,(0 50,的置信区间的置信区间2121的置信区间为因此mSnSmn22212221)7(9/22/202341令 Zi=Xi-Yi,i=1,2,n,可以将它们看成来自正态总体 Z N(1 2,12+22)的样本仿单个正态总体公式(2)的置信区间为21niiiZYXYXnS122)()(112221,(4)未知未知,但但 n=m,的置信区间的置信区间21nSntYXZ)1()(2)8(,YXZ9/22/202342取枢轴量(5)方差比方差比2221的置信区间的置信区间(1,2 未知未知)1,1(/2221222122222121mnFSSSSF因此,方差比2221的置信区间为)1,1(1,

12、)1,1(121222122221mnFSSmnFSS)9(9/22/202343取枢轴量),()()()(1)(122211221212212221121mnFYXnmYmXnFmjjniimjjnii(6)方差比方差比2221的置信区间的置信区间(1,2 已知已知)9/22/202344因此,方差比2221 的置信区间为),()()(,),()()(221122121122121mnFYXnmmnFYXnmmjjniimjjnii)10(9/22/202345(三三)单侧置信区间单侧置信区间定义定义 对于给定的 (0 p,pci=mle(bino,X,0.05,20)%求概率的估计值和置信

13、区间,置信度为95%p=0.85利用mle函数进行参数估计pci=0.62107 0.967939/22/202351常用分布的参数估计函数 9/22/202352【例【例5.1.2】我院某年级信息专业数学分析成绩的平均值和我院某年级信息专业数学分析成绩的平均值和标准差计算标准差计算我院学生的数据为我院学生的数据为excel文件:文件:9/22/202353%我院某年级信息专业数学分析成绩的平均值和标准差计算我院某年级信息专业数学分析成绩的平均值和标准差计算C=load(e:dataAA);B=C.A;mu_cul,sigma_cul=normfit(B(:,3)Score_max=max(B

14、(:,3)Score_min=min(B(:,3)mu_cul=77.037sigma_cul=13.902Score_max=100Score_min=36利用上例估计出的均值和标准差,作出利用上例估计出的均值和标准差,作出正态分布的密度图和分布图形。分布函正态分布的密度图和分布图形。分布函数数cdf和密度函数和密度函数pdf的语法分别为:的语法分别为:9/22/202354X=linspace(0,150,100);P=normcdf(X,mu_cul,sigma_cul);p=normpdf(X,mu_cul,sigma_cul);subplot(1,2,1),plot(X,P),tit

15、le(成绩分布图成绩分布图)subplot(1,2,2),plot(X,p),title(成绩密度图成绩密度图)9/22/202355第五章第五章 参数估计与假设检验参数估计与假设检验 5.1 参数估计参数估计 5.2 假设检验假设检验 5.3 非参数检验非参数检验 9/22/202356若对若对参数参数有所有所了解了解但有怀但有怀疑猜测疑猜测需要证需要证实之时实之时用假设用假设检验的检验的方法来方法来 处理处理若对参数若对参数一无所知一无所知用参数估计用参数估计的方法处理的方法处理假设检验的基本概念假设检验的基本概念9/22/202357 假设检验是指施加于一个或多个假设检验是指施加于一个或

16、多个总体的概率分布或参数的假设总体的概率分布或参数的假设.所作所作假设可以是正确的假设可以是正确的,也可以是错误的也可以是错误的.为判断所作的假设是否正确为判断所作的假设是否正确,从从总体中抽取样本总体中抽取样本,根据样本的取值根据样本的取值,按按一定原则进行检验一定原则进行检验,然后作出接受或然后作出接受或拒绝所作假设的决定拒绝所作假设的决定.何为假设检验何为假设检验?9/22/202358实际统计推断原理:实际统计推断原理:小概率事件实际不可能发生小概率事件实际不可能发生。即事件发生可能性很小时,实际上我们认为不可能发生。例如:即事件发生可能性很小时,实际上我们认为不可能发生。例如:1)设

17、姚明在罚球线投篮进与不进是一随机变量)设姚明在罚球线投篮进与不进是一随机变量X,进的可能性是,进的可能性是95%,不进的可能性是,不进的可能性是5%。则在一次投篮时不进这一事件是一个。则在一次投篮时不进这一事件是一个小概率事件,则我们认为他投篮不会不进。小概率事件,则我们认为他投篮不会不进。2)设每个人上街发生交通事故的可能性为)设每个人上街发生交通事故的可能性为0.01%,这是一个小概,这是一个小概率事件。但实际我们认为不可能发生,周末我们照样逛街购物。率事件。但实际我们认为不可能发生,周末我们照样逛街购物。假设检验的原理假设检验的原理9/22/202359事实上我们并不知道,姚明的命中率。

18、我们是用统计推断的事实上我们并不知道,姚明的命中率。我们是用统计推断的方法来决定的。按以下步骤进行推断:方法来决定的。按以下步骤进行推断:1)H0:进球的概率为:进球的概率为95%2)对)对X进行抽样,即观测投篮结果。进行抽样,即观测投篮结果。3)如果进了接受原假设)如果进了接受原假设H0,进球的概率为,进球的概率为95%。如果没有。如果没有进,按小概率事件实际不可能发生原理,认为不进球不是小进,按小概率事件实际不可能发生原理,认为不进球不是小概率事件。因此推翻原假设。概率事件。因此推翻原假设。对总体对总体X的分布律或分布参数作某种假设,根据抽取的分布律或分布参数作某种假设,根据抽取的样本观察

19、值,运用数理统计的分析方法,检验这种假设的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设是否正确,从而决定接受假设或拒绝假设.9/22/2023601.参数检验参数检验:如果观测的分布函数类型已知,这时构造出如果观测的分布函数类型已知,这时构造出的的 统计量依赖于总体的分布函数,这种检验称为参数检验统计量依赖于总体的分布函数,这种检验称为参数检验.参数检验的目的往往是对总体的参数及其有关性质作出明参数检验的目的往往是对总体的参数及其有关性质作出明确的判断确的判断.2.非参数检验非参数检验:在很多实际问题中我们得到的样本并不知道其分布特在很多实际问题中我们得

20、到的样本并不知道其分布特性,而是只利用样本本身进行统计推断,这样的参数推断称为非参数统性,而是只利用样本本身进行统计推断,这样的参数推断称为非参数统计推断。计推断。假设检验分类假设检验分类2.分布的拟合优度检验分布的拟合优度检验一组样本:一组样本:我们关心的是它们来自那一种分布,这时首先假定是服从某一分布,然后用我们关心的是它们来自那一种分布,这时首先假定是服从某一分布,然后用样本构造其分布特性,并和假设的理论分布拟合的好坏进行检验,这就是分样本构造其分布特性,并和假设的理论分布拟合的好坏进行检验,这就是分布的拟合优度检验。描述随机变量的分布特性有两种方法,一是随机变量的布的拟合优度检验。描述

21、随机变量的分布特性有两种方法,一是随机变量的分布函数,另一个是随机变量的密度函数,我们可以分别构造不同的统计量分布函数,另一个是随机变量的密度函数,我们可以分别构造不同的统计量进行检验。进行检验。12,nXXX9/22/202361 假设检验步骤(三部曲三部曲)其中)(VVP)()(221VVVV双边检验双边检验)(1VV左边检验左边检验确定拒绝域.q 计算,并作出相应判断.右边检验右边检验)(VV 0Hq 根据实际问题建立 与 .1H0Hq 在 为真时,选择合适统计量 ,V1H由9/22/202362接受域接受域拒绝域拒绝域统计量计算结果统计量计算结果显著性水平显著性水平0.05下下9/22

22、/202363 某厂生产的螺钉某厂生产的螺钉,按标准强度为按标准强度为68/mm68/mm2 2,而实际生产的强度而实际生产的强度X X 服服N N(,3.6,3.62 2).).若若E E(X X)=)=68,=68,则认为这批螺钉符合要求则认为这批螺钉符合要求,否否则认为不符合要求则认为不符合要求.为此提出如下假设为此提出如下假设:H0:=68 称为称为原假设原假设或或零假设零假设 原假设的对立面原假设的对立面:H1:68 称为称为备择假设备择假设【例【例5.2.15.2.1】假设检验假设检验的任务的任务必须在原假设与必须在原假设与备择假设备择假设 之间作一选择之间作一选择9/22/202

23、364若原假设正确若原假设正确,则则)36/6.3,68(2NX因而因而 68)(XE,即即X偏离偏离6868不应该太远不应该太远,故故取较大值是小概率事件取较大值是小概率事件.6/6.368X可以确定一个常数可以确定一个常数c c 使得使得cXP6/6.368因此因此,取取 ,则则05.0 现从整批螺钉中取容量为现从整批螺钉中取容量为3636的样本的样本,其均值为其均值为 ,问原假设是否正确问原假设是否正确?5.68x96.1025.02zzc9/22/202365681.963.6/6X 由由为检验的为检验的接受域接受域(实际上没理由拒绝实际上没理由拒绝),现现5.68x落入接受域落入接受

24、域,则接受原假设则接受原假设824.6618.69XX或即区间即区间(,66.824)与与(69.18,+)为检验的为检验的拒绝域拒绝域称称 的取值区间的取值区间X(66.824,69.18)H H0 0:=689/22/202366在给定在给定 的前提下的前提下,接受还是拒绝原假接受还是拒绝原假设完全取决于样本值设完全取决于样本值,因此所作检验因此所作检验可能导致以下两类错误的产生:可能导致以下两类错误的产生:第一类错误弃真错误第二类错误取伪错误9/22/202367正确正确正确正确 犯第一类错误的概率通常记为犯第一类错误的概率通常记为 犯第二类错误的概率通常记为犯第二类错误的概率通常记为

25、H0 为真为真H0 为假为假真实情况真实情况所作判断所作判断接受接受 H0拒绝拒绝 H0第一类错误第一类错误(弃真弃真)第二类错误第二类错误(取伪取伪)假设检验的两类错误假设检验的两类错误9/22/202368 任何检验方法都不能完全排除犯错任何检验方法都不能完全排除犯错 假设检验的指导思想是控制犯第一类假设检验的指导思想是控制犯第一类误的可能性误的可能性.理想的检验方法应使犯两类理想的检验方法应使犯两类错误的概率都很小错误的概率都很小,但在样本容量给定的但在样本容量给定的情形下情形下,不可能使两者都很小不可能使两者都很小,降低一个降低一个,往往使另一个增大往往使另一个增大.错误的概率不超过错

26、误的概率不超过,然后然后,若有必要若有必要,通通过增大样本容量的方法来减少过增大样本容量的方法来减少 .9/22/202369P P(拒绝拒绝H H0 0|H H0 0为真为真)若若H H0 0为真为真,则则 2(68,3.6/36)XN所以所以,拒绝拒绝 H H0 0 的概率为的概率为,又称为又称为显显著性水平著性水平,越大越大,犯第一类错误的概犯第一类错误的概率越大率越大,即越显著即越显著.前例前例 中,中,犯第一类错误的概率犯第一类错误的概率0.05 0853.09147.01)37.1()3.5(9/22/202370H H0 0不真不真,即即 68,68,可能小于可能小于68,68,

27、也可能大于也可能大于68,68,的大小取决于的大小取决于 的真值的大小的真值的大小.6.06682.666.06618.69下面计算犯第二类错误的概率 设设 =P P(接受接受H H0 0|H H0 0不真不真)6618.6982.66(66XP266,36,(66,3.6/36)nXN6177.00002.06179.0)63.3()3.0(6.06982.666.06918.69)6918.6982.66(69XP9/22/202371若若26 9,3 6,(6 9,3.6/3 6)n X N取伪的概率较大取伪的概率较大.6062.56567.57072.5750.020.040.060.

28、080.10.129/22/20237267.5 70 72.5 75 77.5 80 82.50.020.040.060.080.10.1296.1025.02 zzc/2/2H0 真真H0 不真不真9/22/202373仍取仍取=0.05,=0.05,则则6 81.9 63.6/8X2(6 6,3.6/6 4)XN由由可以确定拒绝域为可以确定拒绝域为 (,67.118)与与(68.882,+)因此,接受域为因此,接受域为(67.118,68.882)(67.118,68.882)现增大样本容量现增大样本容量,取取n=n=64,64,=66,=66,则则0853.00064.09936.01

29、)49.2()4.6(9/22/2023746177.03936.0)6988.6812.67(69XP)1,(045.06612.6745.06688.68)66882.68118.67(66XPNoImage9/22/202375 一般一般,作假设检验时作假设检验时,先控制犯第一先控制犯第一类错误的概率类错误的概率,在此基础上使在此基础上使 尽量尽量地小地小.要降低要降低 一般要增大样本容量一般要增大样本容量.当当H H0 0不真时不真时,参数值越接近真值参数值越接近真值,越大越大.备择假设可以是单侧备择假设可以是单侧,也可以双侧也可以双侧.H0:=68;H1:68注注 1 1 注注 2

30、2 引例引例2 2中的备择假设是双侧的中的备择假设是双侧的.若根据以若根据以往生产情况往生产情况,0 0=68.=68.现采用了新工艺现采用了新工艺,关关心的是新工艺能否提高螺钉强度心的是新工艺能否提高螺钉强度,越大越大越好越好.此时可作如下的右边假设检验此时可作如下的右边假设检验:9/22/202376关于原假设与备择假设的选取关于原假设与备择假设的选取H H0 0与与H H1 1地位应平等地位应平等,但在控制犯第一类但在控制犯第一类错误的概率错误的概率 的原则下的原则下,使得采取拒使得采取拒绝绝H H0 0 的决策变得较慎重的决策变得较慎重,即即H H0 0 得到特得到特别的保护别的保护.

31、因而因而,通常把有把握的、有经验的结论通常把有把握的、有经验的结论作为原假设作为原假设,或者尽可能使后果严重的或者尽可能使后果严重的错误成为第一类错误错误成为第一类错误.注注 3 3 9/22/202377设取出一容量为 n 的样本,得到均值X和标准差 s,现要对总体均值是否等于某给定值0进行检验.记00:H;01:H称 H0为原原假假设设,H1为备备择择假假设设,两者择其一:接受 H0;拒绝 H0,即接受 H1.单个正态总体均值检验单个正态总体均值检验9/22/202378 用 u检检验验,检验的拒绝域为21uzW 即 2121uzuzW或 用样本方差2s代替总体方差2,这种检验叫 t检检验

32、验.总体方差2已知统计量 z=nX0总体方差2未知统计量tnsX0H0H1在显著水平下拒绝 H0,若0021 uz)1(21ntt001uz)1(1ntt001uz)1(1ntt1、总总体体方方差差2已已知知2总总体体方方差差2未未知知9/22/202379设 X1,X2,Xn是来自正态总体),(2N的样本,欲检验假设:2020:H 2021:H(或 202 或 202)这叫2检检验验.均值已知统计量212202)(1niiX均值未知统计量212202)(1XXniiH0H1在显著水平下拒绝 H0,若202202)(222n或)(2212n)1(222n或)1(2212n202202)(212

33、n)1(212n202202)(22n)1(22n单个正态总体方差检验单个正态总体方差检验9/22/202380构造统计量 222121nnYXz.1、21与与22已已知知时时2、21与与22未未知知但但相相等等时时构造统计量212121222211)2()1()1(nnnnnnsnsnYXt,方差2221,已知统计量 z方差2221,未知但相等统计量tH0H1在显著水平下拒绝 H0,若212121 uz)2(2121nntt21211uz)2(211nntt21211uz)2(211nntt两个正态总体均值检验两个正态总体均值检验9/22/202381设样本 X1,X2,Xn1与 Y1,Y2

34、,Yn2分别来自正态总体),(211N与),(222N,检验假设:22210:H 22211:H(或2221或2221)均值21,已知统计量0F均值21,未知统计量FH0H1在显著水平下拒绝 H0,若22212221),(21210nnFF或),(112210nnFF)1,1(2121nnFF或)1,1(11221nnFF22212221),(2110nnFF)1,1(211nnFF22212221),(11210nnFF)1,1(1121nnFF21122212110)(1)(1niiniiYnXnF,2221ssF(设2221ss)两个正态总体方差检验两个正态总体方差检验9/22/2023

35、82 在总体服从正态分布的情况下,可用以下命令进行假设检验在总体服从正态分布的情况下,可用以下命令进行假设检验.1、总体方差总体方差 2已知时,总体均值的检验使用已知时,总体均值的检验使用 z-检验检验h=ztest(x,m,sigma)%x为正态总体的样本,为正态总体的样本,m为均值为均值 0,sigma为标准差,显著性水平为为标准差,显著性水平为0.05(默认值默认值)h=ztest(x,m,sigma,alpha)%显著性水平为显著性水平为alpha h,sig,ci,zval=ztest(x,m,sigma,alpha,tail)%sig为观察值的概率,为观察值的概率,当当sig为小概

36、率时则对原假设提出质疑,为小概率时则对原假设提出质疑,ci为真正均值为真正均值的的1-alpha置信区间,置信区间,zval为统计量的值。为统计量的值。参数假设检验参数假设检验Matlab实现实现说明说明 若若h=0,表示在显著性水平,表示在显著性水平alpha下,不能拒绝原假设;下,不能拒绝原假设;若若h=1,表示在显著性水平,表示在显著性水平alpha下,可以拒绝原假设。下,可以拒绝原假设。原假设:,原假设:,H0:=0=m若若tail=0,表示备择假设:,表示备择假设:H1:0=m(默认,双边检);(默认,双边检);tail=1,表示备择假设:,表示备择假设:H1:0=m(单边检验);(

37、单边检验);tail=-1,表示备择假设:,表示备择假设:H1:V(right-tailed test)v left -x=-1:1:5;y=randn(20,1);h,p,k=kstest2(x,y)h=1 p=0.0444 k=0.5643 说明 h=1表示可以认为向量x与y的分布不相同,相同的概率只有4.4%9/22/2023100正态分布的拟合优度测试v 函数函数 jbtest v 格式格式 H=jbtest(X)%对输入向量对输入向量X进行进行Jarque-Bera测试,显测试,显著性水平为著性水平为0.05。v H=jbtest(X,alpha)%在水平在水平alpha而非而非5%

38、下施行下施行 Jarque-Bera 测试,测试,alpha在在0和和1之间。之间。v H,P,JBSTAT,CV=jbtest(X,alpha)%P为接受假设的概率值,为接受假设的概率值,P越接近于越接近于0,则可以拒绝是正态分布的原假设;,则可以拒绝是正态分布的原假设;JBSTAT为测为测试统计量的值,试统计量的值,CV为是否拒绝原假设的临界值。为是否拒绝原假设的临界值。v 说明说明 H为测试结果,若为测试结果,若H=0,则可以认为,则可以认为X是服从正态分布的;是服从正态分布的;若若H=1,则可以否定,则可以否定X服从正态分布。服从正态分布。X为大样本,对于小样为大样本,对于小样本用本用

39、lillietest函数。函数。9/22/2023101【例5.3.2】调用调用MATLAB中关于汽车重量的数据,测试中关于汽车重量的数据,测试该数据是否服从正态分布该数据是否服从正态分布 load carsmall h,p,j,cv=jbtest(Weight)说明说明 p=2.67%表示应该拒绝服从正态分布的假设;表示应该拒绝服从正态分布的假设;h=1也可也可否定服从正态分布;统计量的值否定服从正态分布;统计量的值j=7.2448大于接受假设的临大于接受假设的临界值界值cv=5.9915,因而拒绝假设,因而拒绝假设(测试水平为测试水平为5%)。h=1 p=0.0267 j=7.2448 c

40、v=5.9915 9/22/2023102正态分布的拟合优度测试正态分布的拟合优度测试lillietest v格式格式 H=lillietest(X)%对输入向量对输入向量X进行进行Lilliefors测试,显著性水平为测试,显著性水平为0.05。vH=lillietest(X,alpha)%在水平在水平alpha而非而非5%下施行下施行Lilliefors测试,测试,alpha在在0.01和和0.2之间。之间。vH,P,LSTAT,CV=lillietest(X,alpha)%P为接受假为接受假设的概率值,设的概率值,P越接近于越接近于0,则可以拒绝是正态分布,则可以拒绝是正态分布的原假设;

41、的原假设;LSTAT为测试统计量的值,为测试统计量的值,CV为是否为是否拒绝原假设的临界值。拒绝原假设的临界值。v说明说明 H为测试结果,若为测试结果,若H=0,则可以认为,则可以认为X是服从是服从正态分布的;若正态分布的;若H=1,则可以否定,则可以否定X服从正态分布。服从正态分布。9/22/2023103【例5.3.4】Y=chi2rnd(10,100,1);h,p,l,cv=lillietest(Y)h=1 p=0.0175 l=0.1062 cv=0.0886说明说明 h=1表示拒绝正态分布的假设;表示拒绝正态分布的假设;p=0.0175表示服从正态分表示服从正态分布的概率很小;统计量

42、的值布的概率很小;统计量的值l=0.1062大于接受假设的临界值大于接受假设的临界值cv=0.0886,因而拒绝假设,因而拒绝假设(测试水平为测试水平为5%)。hist(Y)从图中看出,数据Y不服从正态分布。0510152025051015202530Probability Greater than Lower Bound is 0.88493DensityCritical Value9/22/2023104)1(2n统计量检验随机数的密度函数拟合优度检验统计量检验随机数的密度函数拟合优度检验 将样本将样本 定义域分为定义域分为k个相等的区间,记个相等的区间,记i区间的区间的观测频数为观测频数

43、为ni(i=1,,k),若随机变量),若随机变量X落于第落于第i区间的概率为区间的概率为Pi,则得理论频数,则得理论频数mi=N Pi,由,由ni,mi构造统计量。构造统计量。nXXX,2112kkiiiimnm12)(=渐近服从自由度为渐近服从自由度为k-1的卡方分布,简记为的卡方分布,简记为 。一般。一般要求样本数要求样本数N30。12k9/22/2023105【例例5.3.5】抽标准正态分布机数】抽标准正态分布机数200个,对密度函数进行个,对密度函数进行统计推断统计推断X=normrnd(0,1,200,1)%抽抽200个正态分布随机数个正态分布随机数histfit(X,8);%作示意

44、图作示意图%构造卡方统计量构造卡方统计量k=8;kk=linspace(-3,3,k+1);%对区间分成对区间分成8个等区间个等区间P=normcdf(kk,0,1);%计算每个区间的概率计算每个区间的概率n=(P(2:k+1)-P(1:k)*200%计算每个区间的理论频计算每个区间的理论频数数m=hist(X,k)%计算每个区间的观测频数计算每个区间的观测频数kf_7=sum(n-m).2)./m)%计算卡方统计量计算卡方统计量%进行统计推断进行统计推断chi2_p=chi2cdf(kf_8,k-1)%计算下侧概率计算下侧概率9/22/2023106if chi2_p0.95chi2_str

45、=接受接受;else chi2_str=拒绝拒绝;endchi2_str结果为接受原假设结果为接受原假设9/22/2023107我们计算出的理论频率与样本频率见表我们计算出的理论频率与样本频率见表5-3-1表表5-3-1 理论频率与样本频率计算结果理论频率与样本频率计算结果自由度为自由度为7的卡方统计量结果为:的卡方统计量结果为:kf_7=9.8806最后的检验结果为接受原假设,样本来自标准正态密度函数。最后的检验结果为接受原假设,样本来自标准正态密度函数。9/22/2023108【例【例5.3.6】一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任

46、一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下:459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677

47、358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851试观察该刀具出现故障时完成的零件数属于哪种分布.9/22/2023109解解 1、数据输入保存在文件daex3_4_12.txt2、作频数直方图 hist(x,10)(看起来刀具寿命服从正态分布)02004006008001000120005101520259/22

48、/2023110 3、作正态概率图 normplot(x)(刀具寿命近似服从正态分布)1002003004005006007008009001000 11000.0030.01 0.02 0.05 0.10 0.25 0.50 0.75 0.90 0.95 0.98 0.99 0.997DataProbabilityNormal Probability Plot9/22/2023111JB正态分布检验正态分布检验h,p,j,cv=jbtest(X)h=0p=0.69129j=0.7384cv=5.99159/22/20231124、参数估计:muhat,sigmahat,muci,sigmac

49、i=normfit(x)muhat=594sigmahat=204.13muci=553.5 634.5sigmaci=179.23 237.139/22/20231135、假设检验 已知刀具的寿命服从正态分布,现在方差未知的情况下,检验其均值 m 是否等于594.结果:h=0,sig=1,ci=553.4962,634.5038.检验结果:1.布尔变量h=0,表示不拒绝零假设.说 明提出的假设寿命均值594是合理的.2.95%的置信区间为553.5,634.5,它 完全包括594,且精度很高.3.sig-值为1,远超过0.5,不能拒绝零假 设.9/22/2023114非参数统计推断 在参数统

50、计推断中,我们是在知道样本服从某分布的前提下进在参数统计推断中,我们是在知道样本服从某分布的前提下进行的,例如在知道总体为正态分布的情况下,构造行的,例如在知道总体为正态分布的情况下,构造T统计量具有良统计量具有良好的估计性质。高但在很多实际问题中我们得到的样本并不知道其好的估计性质。高但在很多实际问题中我们得到的样本并不知道其分布特性,而是只利用样本本身进行统计推断,这样的参数推断称分布特性,而是只利用样本本身进行统计推断,这样的参数推断称为非参数统计推断。由于非参数统计推断不需要预先知道样本的分为非参数统计推断。由于非参数统计推断不需要预先知道样本的分布,虽不能达到最优的统计性质,方法却具

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第四章参数估计与假设检验教学课件.ppt(123页))为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|