matlab教程参数估计及假设检验解读课件.ppt

上传人(卖家):三亚风情 文档编号:3004210 上传时间:2022-06-21 格式:PPT 页数:57 大小:2.13MB
下载 相关 举报
matlab教程参数估计及假设检验解读课件.ppt_第1页
第1页 / 共57页
matlab教程参数估计及假设检验解读课件.ppt_第2页
第2页 / 共57页
matlab教程参数估计及假设检验解读课件.ppt_第3页
第3页 / 共57页
matlab教程参数估计及假设检验解读课件.ppt_第4页
第4页 / 共57页
matlab教程参数估计及假设检验解读课件.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、概率论与数理统计实验概率论与数理统计实验 参数估计参数估计 假设检验假设检验实验目的实验目的实验内容实验内容直观了解统计描述的基本内容。直观了解统计描述的基本内容。2 2、假设检验、假设检验1 1、参数估计、参数估计3 3、实例、实例4 4、作业、作业一、参数估计一、参数估计参数估计问题的一般提法参数估计问题的一般提法nXXX,21).( g的的某某个个已已知知函函数数作作出出估估计计,或或估估计计要要依依据据该该样样本本对对参参数数设有一个统计总体,总体分布函数为F(x, ), 其中是未知参数,现从该总体抽样,得样本参数估计参数估计点估计点估计区间估计区间估计点估计点估计 估计未知参数的值。

2、估计未知参数的值。区间估计区间估计 根据样本构造出适当的区间,根据样本构造出适当的区间,使它以一定的概率包含未知参数或未知参使它以一定的概率包含未知参数或未知参数的已知函数的真值。数的已知函数的真值。(一)点估计的求法(一)点估计的求法1 1、矩估计法、矩估计法 基本思想是用样本矩估计总体矩基本思想是用样本矩估计总体矩 . .设总体分布含有个设总体分布含有个k未知参数未知参数 1 , k )(),;()(21连续型连续型XdxxfxXEklll XRxklllXxpxXE)(),;()(21离散型离散型或或 的函数。的函数。一般说,它们是一般说,它们是k ,21计算总体的前计算总体的前 k 阶

3、矩阶矩l=1,., k 阶矩阶矩1( ,)1lk lA , l,k解此方程组得其根为解此方程组得其根为 1()1inX , X,i,l分别估计参数分别估计参数 i ,i=1,.,k,并称其为并称其为 i 的矩估计。的矩估计。11nlliiAXn由于样本的由于样本的l 阶矩阶矩依概率收敛到总体的依概率收敛到总体的l 阶矩阶矩 l 。所以令。所以令2 2、最大似然估计法、最大似然估计法1211(,)(,)nkikiLf x 设总体设总体 X 有概率密度有概率密度 f (x; )(或分布律(或分布律 p(x; ), =( 1,., k)。设。设 X1,.,Xn 是来自总体的简单随机样本,是来自总体的

4、简单随机样本, x1,.,xn是样本观测值是样本观测值。最大似然估计的想法是选取参最大似然估计的想法是选取参数数 i, i=1,.,k,使样本,使样本X1,.,Xn在样本值在样本值x1,.,xn附近取值附近取值的的概率达到最大概率达到最大。即构造似然函数。即构造似然函数或或1211(,)(,)nkikiLp x 若有参数若有参数 =( 1,., k)的取值,的取值,12,k 使得似然函数使得似然函数L( 1,., k)达到最大,则称它为参数达到最大,则称它为参数 1,., k的最大似然估计。的最大似然估计。(二)区间估计(二)区间估计.1),(1)(),(),()10(121212121221

5、1称为置信上限称为置信上限称为置信下限,称为置信下限,置信区间,置信区间,的的的置信水平为的置信水平为为参数为参数则称随机区间则称随机区间使得使得和和,存在两个统计量,存在两个统计量率率,若对于给定的概,若对于给定的概的分布中含有未知参数的分布中含有未知参数设总体设总体 PXXXXXXXnn置信区间的意义置信区间的意义。区间占区间占数的真值,包含真值的数的真值,包含真值的未知参未知参的真值,也可能不包含的真值,也可能不包含间可能包含未知参数间可能包含未知参数间,这个区间,这个区的样本,都得到一个区的样本,都得到一个区反复抽取容量为反复抽取容量为 1n枢轴量1 1、数学期望的置信区间、数学期望的

6、置信区间设样本设样本 ),(n21XXX来自正态母体来自正态母体XN( , 2)(1) 方差方差 2已知已知, 的置信区间的置信区间),(22nzXnzX (2) (2) 方差方差 2 未知未知 , 的置信区间的置信区间 nSntXnSntX) 1(,) 1(22 2 2、方差的区间估计、方差的区间估计 未知时未知时, , 方差方差 2 的置信区间为的置信区间为 )()(,)()(1nS1n1nS1n2122222 .2是样本方差是样本方差S(三)参数估计的命令(三)参数估计的命令1 1、正态总体的参数估计正态总体的参数估计 设总体服从正态分布,则其点估计和区间估计可同设总体服从正态分布,则其

7、点估计和区间估计可同时由以下命令获得:时由以下命令获得: muhat,sigmahat,muci,sigmaci = normfit(X,alpha)此命令以此命令以alpha为为显著性水平,在数据显著性水平,在数据X下,对参数下,对参数进行估计。(进行估计。(alpha缺省时设定为缺省时设定为0.050.05),返回值返回值muhat是是正态分布正态分布的均值的点估计值,的均值的点估计值,sigmahat是标准差的点估计值是标准差的点估计值, , muci是均值的区间估计是均值的区间估计, ,sigmaci是标准差的区间估计是标准差的区间估计. .X X为矩阵(列为变量)时,输出行变量为矩阵

8、(列为变量)时,输出行变量。例例1.1.给出容量为给出容量为50的的正态分布正态分布 N (10, 22)的随机数,并的随机数,并以此为样本值,给出以此为样本值,给出 和和 的点估计和区间估计的点估计和区间估计;给给出容量为出容量为100100的的正态分布正态分布 N N ( (10, 22)的的随机数,并以此随机数,并以此为样本值,给出为样本值,给出 和和 的点估计和区间估计的点估计和区间估计;给出容给出容量为量为1000的的正态分布正态分布 N (10, 22)的随机数,并以此为样的随机数,并以此为样本值,给出本值,给出 和和 的点估计和区间估计的点估计和区间估计.命令命令: :X1=no

9、rmrnd(10,2,50,1);mu1,sigm1,muci1,sigmci1=normfit(X1)X2=normrnd(10,2,100,1);mu2,sigm2,muci2,sigmci2=normfit(X2)X3=normrnd(10,2,1000,1);mu3,sigm3,muci3,sigmci3=normfit(X3)例例2.2.中国改革开放中国改革开放3030年来的经济发展使人民的生活得年来的经济发展使人民的生活得到了很大的提高,不少家长都觉得这一代孩子的身高到了很大的提高,不少家长都觉得这一代孩子的身高比上一代有了明显变化。下面数据是近期在一个经济比上一代有了明显变化。下

10、面数据是近期在一个经济比较发达的城市中学收集的比较发达的城市中学收集的1717岁的男生身高(单位:岁的男生身高(单位:cmcm),若数据来自正态分布,计算学生身高的均值和),若数据来自正态分布,计算学生身高的均值和标准差的点估计和置信水平为标准差的点估计和置信水平为0.950.95的区间估计。的区间估计。170.1,179,171.5,173.1,174.1,177.2,170.3,176.2,175.4,163.3,179.0,176.5,178.4,165.1,179.4,176.3,179.0,173.9,173.7173.2,172.3,169.3,172.8,176.4,163.7,

11、177.0,165.9,166.6,167.4174.0,174.3,184.5,171.9,181.4,164.6,176.4,172.4,180.3,160.5166.2,173.5,171.7,167.9,168.7,175.6,179.6,171.6,168.1,172.2例例3. 3. 产生产生正态分布随机数作为样本值,计算区间估正态分布随机数作为样本值,计算区间估计的覆盖率。写出计的覆盖率。写出fugailv.m文件。文件。function fugailv(mu,sigm,n,m,alpha)X=normrnd(mu,sigm,m,1);Mu,Sigm,Muci,Sigmci=no

12、rmfit(X,alpha);muratio=0;sigmratio=0;for i=1:n X=normrnd(mu,sigm,m,1); Mu(i),Sigm(i),muci,sigmci=normfit(X,alpha);endfor j=1:n if (Mu(j)=Muci(1)&(Mu(j)=Sigmci(1)&(Mu(j)50),按中心极限定理,),按中心极限定理,它近似地服从正态分布;它近似地服从正态分布;(2). ).使用使用Matlab工具箱中具有特定分布总体的估计命令工具箱中具有特定分布总体的估计命令. .10muhat, muci = expfit(X,alpha)- 在

13、显著性水平在显著性水平alpha下,求下,求指数分布的数据指数分布的数据X X的的均值的点估计及其区均值的点估计及其区间估计间估计. .20 lambdahat, lambdaci = poissfit(X,alpha)- 在显在显著性水平著性水平alpha下,求下,求泊松分布的数据泊松分布的数据X 的参数的点估的参数的点估计计及其区间估计及其区间估计. .30phat, pci = weibfit(X,alpha)- 在显著性水平在显著性水平alpha下,求下,求Weibull分布的数据分布的数据X X 的参数的点估计及其区间的参数的点估计及其区间估计估计. .函数名函数名参数估计参数估计对

14、应的参数对应的参数调用格式调用格式mle极大似极大似然估计然估计phat=mle(dist,data)phat,pci=mle(dist,data)phat,pci=mle(dist,data,alpha)phat,pci=mle(dist,data,alpha,pl)normlike对数正态对数正态似然函数似然函数L=normlike(params,data)normfit正态分布正态分布 muhat,sigmahat,muci,sigmaci = normfit(X,alpha)函数名函数名参数估计参数估计对应的参数对应的参数调用格式调用格式poissfit泊松分布泊松分布lambdaha

15、t=poissfit(X)lambdahat,lambdaci=poissfit(X)unifit均匀分布均匀分布ahat,bhat=unifit(X)ahat,bhat,ACI,BCI=unifit(X)ahat,bhat,ACI,BCI=unifit(X, alpha)lambdahat,lambdaci=poissfit(X,alpha)函数名函数名参数估计参数估计对应的参数对应的参数调用格式调用格式weibfit威布尔分布威布尔分布weiblike威布尔对数威布尔对数似然函数似然函数logL=weiblike(params,data)logL,info=weiblike(params,

16、data)phat=weibfit(X)phat,pci=weibfit(X)phat,pci=weibfit(X, alpha)说明:命令说明:命令mle的调用格式中的调用格式中:phat,pci=mle(dist,data,alpha,p1)只用于二项分布,只用于二项分布,其中其中p1p1为试验次数为试验次数 例例4 4. rv=binornd(20,0.75,1,10) %产生产生1010个二项分布随机数参数为个二项分布随机数参数为2020和和0.750.75 p,pci=mle(binomial,rv,0.05,20)rv=12 14 18 13 12 14 16 15 18 16 p

17、=0.7400pci=0.6734, 0.7993例例5. 5. 生成指数生成指数分布随机数分布随机数100100个,假设均值参数真值个,假设均值参数真值为为0.5, 0.5, 以此为样本值,给出参数以此为样本值,给出参数的点估计和区间估计的点估计和区间估计命令命令: :r=exprnd(0.5,100,1);lamta,lamtaci=expfit(r);lamta,lamtaci=expfit(r,0.01);结果结果: :lamta=0.4579lamtaci=0.3799, 0.5627lamta=0.4579lamtaci=0.3587,0.60153. 3. 不常用分布的参数估计(

18、极大似然估计)不常用分布的参数估计(极大似然估计)此类问题一般归结为无约束最优化问题。此类问题一般归结为无约束最优化问题。无约束最优化问题的一般形式:无约束最优化问题的一般形式:)(min F 参数的极大似然估计就是取目标函数为参数的极大似然估计就是取目标函数为),()( xLF 的无约束最优化问题。的无约束最优化问题。值值点点。上上,求求目目标标函函数数的的最最小小的的定定义义域域就就是是在在函函数数。此此问问题题的的函函数数,通通常常称称为为目目标标是是参参数数向向量量 F方法:方法:最速下降法最速下降法Newton(Newton(牛顿)法及其修正的方法。牛顿)法及其修正的方法。共轭方向法

19、和共轭梯度法共轭方向法和共轭梯度法变尺度法(拟牛顿法)变尺度法(拟牛顿法)等等等等详见北京大学出版社详见北京大学出版社 高惠璇编著高惠璇编著统计计算统计计算P359-P379P359-P379二、假设检验二、假设检验 对总体对总体X的分布律或分布参数作某种假设,根据的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒检验这种假设是否正确,从而决定接受假设或拒绝假设绝假设. .统计推断的另一类重要问题是假设检验问题。统计推断的另一类重要问题是假设检验问题。在总体的分布函数完全未知或只知其形

20、式,但在总体的分布函数完全未知或只知其形式,但不知其参数的情况,为了推断总体的某些未知不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设。特性,提出某些关于总体的假设。1. 1. 参数检验参数检验:如果总体的分布函数类型已知,这时:如果总体的分布函数类型已知,这时构造出的统计量依赖于总体的分布函数,这种检验构造出的统计量依赖于总体的分布函数,这种检验称为参数检验称为参数检验. . 参数检验的目的往往是对总体的参数及其有关性质参数检验的目的往往是对总体的参数及其有关性质出明确的判断出明确的判断. .2. 2. 非参数检验非参数检验:如果所检验的假设并非是对某个分布如果所检验的假

21、设并非是对某个分布的参数作出明确的判断,检验统计量的分布函数不依的参数作出明确的判断,检验统计量的分布函数不依赖于总体的分布类型,这种检验叫非参数检验赖于总体的分布类型,这种检验叫非参数检验. . 如判断如判断总体分布类型的检验就是非参数检验总体分布类型的检验就是非参数检验. .假设检验的一般步骤是假设检验的一般步骤是:根据实际问题提出原假设根据实际问题提出原假设H0与备择假设与备择假设H1, 即说明需要检验的假设的具体内容即说明需要检验的假设的具体内容 。选择适当的统计量,选择适当的统计量,构造恰当的拒绝域构造恰当的拒绝域. .根据样本观测值计算统计量的观测值,看其是否落根据样本观测值计算统

22、计量的观测值,看其是否落 入拒绝域中,从而在检验水平条件下对拒绝或接入拒绝域中,从而在检验水平条件下对拒绝或接受原假设受原假设H0作出判断作出判断 .(一)参数检验(一)参数检验1 1、单个正态总体、单个正态总体XN( , 2)均值检验均值检验 - -方差方差 2已知时采用已知时采用 z 检验检验- - 方差方差 2未知未知,采用,采用t 检验检验2 2、单个正态总体方差检验、单个正态总体方差检验- 2 23 3、两个正态总体、两个正态总体N( 1, 12)和和N( 2, 22)均值检验均值检验(1 1)已知)已知 选取统计量选取统计量21 22 222121nnYXz (2 2)方差未知)方

23、差未知 ,检验,检验2221 212121222211nn2nnnns1ns1nYXt )()()(012:H选取统计量选取统计量(2 2)方差未知)方差未知 ,检验,检验2221 212121222211nn2nnnns1ns1nYXt )()()(012:H选取统计量选取统计量当当 |t|t 1/2(n1+n2-2)时拒绝原假设,否则接受原假设。时拒绝原假设,否则接受原假设。 - -t 1 /2 (n1+n2-2)为为 t 分布分布t (n1+n2-2)的下测的下测1 /2分位数,分位数,n1为来自总体为来自总体N( 1, 12) 的样本的容量,的样本的容量,n2是来自总体是来自总体N(

24、2, 22)的样本的容量。的样本的容量。4 4、两个正态总体方差检验、两个正态总体方差检验122111022121(),1()niiniiXnFYn2221ssF 5 5、参数检验的计算机命令、参数检验的计算机命令1 10 0 z z检验检验(1 1) 命令命令ztest函数函数(2 2)功能:给定方差条件下进行正态总体均值得检验)功能:给定方差条件下进行正态总体均值得检验(3 3)语法:)语法:h=ztest(x,m,sigm); h=ztest(x,m,sigm,alpha); h,sig,ci=ztest(x,m,sigm,alpha,tail); h=1,则拒绝原假设,则拒绝原假设,h

25、=0, 则接收原假设则接收原假设(4 4)描述:)描述:ztest(x,m,sigm)在在0.05水平下进行水平下进行Z检验,以确检验,以确 定服从正态分布的样本均值是否为定服从正态分布的样本均值是否为m,sigm为给定的标准差为给定的标准差h=ztest(x,m,sigm,alpha)给出显著水平控制参数给出显著水平控制参数alpha, h,sig,ci=ztest(x,m,sigm,alpha,tail)允许指定是进行单侧允许指定是进行单侧检验还是双侧检验。检验还是双侧检验。tail参数可以有下面几个取值:参数可以有下面几个取值:tail=0(为默认设置)指定备择假设(为默认设置)指定备择

26、假设tail=1指定备择假设指定备择假设tail=-1指定备择假设指定备择假设0 0 0 sig为与为与Z 统计量相关的统计量相关的 p值。值。ci为均值真值的为均值真值的1-alpha置信区间。置信区间。 (5 5)应用实例)应用实例例例6 6、生成、生成100100个标准正态分布的随机数,假设个标准正态分布的随机数,假设均值和标准差的观测值与真值之间没有差异,进均值和标准差的观测值与真值之间没有差异,进行检验。行检验。过程如下:过程如下:x=normrnd(0,1,1,100);h,sig,ci=ztest(x,0,1)结果:结果:h=0sig=0.6317ci=-0.1481 0.243

27、9例例7 7、某批矿砂的、某批矿砂的5 5个样品中的镍含量,经测定为(个样品中的镍含量,经测定为(%) 3.25 3.27 3.24 3.26 3.243.25 3.27 3.24 3.26 3.24设测定值总体服从正态分布,标准差为设测定值总体服从正态分布,标准差为0.040.04,问在,问在0.010.01水水平上能否接受假设:这批镍含量的均值为平上能否接受假设:这批镍含量的均值为3.253.25。过程如下:过程如下:x=3.25 3.27 3.24 3.26 3.24;h,sig,ci=ztest(x,3.25,0.04,0.01)结果:结果:h=0sig=0.9110ci=3.2059

28、 3.298例例8、下面列出的是某工厂随机选取的、下面列出的是某工厂随机选取的20只部件的装配时间只部件的装配时间 9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.2 10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7 设总体服从正态分布,标准差为设总体服从正态分布,标准差为0.4,问在,问在0.05水平上能否认水平上能否认为装配时间的均值显著的大于为装配时间的均值显著的大于10。 需检验需检验H0: 10, H1: 10过程如下:过程如下:x=9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1

29、9.6 10.2 10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7;h,sig,ci=ztest(x,10,0.4,0.05,1)结果:结果:h=1sig=0.0127ci=10.0529 inf拒绝原假设拒绝原假设2 20 0 单个样本的单个样本的 t 检验检验(1 1) 命令命令 ttest 函数函数(2 2)功能:未知方差条件下进行正态总体均值得检验)功能:未知方差条件下进行正态总体均值得检验(3 3)语法:)语法:h=ttest(x,m); h=ttest(x,m,alpha); h,sig,ci=ttest(x,m,alpha,tail);

30、h=1,则拒绝原假设则拒绝原假设,h=0, 则接收原假设则接收原假设(4 4)格式的使用和参数的取值含义与)格式的使用和参数的取值含义与ztest大致相同大致相同(5 5)应用实例)应用实例例例9、测得一批刚件、测得一批刚件20个样品的屈服点(单位:个样品的屈服点(单位:T/mm2)为:)为: 4.98 5.11 5.20 5.11 5.00 5.61 4.88 5.27 5.38 5.20 5.46 5.27 5.23 4.96 5.35 5.15 5.35 4.77 5.33 5.54设屈服点服从正态分布,在设屈服点服从正态分布,在0.05水平上,检验该样本的均值是水平上,检验该样本的均值

31、是否为否为5.20,的假设检验。,的假设检验。 需检验需检验H0: =5.20, H1: 5.20过程如下:过程如下:x=4.98 5.11 5.20 5.11 5.00 5.61 4.88 5.27 5.38 5.20 5.46 5.27 5.23 4.96 5.35 5.15 5.35 4.77 5.33 5.54;m=mean(x)h,sig,ci=ttest(x,5.20,0.05)结果:结果:m=5.2075h=0sig=0.8796ci=5.1052 5.309830 两个样本的两个样本的t检验检验(1 1) 命令命令 ttest2 函数函数(2 2)功能:两个样本均值差异的)功能

32、:两个样本均值差异的t t检验检验(3 3)语法:)语法: h,significance,ci=ttest2(x,y);h,significance,ci=ttest2(x,y,alpha);h,significance,ci=ttest2(x,y,alpha, tail); h=1,则拒绝原假设,则拒绝原假设,h=0, 则接收原假设则接收原假设(4 4)格式的使用和参数的取值含义与)格式的使用和参数的取值含义与ttestttest大致相同大致相同(5 5)应用实例)应用实例例例1010、对两种不同的水稻品种、对两种不同的水稻品种A,B分别统计了分别统计了8 8个地区的单位个地区的单位面积产量

33、(单位:面积产量(单位:kgkg) 品种品种A:86 87 56 93 84 93 75 79 品种品种B: 80 79 58 91 77 82 76 66 要求检验两个水稻品种的单位面积产量之间是否有显著差异?要求检验两个水稻品种的单位面积产量之间是否有显著差异?过程如下:过程如下:x=86 87 56 93 84 93 75 79;y=80 79 58 91 77 82 76 66 ;h,significance,ci=ttest2(x,y)结果:结果:h=0significance=0.3393ci=-6.4236 17.4236(二)非参数检验(二)非参数检验1. Jarque-Ber

34、a检验检验(1 1) 数学原理:数学原理: Jarque-Bera检验是评价检验是评价X X服从正态分布的服从正态分布的假设是否成立。该检验基于样本偏度和峰度,样本偏度接近假设是否成立。该检验基于样本偏度和峰度,样本偏度接近于于0 0,样本峰度接近于,样本峰度接近于3 3。基于此构造一个包含。基于此构造一个包含 2 2 统计量:统计量: JB=n(g12+(g2-3)2/4)/6 JB=n(g12+(g2-3)2/4)/6 (n n为样本容量)为样本容量)JarqueJarque和和BeraBera证明了在证明了在正态性假定正态性假定下,下,JBJB渐进的服从自由渐进的服从自由度为度为2 2的

35、的 2分布,若分布,若JBJB超过了超过了 1 12 2 (2), (2),即即 2 2 (2) (2)的下测的下测1分分位数位数,则拒绝正态分布零假设则拒绝正态分布零假设, ,反之反之, ,接受零假设。接受零假设。(2 2)函数名称:)函数名称:jbtest(3 3)语法:)语法:H=jbtest(x); H=jbtest(x, alpha); H,p,jbstat,cv=jbtest(x, alpha); H=1,则拒绝服从正态,则拒绝服从正态,H=0, 则接收服从正态则接收服从正态(4) alpha为显著水平,为显著水平,p为为p值,值,jbstat为检验统计为检验统计量的值,量的值,c

36、v为确定是否拒绝原假设的的临界值。为确定是否拒绝原假设的的临界值。(5 5)应用实例)应用实例例例1111、对下列数据确定其是否服从正态分布。、对下列数据确定其是否服从正态分布。459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885

37、 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 8512. 总体分布的总体分布的2检验法检验法总体总体X的样本观测值为的样本观测值为x1,x2,xn,考虑如下检验问题:考虑如下检验问题:H0:X的分布函数为的分布函数为F(x),这里这里F(x)为已知为已知的分布函数的分布函数在

38、实数轴上取在实数轴上取k个分点个分点t1,t2,tk,得到互不相交的区间得到互不相交的区间112(, ), , ), ,)ktt tt设样本观测值为设样本观测值为x1,x2,xn落入第落入第i个区间的个数为个区间的个数为vi,其频率为其频率为vi/n.如果如果H0成立,由给定的分布函数成立,由给定的分布函数F(x),可以计算可以计算X落在落在每个小区间的概率为:每个小区间的概率为:121()( )()iiiipP tXtF tF t其中其中01,ktt 考虑统计量考虑统计量2211122111()()kkkiiiiiiiiiiivvnpvnpnnpnpnpPearson在在1900年证明了如下

39、定理:年证明了如下定理:设设F(x)是随机变量是随机变量X的分布函数,当的分布函数,当H0成立时,上述成立时,上述给出的给出的2的极限分布为的极限分布为2 (k),k为分点个数为分点个数,其中其中F(x)中中不含有未知参数不含有未知参数,vi称为实际频数,称为实际频数,npi为理论频数。为理论频数。由此定理可得:给定显著性水平由此定理可得:给定显著性水平,查,查2分布表可得分布表可得临界值临界值2 (k) ,当当2 2 (k) 时,则拒绝时,则拒绝H0 ,认为总体,认为总体X的分布函数与的分布函数与F(x)有显著差异。若有显著差异。若2 2 (k) ,不能,不能拒绝拒绝H0 。当总体当总体F(

40、x)中中含有未知参数含有未知参数1,2,r时时,则需要先利用则需要先利用数据数据对未知参数进行估计对未知参数进行估计(通常采用极大似然估计),(通常采用极大似然估计),此时有如下定理:此时有如下定理:设设F(x)是随机变量是随机变量X的分布函数,且的分布函数,且F(x)中含有中含有r个未知个未知参数当参数当H0成立时,上述给出的成立时,上述给出的2的极限分布为的极限分布为2 (k-r),r为参数个数为参数个数.此方法对离散型随机变量和连续型随机变量均适用。此方法对离散型随机变量和连续型随机变量均适用。由此定理可得:给定显著性水平由此定理可得:给定显著性水平,查,查2分布表可得分布表可得临界值临

41、界值2 (k-r) ,当当2 2 (k-r) 时,则拒绝时,则拒绝H0 ,认为,认为总体总体X的分布函数与的分布函数与F(x)有显著差异。若有显著差异。若2 2 (k-r)不能拒绝不能拒绝H0 。例例12 :卢瑟福在:卢瑟福在2608个等时间间隔内观测一枚放射性个等时间间隔内观测一枚放射性物质放射出的粒子数物质放射出的粒子数X,下表是观测结果的汇总,其,下表是观测结果的汇总,其中中ni表示表示2608次观测中放射粒子数为次观测中放射粒子数为i的次数。的次数。ini0 1 2 3 4 5 6 7 8 9 10 1157 203 383 525 532 408 273 139 45 27 10 6

42、请用该组数据检验该放射性物质在单位时间内放射出请用该组数据检验该放射性物质在单位时间内放射出的粒子数是否服从泊松分布?(取显著性水平为的粒子数是否服从泊松分布?(取显著性水平为0.05)function H=poisstest(alpha)x=0 1 2 3 4 5 6 7 8 9 10 11;m=mean(x);v=57 203 383 525 532 408 273 139 45 27 10 6;p=poisspdf(13,m);y1=sum(v.2./p./2608)-2608;y2=chi2inv(alpha,10);if y1y2 H=1;else H=0;endH=poisstes

43、t(0.05)H = 1三、线性回归三、线性回归一元线性回归一元线性回归回归模型和参数确定回归模型和参数确定一元线性回归研究因变量于一个自变量之间的线性一元线性回归研究因变量于一个自变量之间的线性关系。模型为关系。模型为xbby10 y是因变量,是因变量,x是自变量,是自变量,b0, b1为待估参数。为待估参数。2 2、函数名称、函数名称: : regress(1)语法:)语法:b=regress(y,x); (2)说明:)说明:b返回参数的估计值。返回参数的估计值。y为列向量,为列向量, x为为自变量取值矩阵。自变量取值矩阵。注意:在回归分析时,可先对数据划出散点图,看注意:在回归分析时,可

44、先对数据划出散点图,看是否有线性关系,再进行回归分析,散点图的命令是否有线性关系,再进行回归分析,散点图的命令为:为:scatter例例13、为研究某一化学反应过程中,温度、为研究某一化学反应过程中,温度x(0C)对产对产品得率品得率Y(%)的影响,测得数据如下:)的影响,测得数据如下:温度温度x 100 110 120 130 140 150 160 170 180 190得率得率y 45 51 54 61 66 70 74 78 85 89求求y关于关于x 的线性回归方程。的线性回归方程。过程如下:先画散点图过程如下:先画散点图x=100;110;120;130;140;150;160;170;180;190;y= 45;51;54;61;66;70;74;78;85;89;scatter(x,y)a=ones(length(x),1);z=a,xb=regress(y,z);b= -2.7394 0.4830

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(matlab教程参数估计及假设检验解读课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|