区间估计与假设检验课件.ppt

上传人(卖家):晟晟文业 文档编号:4258337 上传时间:2022-11-23 格式:PPT 页数:93 大小:2.58MB
下载 相关 举报
区间估计与假设检验课件.ppt_第1页
第1页 / 共93页
区间估计与假设检验课件.ppt_第2页
第2页 / 共93页
区间估计与假设检验课件.ppt_第3页
第3页 / 共93页
区间估计与假设检验课件.ppt_第4页
第4页 / 共93页
区间估计与假设检验课件.ppt_第5页
第5页 / 共93页
点击查看更多>>
资源描述

1、 区间估计与假设检验 经典正太线性回归模型经典正太线性回归模型 统计学预备知识统计学预备知识 区间估计基本概念区间估计基本概念回归系数回归系数1和和2的置信区间的置信区间2的置信区间的置信区间一、经典正太线性回归模型一、经典正太线性回归模型所谓所谓统计推断的经典理论统计推断的经典理论由两个分支构成,即由两个分支构成,即估计估计和和假设检假设检验验。前面讨论了双变量线性回归模型的参数估计问题。用前面讨论了双变量线性回归模型的参数估计问题。用OLS方方法,估计参数法,估计参数1,2,2。在经典线性回归模型的假定下,。在经典线性回归模型的假定下,可以证明可以证明 、和和 这些参数的估计量满足线性性、

2、无偏这些参数的估计量满足线性性、无偏性和最小方差(性和最小方差(BLUE)。)。估计量的值随样本变化而变化,因此,这些估计量都是随机估计量的值随样本变化而变化,因此,这些估计量都是随机变量。变量。估计是成功的一半。假设检验是另一半。估计是成功的一半。假设检验是另一半。回归分析的目的,不仅仅是估计样本回归函数,而是要用估回归分析的目的,不仅仅是估计样本回归函数,而是要用估计来对总体回归函数进行推断。我们想知道,计来对总体回归函数进行推断。我们想知道,和和 与真与真实的实的 和和 有多接近。有多接近。由于由于 、和和 是随机变量,所以我们需要清楚它们的概是随机变量,所以我们需要清楚它们的概率分布,

3、若不知其概率分布,那我们就无法将它们与其真实率分布,若不知其概率分布,那我们就无法将它们与其真实值相联系。值相联系。1.1.干扰项干扰项u ui i 的概率分布的概率分布为得到为得到OLSOLS的概率分布,我们将专门考虑的概率分布,我们将专门考虑 :(4.1.14.1.1)其中其中假定假定X X 为固定或非随机的,则条件回归分析就以为固定或非随机的,则条件回归分析就以X Xi i 的固定值为条的固定值为条件。件。方程(方程(4.1.14.1.1)表明,)表明,是是Y Yi i 的一个线性函数,的一个线性函数,Y Y i i根据假定根据假定是随机的。由于是随机的。由于则则由于由于k ki i ,

4、系数和系数和Xi i 都是固定的,所以都是固定的,所以 最终是最终是ui i 的一个线性的一个线性函数。函数。假定假定ui 为随机变量,则为随机变量,则 的概率分布将取决于对的概率分布将取决于对ui 的概率的概率分布所做的假定。分布所做的假定。在上一章,我们把普通最小二乘法应用于经典线性回归模型在上一章,我们把普通最小二乘法应用于经典线性回归模型时,并没有对干扰项时,并没有对干扰项ui 的概率分布做出假定。的概率分布做出假定。对这些对这些ui 所做的假定仅是所做的假定仅是:(:(1)它们它们 的期望值为零,(的期望值为零,(2)它们是不相关的,(它们是不相关的,(3)它们有一个不变的方差。有了

5、这些)它们有一个不变的方差。有了这些假定,假定,OLS中估计量满足诸如无偏性和最小方差的统计性质。中估计量满足诸如无偏性和最小方差的统计性质。但是,我们的兴趣不仅要得到但是,我们的兴趣不仅要得到 ,还要利用它对真值,还要利用它对真值 做出推断。或者说,我们的目的不仅是要得到样本回归函数,做出推断。或者说,我们的目的不仅是要得到样本回归函数,还要用它来推测总体回归函数。还要用它来推测总体回归函数。尽管有了高斯尽管有了高斯-马尔可夫定理,但由于马尔可夫定理,但由于OLS法不对法不对ui的概的概率性质做任何假定,仍难以从率性质做任何假定,仍难以从SRF去推断去推断PRF。对这一不足,在回归分析中,人

6、们常常假定对这一不足,在回归分析中,人们常常假定ui遵从正态分遵从正态分布。在第布。在第4章中讨论的经典线性回归模型的假定中增加章中讨论的经典线性回归模型的假定中增加ui 的正的正态性假定,就得到了所谓的态性假定,就得到了所谓的 经典正态线性回归模型经典正态线性回归模型(classical normal linear regression model,CNLRM)2.2.关于关于u ui i 的正态性假定的正态性假定经典正太线性回归假定每个经典正太线性回归假定每个ui 都是都是正态分布正态分布的,并且:的,并且:均值:均值:方差:方差:协方差:协方差:这些假定可更简洁的表述为:这些假定可更简洁

7、的表述为:其中其中 代表代表“其分布为其分布为”,N代表代表“正态分布正态分布”,括号中的,括号中的两项代表正态分布的两个参数:均值和方差。两项代表正态分布的两个参数:均值和方差。性质:对两个正态分布变量来说,零协方差或零相关就意性质:对两个正态分布变量来说,零协方差或零相关就意味着两个变量互相独立。味着两个变量互相独立。因此,在正态性假定下,因此,在正态性假定下,ui 和和uj 协方差为零不仅意味着它协方差为零不仅意味着它们不相关,而且它们是独立分布的。可写成:们不相关,而且它们是独立分布的。可写成:NID表示正态且独立分布(表示正态且独立分布(normally and independen

8、tly distributed)。)。为什么是正态假定?1.ui 代表回归模型中未明显引进的许多自变量(对因变量)代表回归模型中未明显引进的许多自变量(对因变量)的总影响。我们希望这些影响是微小的而且是随机的。利的总影响。我们希望这些影响是微小的而且是随机的。利用统计学中著名的用统计学中著名的中心极限定理(中心极限定理(central limit theorem),),就能证明,如果存在大量独立且相同分布的随机变量,那就能证明,如果存在大量独立且相同分布的随机变量,那么随着这些变量的个数无限增大,它们的总和将趋向正态么随着这些变量的个数无限增大,它们的总和将趋向正态分布。分布。回顾中心极限定理

9、。回顾中心极限定理。令令 为为n个独立的、有均值个独立的、有均值=,方差,方差=的相同的相同PDF的随机变量。令的随机变量。令 (样本均值),那么(样本均值),那么2.正态分布的一个性质是,正态分布变量的任何线性函正态分布的一个性质是,正态分布变量的任何线性函数都是正态分布的。数都是正态分布的。OLS估计量估计量 和和 是是ui 的线性的线性函数,因此,若函数,因此,若ui 是正态分布的,则是正态分布的,则 和和 也是正也是正态分布的。态分布的。3.正态分布是一个比较简单、仅有两个参数的分布,为正态分布是一个比较简单、仅有两个参数的分布,为人们所熟知。人们所熟知。4.如果处理小样本或有限容量样

10、本时,比如说数据少于如果处理小样本或有限容量样本时,比如说数据少于100次观测,那么正态假定就起到关键作用。它不仅有助次观测,那么正态假定就起到关键作用。它不仅有助于推导出于推导出OLS估计量精确的概率分布,而且使我们能用估计量精确的概率分布,而且使我们能用t、F和卡方来对回归模型进行检验。和卡方来对回归模型进行检验。3.3.在正态性假定下在正态性假定下OLSOLS估计量的性质估计量的性质1.它们是无偏的。它们是无偏的。2.它们有最小方差。连同性质它们有最小方差。连同性质1,就意味着它们是最小方差无偏,就意味着它们是最小方差无偏的或者说它们是的或者说它们是有效估计量有效估计量(efficien

11、t estimators)。3.一致性。就是说,随着样本含量无限增大,估计量将收敛到一致性。就是说,随着样本含量无限增大,估计量将收敛到它们的真值。它们的真值。4.(ui 的线性函数)是正态分布的。的线性函数)是正态分布的。均值:均值:方差:方差:方差:方差:或者写成:或者写成:定义标准正态化变量:定义标准正态化变量:Z服从标准正态分布,写作:服从标准正态分布,写作:5.(ui 的线性函数)是正态分布的。的线性函数)是正态分布的。均值:均值:方差:方差:写成写成 令令 同样的,同样的,Z服从标准正态分布。服从标准正态分布。6.服从服从n-2个自由度的个自由度的 分布。分布。7.的分布独立于的分

12、布独立于 。8.,二、统计学预备知识二、统计学预备知识1.统计推断点估计参数估计的一种形式。目的是依据样本参数估计的一种形式。目的是依据样本X=(X1,X2,Xn)估估计总体分布所含的未知参数计总体分布所含的未知参数或或的函数的函数 f()。一般。一般或或f()是总体的某个特征值是总体的某个特征值,如数学期望、方差、相关系数等。如数学期望、方差、相关系数等。比如令,比如令,那么那么 就是真均值就是真均值 的一个估计量。比如的一个估计量。比如 。由于估计量由于估计量 仅提供仅提供 的单一一点估计值,故称点估的单一一点估计值,故称点估计量(计量(point estimator)。)。1231(.)

13、XXXXnX50X 区间估计通过从总体中抽取的样本,根据一定的正确度与精确度的要通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数求,构造出适当的区间,以作为总体的分布参数(或参数的函或参数的函数数)的真值所在范围的估计。的真值所在范围的估计。与点估计相对照,在区间估计中,我们提供真与点估计相对照,在区间估计中,我们提供真将落入其间的将落入其间的一个可能值域。一个可能值域。例如,如果变量例如,如果变量X是正态分布的,则样本均值是正态分布的,则样本均值 也是正态分也是正态分布的,且其均值布的,且其均值=,方差,方差=2/n。即估计量。即估计量 的抽样或

14、概率的抽样或概率分布是分布是 。因此我们可以构造区间:。因此我们可以构造区间:并这样的区间约有并这样的区间约有95%的概率包含真的概率包含真,那么我们正在构造着,那么我们正在构造着的一个的一个区间估计区间估计。注意上面所给的区间依据于一个样本变到。注意上面所给的区间依据于一个样本变到另一个样本的另一个样本的 ,所以是随机的。,所以是随机的。XXX例如,例如,=0.05,则,则1-=0.95,意味着如果我们构造一个置信系数,意味着如果我们构造一个置信系数为为0.95的置信区间,所构区间有的置信区间,所构区间有95%的概率含有真的概率含有真时。一般的,时。一般的,如果置信系数是如果置信系数是1-,

15、我们常说有一个,我们常说有一个100(1-)%置信区间,置信区间,就是显著性水平就是显著性水平(level of significance)。构造两个估计量构造两个估计量 和和 ,两者都是样本,两者都是样本X值的函数,使得值的函数,使得即我们可以说从即我们可以说从 到到 的区间里含有真的区间里含有真的概率是的概率是1-。此。此区间被称为区间被称为的置信度为的置信度为1-的的置信区间置信区间(confidence interval),而而1-成为成为置信系数置信系数(confidence coeffiect)。例假定总体中男子身高是正态分布的,其均值假定总体中男子身高是正态分布的,其均值=英寸且

16、英寸且=2.5英寸。从总体中取一个英寸。从总体中取一个100人的随机样本,其平均身高为人的随机样本,其平均身高为67英寸,求总体平均身高(英寸,求总体平均身高(=)的一个)的一个95%的置信区间。的置信区间。解:由于解:由于 在本咧中在本咧中 ,查表可见:,查表可见:将给定的将给定的 ,和和n值代入,就得到这个值代入,就得到这个95%的置信区间的置信区间为:为:X2.假设检验假定随机变量假定随机变量X有一已知的概率密度函数有一已知的概率密度函数f(x;),其中,其中是分布的是分布的参数,在取得一个大小为参数,在取得一个大小为n的样本之后,我们得到点估计量的样本之后,我们得到点估计量 ,由于真由

17、于真鲜为人知,提问:这个估计量鲜为人知,提问:这个估计量 是否与某个假设的是否与某个假设的值值相符?相符?比方说,比方说,是一个特定的(假定的)是一个特定的(假定的)数值。数值。称虚拟假设(称虚拟假设(null hypothesis),通常记为),通常记为 。与虚拟假设相对的是对立假设(与虚拟假设相对的是对立假设(alternative hypothesis),通),通常记为常记为 ,可叙述为:,可叙述为:。一个假设被称为一个假设被称为简单的简单的,如果它确定了分布的各参数的各一,如果它确定了分布的各参数的各一个值;否则就称为个值;否则就称为复合假设复合假设,例如,例如如果如果 ,并且,并且这

18、是一个简单假设。这是一个简单假设。如果如果因为因为的值未被确定,这是一个复合假设。的值未被确定,这是一个复合假设。为了检验虚拟假设(即检验其真实性),我们利用样本信息以获为了检验虚拟假设(即检验其真实性),我们利用样本信息以获得得检验统计量检验统计量(test statistic)。统计检验量常常就是未知参数的。统计检验量常常就是未知参数的点估计量。然后我们试图找出检验统计量的抽样或概率分布,并点估计量。然后我们试图找出检验统计量的抽样或概率分布,并利用利用置信区间置信区间或或显著性方法显著性方法去检验虚拟假设。去检验虚拟假设。接上例,考虑一个总体中的男子身高(接上例,考虑一个总体中的男子身高

19、(X):):现假设现假设问题是:这个检验统计量为问题是:这个检验统计量为 的样本会来自均值为的样本会来自均值为69的总的总体吗?直觉上,如果体吗?直觉上,如果 “足够接近足够接近”,我们也许不会拒绝虚,我们也许不会拒绝虚拟假设,否则我们宁可拒绝它而接受对立假设。拟假设,否则我们宁可拒绝它而接受对立假设。因为因为 ,所以检验统计量,所以检验统计量 的分布是:的分布是:既然知道了既然知道了 的概率分布,可以根据的概率分布,可以根据 建立建立的一个的一个100(1-)置信区间,然后看此置信区间是否包含置信区间,然后看此置信区间是否包含 。如果包含,就。如果包含,就不拒绝虚拟假设;如果不包含,就可拒绝

20、虚拟假设。不拒绝虚拟假设;如果不包含,就可拒绝虚拟假设。例如,取例如,取=0.05,将有一个,将有一个95%的置信区间。如果此区间包含的置信区间。如果此区间包含 ,由于这样建立起来的区间每由于这样建立起来的区间每100个中有个中有95个会含有个会含有 ,我们就不,我们就不拒绝虚拟假设。拒绝虚拟假设。怎样决定怎样决定 是否足够接近是否足够接近“”呢?有两种方法:呢?有两种方法:(1)置信区间法)置信区间法 (2)显著性检验法。)显著性检验法。X(1)置信区间法XXX置信区间法操作步骤:置信区间法操作步骤:因因 ,从而,从而Zi 是一个标准正态变量,于是由正态分布表知:是一个标准正态变量,于是由正

21、态分布表知:即即整理得:整理得:这就是这就是的一个的一个95%置信区间。一旦建立了这个区间,我们所要做置信区间。一旦建立了这个区间,我们所要做的不外是看的不外是看 是否落入此区间。如果落入,就不拒绝虚拟是否落入此区间。如果落入,就不拒绝虚拟假设,如果不落入则拒绝之。假设,如果不落入则拒绝之。例我们已建立我们已建立的一个的一个95%的置信区间,即的置信区间,即此区间显然不包含此区间显然不包含=69,因此我们能以,因此我们能以95%置信系数拒绝真置信系数拒绝真是是69的虚拟假设。的虚拟假设。落入拒绝域落入拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域用假设检验的语言说,我们所建立的置信区间叫做用假设检

22、验的语言说,我们所建立的置信区间叫做接受域接受域(acceptance region)。接受域以外的区域叫做虚拟假设的)。接受域以外的区域叫做虚拟假设的临临界域界域(critical region)或)或拒绝域拒绝域(regions of rejection)。接)。接受域的上下限(与拒绝域的分界线)叫做受域的上下限(与拒绝域的分界线)叫做临界值临界值(critical values)。)。拒绝域是当原假设为真时,不太可能发生或发生概率很低的检验拒绝域是当原假设为真时,不太可能发生或发生概率很低的检验统计量的数值的集合。如果使用样本数据时所取得的检验统计量统计量的数值的集合。如果使用样本数据时

23、所取得的检验统计量的值落入了概率很低的区域中,则该检验统计量不太可能具有之的值落入了概率很低的区域中,则该检验统计量不太可能具有之前假设的分布,因此原假设不太可能为真。前假设的分布,因此原假设不太可能为真。因此,用假设检验的语言说,如果假设值落入接受区间,就不可因此,用假设检验的语言说,如果假设值落入接受区间,就不可拒绝虚拟假设;否则可以拒绝。拒绝虚拟假设;否则可以拒绝。在决定拒绝或不拒绝在决定拒绝或不拒绝H0时,我们可能犯两类错误:时,我们可能犯两类错误:(1)拒绝一个事实上是真的)拒绝一个事实上是真的H0。第第I类错误类错误(type I error)这种当虚拟假设为真而拒绝虚拟假设的错误

24、又称为据真这种当虚拟假设为真而拒绝虚拟假设的错误又称为据真错误。其概率通常用错误。其概率通常用表示,并称为显著性水平表示,并称为显著性水平(level of significance)。(2)没有拒绝一个不真的)没有拒绝一个不真的H0。第第II类错误类错误(type II error)即接受了错误的虚拟假设。这类错误的概率记为即接受了错误的虚拟假设。这类错误的概率记为,并把,并把不犯不犯II类错误的概率类错误的概率1-称为检验的功效(称为检验的功效(power of the test)。)。检验的功效就是它拒绝一个错误假设的能力。检验的功效就是它拒绝一个错误假设的能力。自然状态自然状态决策决策

25、H H0是对的是对的H H0是错的是错的拒绝拒绝I I类错误类错误无错无错不拒绝不拒绝无错无错IIII类错误类错误第一类错误就是拒真错误,为了降低第一类错误的概率,就第一类错误就是拒真错误,为了降低第一类错误的概率,就要尽可能的做接受的推断,随之带来的就是可能把假的也当要尽可能的做接受的推断,随之带来的就是可能把假的也当成真的接受了,这就导致纳伪错误的增加,即增加第二类错成真的接受了,这就导致纳伪错误的增加,即增加第二类错误发生的概率。误发生的概率。这样本容量固定的前提下,两类错误的概这样本容量固定的前提下,两类错误的概率不能同时减少。率不能同时减少。为了同时减少两类错误的概率就得增加样本容量

26、。为了同时减少两类错误的概率就得增加样本容量。当样本含量一定时,当样本含量一定时,愈大,愈大,愈小;反之,愈小;反之,愈小,愈小,愈大。愈大。P值或准确显著性水平。值或准确显著性水平。除预选某个任定的除预选某个任定的水平外,还可求一个检验统计量的水平外,还可求一个检验统计量的p(概率概率)值值或准确的显著性水平。或准确的显著性水平。P值被定义为:虚拟假设可被拒绝时所看到的最低显著性水平。值被定义为:虚拟假设可被拒绝时所看到的最低显著性水平。假使在一项应用中我们得到一个自由度为假使在一项应用中我们得到一个自由度为20的的t值为值为3.552。从。从表中看到,获得一个等于或大于表中看到,获得一个等

27、于或大于3.552的的t值的值的p值或准确概率是值或准确概率是0.001(单尾)或(单尾)或0.002(双尾)。我们说所观测的(双尾)。我们说所观测的t值值3.552是在是在0.001或或0.002水平上统计上显著的。水平上统计上显著的。(2)显著性检验方法回顾回顾在任一给定应用中,在任一给定应用中,和和n是已知的(或可以估计的),而真是已知的(或可以估计的),而真和和是未知的。如果规定是未知的。如果规定并在并在H0下假定下假定 ,我们就能,我们就能计算出计算出Zi,然后查正态分布表以得到所算的,然后查正态分布表以得到所算的Z值的概率。值的概率。如果是一个小的概率,比如小于如果是一个小的概率,

28、比如小于5%或或1%,就可拒绝虚拟假,就可拒绝虚拟假设设如果假设真实,那么获得所算的如果假设真实,那么获得所算的Z值的机会应该很大。值的机会应该很大。在本例中由于使用了在本例中由于使用了Z变量,故称此检验为变量,故称此检验为Z检验检验。X例:如果如果 ,则,则Z统计量为:统计量为:查表知,超出查表知,超出3或或-3的的Z值概率约为值概率约为0.001。因此超过。因此超过-8的概的概率更小。因此可拒绝率更小。因此可拒绝=69这个虚拟假设,也就是说给定这个虚拟假设,也就是说给定=69而得到而得到 为为67的机会微乎其微。的机会微乎其微。X图图A.15 Z统计量的分布统计量的分布当我们说一个检验是显

29、著的,通常的意思是我们可以拒绝虚拟当我们说一个检验是显著的,通常的意思是我们可以拒绝虚拟假设。而假设。而如果一个检验统计量被认为是显著的,得到它的概率如果一个检验统计量被认为是显著的,得到它的概率等于或小于犯等于或小于犯I类错误的概率类错误的概率。例如,例如,=0.05,我们知道得到一个等于,我们知道得到一个等于-1.96或或1.96的的Z值的概值的概率是率是5%。在我们的说明性例子中,。在我们的说明性例子中,Z=-8,由此得到的,由此得到的Z值的值的概率比概率比2.5%小得多,大大低于预定的犯小得多,大大低于预定的犯I类错误的概率。这就类错误的概率。这就说明为什么所算的说明为什么所算的Z=-

30、8是统计上显著的,也就是为什么拒绝是统计上显著的,也就是为什么拒绝*=69这个虚拟假设。这个虚拟假设。)%95(96.105.051002.061.66H6cm 22011的可靠程度否定原假设即有因此这批产品不合格。,体平均数存在显著差异,说明样本平均数和总因为时,对应的临界值:;:解:选择检验统计量方法ZZZnXUcmH 某种产品的直径为6cm时,产品为合格,现随机抽取100件作为样本进行检查,得知样本平均值为6.1cm,现假设标准差为0.2cm,令=0.05,检验这批产品是否合格。例例检验统计假设的步骤归纳如下:检验统计假设的步骤归纳如下:步骤步骤1.叙述虚拟假设叙述虚拟假设H0和对立假设

31、和对立假设H1(如(如 ,)。)。步骤步骤2.选择检验统计量(如,选择检验统计量(如,)步骤步骤3.确定检验统计量的概率分布(如,确定检验统计量的概率分布(如,)。)。步骤步骤4.选定显著性水平(犯选定显著性水平(犯I类错误的概率)类错误的概率)。步骤步骤5.利用检验统计量的概率分布,建立一个利用检验统计量的概率分布,建立一个100(1-)%置信区间。如果虚拟假设下的参数值(如置信区间。如果虚拟假设下的参数值(如 )落)落入此置信区间即接受域,则不拒绝虚拟假设。如果落在此区间入此置信区间即接受域,则不拒绝虚拟假设。如果落在此区间之外(即落入拒绝域),就可拒绝虚拟假设。当你拒绝一个虚之外(即落入

32、拒绝域),就可拒绝虚拟假设。当你拒绝一个虚拟假设时,你正冒着拟假设时,你正冒着100%次的犯错误风险。次的犯错误风险。X三、区间估计基本概念三、区间估计基本概念在重复抽样中估计值的均值可能会等于真值,(在重复抽样中估计值的均值可能会等于真值,(),),但由于抽样波动,单一估计值很可能不等于真值。但由于抽样波动,单一估计值很可能不等于真值。在统计学中,一个点估计量的可靠性由它的标准误差来衡量。在统计学中,一个点估计量的可靠性由它的标准误差来衡量。因此,我们不能完全信赖一个点估计值,而是要围绕点估计量因此,我们不能完全信赖一个点估计值,而是要围绕点估计量来构造一个区间。来构造一个区间。如,在点估计

33、量的两旁各划出宽为如,在点估计量的两旁各划出宽为2或或3个标准误的一个区间,个标准误的一个区间,使得它有使得它有95%的概率包含着真实的参数值。这就是区间估计的的概率包含着真实的参数值。这就是区间估计的粗略概念。粗略概念。假定我们想知道假定我们想知道 离离 有多有多“近近”,可以试求两个正数,可以试求两个正数 和和 ,位于位于0与与1之间,使得随机区间之间,使得随机区间(random interval)包含包含 的概率为的概率为1-。用符号表示:。用符号表示:这样一个区间存在的话,就称之为这样一个区间存在的话,就称之为置信区间置信区间(confidence interval);1-称置信系数称

34、置信系数(confidence coefficient);而;而(0 1)称显著性水平)称显著性水平(level of significance)。)。置信区间的端点称为置信区间的端点称为临界值临界值(critical value)。)。为置为置信下限,信下限,为置信上限。为置信上限。(5.2.1)注意:注意:1.(5.2.1)中的区间是一个随机区间;它从给一个样本变到另)中的区间是一个随机区间;它从给一个样本变到另一个样本,因为它是根据一个样本,因为它是根据 来构造的,来构造的,是随机的。是随机的。2.如果在重复抽样中,像(如果在重复抽样中,像(5.2.1)那样,在)那样,在1-的概率基础上

35、的概率基础上构造置信区间多次,那么从长期看,平均的说,这些区间将构造置信区间多次,那么从长期看,平均的说,这些区间将有有100%(1-)次包含着参数的真值。)次包含着参数的真值。3.只要只要 尚不知道,区间(尚不知道,区间(5.2.1)就是随机的。但是,一旦)就是随机的。但是,一旦我们有了一个特定的样本并获得我们有了一个特定的样本并获得 的一个特定的数值,区的一个特定的数值,区间(间(5.2.1)就不再是随机的,而是固定的了。这时,我们不)就不再是随机的,而是固定的了。这时,我们不能说一个给定了的能说一个给定了的固定固定区间包含真实区间包含真实 的概率是的概率是1-。在。在这种情况下,这种情况

36、下,要么落入这个固定区间内要么落在区间外,要么落入这个固定区间内要么落在区间外,概率只能是概率只能是1或或0.比如,求得比如,求得95%置信区间是置信区间是 ,我们,我们 就不可以说这个区间包含真实就不可以说这个区间包含真实 的概率是的概率是95%。这个概率。这个概率 不是不是1就是就是0.2(0.42680.5914)四、四、2的置信区间的置信区间在正态性假定下,变量:在正态性假定下,变量:遵循自由度为遵循自由度为n-2的的 分布。(卡特希尔分布。(卡特希尔P73)回顾令回顾令 为独立标准化正态变量(零均值,为独立标准化正态变量(零均值,单位方差),则量:单位方差),则量:遵从遵从k个自由度

37、个自由度(df)的的 分布,这里分布,这里df一词指上述一词指上述 总和总和中独立的量的个数。中独立的量的个数。(5.4.1)其中居于双重不等式中间的其中居于双重不等式中间的 值由(值由(5.4.1)给出,而)给出,而 和和 是得自是得自 数值表中自由度为数值表中自由度为n-2的两个的两个 值(临界值),使得它们各切去值(临界值),使得它们各切去 分布的分布的100(1-)%的尾部面积。如图。整理得:的尾部面积。如图。整理得:这就给出这就给出2的的100(1-)%置信区间。置信区间。例:对于自由度为对于自由度为8的的 表给出下列临界值;表给出下列临界值;(表示(表示 值超过值超过17.5346

38、的概率是的概率是2.5%)因此根据因此根据得得五、回归系数五、回归系数1和和2的置信区间的置信区间1.2的置信区间的置信区间在在ui 的正态性假定下,的正态性假定下,OLS估计量估计量 和和 本身就是正态分本身就是正态分布的。因此,以布的。因此,以 为例,变量为例,变量是一个标准正态化变量。如果真实的总体方差是一个标准正态化变量。如果真实的总体方差 已知,可已知,可利用正态分布对利用正态分布对2做概率性表达。但是做概率性表达。但是 很少知道,在很少知道,在实践中用无偏估计量实践中用无偏估计量 来测定。来测定。(5.3.1)如果用如果用 代替代替,(,(5.3.1)可写成:)可写成:证明见后,这

39、样定义的证明见后,这样定义的t变量遵循自由度为变量遵循自由度为n-2的的t分布。分布。注意(注意(5.3.2)和()和(5.3.1)的区别,我们不用正态分布,而)的区别,我们不用正态分布,而是用是用t分布来建立分布来建立2的置信区间,如下:的置信区间,如下:是由显著水平为是由显著水平为/2和自由度为和自由度为n-2的的t分布给出的分布给出的t变变量值,常常被称为在量值,常常被称为在/2显著水平上的临界值。显著水平上的临界值。估计量 参数估计量的标准误差的估计值回顾回顾t分布分布如果如果Z1 是一标准化正态变量,而另一变量是一标准化正态变量,而另一变量Z2 遵从自由度为遵从自由度为k的的 分布且

40、独立于分布且独立于Z1,则如下定义的变量:,则如下定义的变量:令令12222222222222222/(2)()(2)/(2)()var()iiZtZnxnnxse重新整理得:重新整理得:更简洁的写成,更简洁的写成,2 2的一个的一个100100(1-1-)%置信区间:置信区间:类似地,可以写出:类似地,可以写出:或写成,或写成,1 1的一个的一个100100(1-1-)%置信区间:置信区间:注意给出的注意给出的 1 1和和 2 2的置信区间有一重要特点:的置信区间有一重要特点:置信区间的宽度与估计量的标准误差成比例。标准误差越大,置信区间的宽度与估计量的标准误差成比例。标准误差越大,置信区间

41、越宽,对未知参数的真值进行估计的不确定性越大。置信区间越宽,对未知参数的真值进行估计的不确定性越大。因此估计量的标准误差被喻为估计量的精度。因此估计量的标准误差被喻为估计量的精度。例:若取若取=5%,求,求 2 2的置信区间。的置信区间。解:查表得,解:查表得,2 2的的95%置信区间应该为置信区间应该为即即 或或/20.025(8)(8)2.306tt20.5091 2.306*0.03570.50912.306*0.0357对这个置信区间的解释是:对这个置信区间的解释是:给定置信系数给定置信系数95%,从长远看,在类似于(,从长远看,在类似于(0.4268,0.5914)的)的每每100个

42、区间中,将有个区间中,将有95个包含着真实个包含着真实 2 2值。值。但要注意,我们不可以说,这个特定的区间有但要注意,我们不可以说,这个特定的区间有95%的概率包含的概率包含着真实的着真实的 2 2,因为这个区间已经固定而不再是随机的了,那么,因为这个区间已经固定而不再是随机的了,那么,2 2要么落入其中,要么落在其外。因此,这个给定的固定区间包要么落入其中,要么落在其外。因此,这个给定的固定区间包含着真实的含着真实的 2 2的概率不是的概率不是1就是就是0.2.1的置信区间的置信区间仿照上例,容易证实,在仿照上例,容易证实,在消费消费收入一例收入一例中,中,1 1的的95%的置的置信区间是

43、:信区间是:即即仍需留意,每仍需留意,每100个区间中有个区间中有95个将包含真实的个将包含真实的 1 1;但这个特;但这个特殊的固定区间含有殊的固定区间含有 1 1的概率则是的概率则是1 1或或0.0.六、假设检验六、假设检验一般地,假设有三种形式:(1 1)双侧检验)双侧检验:H0:0;H1:0 (2 2)左侧检验)左侧检验:H0:0;H1:0 或 H0:0;H1:0 或 H0:0 假使我们公设:假使我们公设:就是说在虚拟假设下就是说在虚拟假设下MPC是是0.3,而在对立假设下,而在对立假设下MPC大于或小于大于或小于0.3.对立假设是一个复合假设,就是对立假设是一个复合假设,就是双侧假设

44、(双侧假设(two-sided hypothesis)。这样的双侧假设,常常反映着我们对于对立假设偏离虚拟假设的方向这样的双侧假设,常常反映着我们对于对立假设偏离虚拟假设的方向没有一个强有力的先验性或理论性期望。没有一个强有力的先验性或理论性期望。双侧或双尾检验双侧或双尾检验所观测的所观测的 是否与是否与H0 相符?相符?引入置信区间。在重复抽样意义下,置信区间以引入置信区间。在重复抽样意义下,置信区间以95%的置信系数的置信系数给出真值给出真值 落入其中的一个范围或界限,从而给出了可信的虚拟落入其中的一个范围或界限,从而给出了可信的虚拟假设的一个集合。假设的一个集合。虚拟假设的虚拟假设的 落

45、入这个落入这个100100(1-1-)%置信区间,我们就不拒绝置信区间,我们就不拒绝虚拟假设;如果它落在区间之外,我们就可拒绝虚拟假设。虚拟假设;如果它落在区间之外,我们就可拒绝虚拟假设。决策规则:构造一个决策规则:构造一个 的的100100(1-1-)%置信区间。如果置信区间。如果 在假设在假设H0 下落入此区间,就不要拒绝下落入此区间,就不要拒绝H0。但如果它落在此区。但如果它落在此区间之外,就要拒绝间之外,就要拒绝H0。在假设在假设H0 下,落入此区间的下,落入此区间的 值有值有100100(1-1-)%可信性。因而,可信性。因而,若若 果真落入此域,就不拒绝果真落入此域,就不拒绝H0.

46、拿人为的例子来说:拿人为的例子来说:置信区间:置信区间:显然落在给出的显然落在给出的95%置信区间之外,因此我们能以置信区间之外,因此我们能以95%的的置信度拒绝置信度拒绝MPC的真值是的真值是0.3的假设。即使虚拟假设是真的,的假设。即使虚拟假设是真的,我们得到一个大到我们得到一个大到0.5914的的MPC值,最多也只有值,最多也只有5%的机会,的机会,这是一个小概率。这是一个小概率。在统计学中,当我们拒绝虚拟假设时,我们说我们的发现是统在统计学中,当我们拒绝虚拟假设时,我们说我们的发现是统计上显著的。反之,当我们不拒绝虚拟假设时,我们说我们的计上显著的。反之,当我们不拒绝虚拟假设时,我们说

47、我们的发现不是统计上显著的。发现不是统计上显著的。一些作者使用一些作者使用“统计上高度显著统计上高度显著”一词。该词通常是指,当他一词。该词通常是指,当他们拒绝虚拟假设时,犯们拒绝虚拟假设时,犯I类错误的概率是一个小数,通常指类错误的概率是一个小数,通常指1%。但在后面我们对但在后面我们对p值的讨论将表明,较好的做法是,让研究者值的讨论将表明,较好的做法是,让研究者自己去决定一个统计上的发现,究竟是自己去决定一个统计上的发现,究竟是“显著的显著的”、“中度显中度显著的著的”,还是,还是“高度显著的高度显著的”。七、假设检验:显著性检验法七、假设检验:显著性检验法检验回归系数的显著性:检验回归系

48、数的显著性:t检验检验显著性检验,是利用样本结果来证实一个虚拟假设的真伪的一显著性检验,是利用样本结果来证实一个虚拟假设的真伪的一种检验程序。种检验程序。显著性检验的基本思想在于一个检验统计量(作为估计显著性检验的基本思想在于一个检验统计量(作为估计量)以及在虚拟假设下,这个统计量的抽样分布。根据量)以及在虚拟假设下,这个统计量的抽样分布。根据手中数据算出的统计量的值决定是否接受手中数据算出的统计量的值决定是否接受H H0 0 。回顾在正态性假定下的变量:回顾在正态性假定下的变量:遵循自由度为遵循自由度为n-2的的t分布。如果在虚拟假设下分布。如果在虚拟假设下 的真值被设定,的真值被设定,则可

49、做出如下置信区间表述:则可做出如下置信区间表述:其中其中 是在是在H H0 0 下的下的 值。值。假设检验的置信区间发和显著性检验法之间的联系:假设检验的置信区间发和显著性检验法之间的联系:在置信区间程序中,我们试图建立一个以某种概率包含有真实但在置信区间程序中,我们试图建立一个以某种概率包含有真实但未知未知 的一个范围或区间。的一个范围或区间。而在显著性检验步骤中,我们假设而在显著性检验步骤中,我们假设 为某值,然后来看所计算为某值,然后来看所计算的的 是否位于该假设值周围的某个置信范围之内。是否位于该假设值周围的某个置信范围之内。回到消费回到消费收入例;收入例;df=8。若取若取=5%,则

50、,则令:令:则则如图,因所测的如图,因所测的 落在拒绝域中,故拒绝落在拒绝域中,故拒绝 的虚拟的虚拟假设。假设。在实践中,并不需要明显的估计出在实践中,并不需要明显的估计出 的置信区间,只需计的置信区间,只需计算算t值,然后看它是否落在两个值,然后看它是否落在两个t临界值之间。临界值之间。如该例:如该例:落入临界域内,拒绝落入临界域内,拒绝H0。注意:注意:如果如果 等于假设的等于假设的 ,t值将为零。然而随着值将为零。然而随着 值远离值远离假设的假设的 值,值,t的绝对值将越来越大。的绝对值将越来越大。因此,一个因此,一个“大大”的的|t|值便是与虚拟假设相违背的迹象。对值便是与虚拟假设相违

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(区间估计与假设检验课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|