第二章计量经济学的统计学基础课件.ppt

上传人(卖家):晟晟文业 文档编号:3905327 上传时间:2022-10-24 格式:PPT 页数:95 大小:964.81KB
下载 相关 举报
第二章计量经济学的统计学基础课件.ppt_第1页
第1页 / 共95页
第二章计量经济学的统计学基础课件.ppt_第2页
第2页 / 共95页
第二章计量经济学的统计学基础课件.ppt_第3页
第3页 / 共95页
第二章计量经济学的统计学基础课件.ppt_第4页
第4页 / 共95页
第二章计量经济学的统计学基础课件.ppt_第5页
第5页 / 共95页
点击查看更多>>
资源描述

1、第二章第二章 计量经济学的统计学基础计量经济学的统计学基础主要内容主要内容2.1 总体、样本总体、样本2.2 对总体的描述对总体的描述随机变量的数字特征随机变量的数字特征2.3 对样本的描述对样本的描述样本分布的数字特征样本分布的数字特征2.4 通过样本,估计总体(一)通过样本,估计总体(一)估计量的特征估计量的特征2.5 通过样本,估计总体(二)通过样本,估计总体(二)估计方法估计方法2.6 通过样本,估计总体(三)通过样本,估计总体(三)假设检验假设检验 2.1 总体、样本总体、样本一、总体和样本一、总体和样本引入一个随机变量来描述总体 总体与样本间的联系在于具有相同的分布;总体就是一个随

2、机变量,所谓样本就是n个相互独立的与总体具有相同分布的随机变量x1,xn,即n元随机变量。二、对总体的描述:随机变量的数字二、对总体的描述:随机变量的数字特征特征 数学期望:方差:三、对样本的描述:样本分布的数字特征三、对样本的描述:样本分布的数字特征 样本平均数 ,描述样本的一般水平;样本方差S2,描述样本的离散程度。可以采用Eviews软件计算相关的样本统计量。xEx xVarx2X四、如何用样本的数字特征估计总体的数四、如何用样本的数字特征估计总体的数字特征及数据生成过程中的各种参数字特征及数据生成过程中的各种参数1、估计量的优良性 无偏性、有效性、均方误差最小、一致性2、估计方法。见下

3、图3、对估计量的检验假设检验2、估计方法估计方法 矩估计法最大似然法最小二乘法总体分布未知正态总体一般总体(大样本)已知方差方差未知一般总体(大样本)正态总体估计期望单个总体两个总体估计方差(常用小样本下,正态总体估计其它参数)点估计区间估计3、对估计量的检验对估计量的检验假设检验假设检验(1)对总体分布特征的假设检验)对总体分布特征的假设检验 一个正态总体的假设检验a 检验均值:已知方差和未知方差b 检验方差:未知均值(双尾和单尾)两个正态总体的假设检验a 检验均值:未知方差但可假设其相等b 检验方差:未知均值(双尾和单尾)总体分布的假设检验a 总体为离散型分布b 总体为连续型分布(2)对各

4、种系数、参数估计值的假设检验)对各种系数、参数估计值的假设检验(3)检验的显著性水平)检验的显著性水平 原假设:H0;对立假设:H1。在假设检验中存在两类错误:拒绝一个其实是真的原假设,即第类错误;第 类错误是指H0实际上是错误的,但没有拒绝它。检验的显著性水平(significance level)则定义为第类错误的概率,用符号表示为:P(拒绝H0|H0)即当H0为真时拒绝H0的概率。(4)检验的)检验的p值值 检验的p值(p-value)是指给定t统计量的观测值,能拒绝原假设的最小显著性水平。小的p值是拒绝原假设的证据。如果用表示检验的显著性水平(小数形式),那么p值时,则拒绝原假设,否则

5、在100%显著性水平下,不能拒绝H0。注意注意(1)对于线性回归方程,一般软件包报告了回归系数及标准误,并且给出了针对双侧对立假设的p值,将其除以2,即可得到单侧对立假设的p值;(2)随着样本容量的扩大,一般使用较小的显著性水平,以作为抵偿标准误越来越小的一种办法;对于小样本容量,可以接受较大的显著性水平,可以让大到0.20五、随机变量函数的概念和分布五、随机变量函数的概念和分布1、随机变量函数的定义:、随机变量函数的定义:设f(x)是定义在随机变量X的一切可能取值集合上的函数。如果对于X的每一个可能值x,都有另一个随机变量Y的取值y=f(x)与之相对应,则称Y为X的函数,记作Y=f(X)。常

6、常遇到一些随机变量,它们的分布往往难于直接得到(例如滚珠体积的测量值等),但与它们有关系的另一个随机变量的分布却是容易知道的(如滚珠直径的测量值)。因此,就要研究两个随机变量之间的关系,然后通过它们之间的关系,由已知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。2、几种重要的分布、几种重要的分布(1)正态分布)正态分布若连续型随机变量X的概率密度为则X服从正态分布,记为 。正态分布的数学期望和方差分别为 标准正态分布:标准正态分布:0,21222为常数,exx2,NX,exx2221正态分布的标准化正态分布的标准化(1)如果 ,则(2)两个(或多个)正态分布随机

7、变量的线性组合仍服从正态分布。(3)若Z1,Z2,,Zk为k个独立的标准正态变量,则其平方和服从自由度为k 的2分布,即)(.Z2222212ikZZZk2,N1,0 N(2)分布分布自由度为n的 分布的密度函数注注:标准正态变量的平方服从自由度为1的 分布,即22)1(22Z 0002212122xxexnxxn2 分布的图象分布的图象 N=7N=11概率xN为自由度2定理定理:分布的和仍然服从 分布。若X1,X2,Xn相互独立,且Xi服从具有ni(i=1,2,,n)个自由度的 分布,则它们的和X1+X2+Xn 服从具有 ni 个自由度的 分布。分布是斜分布,其偏度取决于自由度的大小,自由度

8、越小,越向右偏,但随着自由度的增大,逐渐呈对称,接近于正态分布。分布的期望为k,方差为2k,k为 分布的自由度 2222222(3)分布分布(1)分布的定义。如果连续型随机变量x具有密度函数,则称其具有分布 记作 ,这里(2)定理 分布的数学期望和方差 1,001dxxrrdxexrxr这个积分收敛,且有当2 rVarrE0 0)0,0(,0 )()(1 xrxexrxfxrrr,(4)t分布分布 t分布的定义。如果连续型随机变量x具有以下密度函数,则称其具有自由度为n的t分布t(n)。t分布与正态分布类似具有对称性,其均值为0,方差为n/(n-2),但t分布比正态分布略“胖”些。若ZN(0,

9、1),y2(N),则 21221221xnnnxn)(NtNyZt分布和正态分布图像分布和正态分布图像概率密度概率密度x标准正态分布标准正态分布t-分布分布0(5)F分布分布 F分布的定义。分布的定义。若连续型随机变量X的分布密度函数由下式给出,则称X服从自由度分别为n1,n2的F分布,记为F(n1,n2)。若x2(N1),y 2(N2),则 0 001222)(2121212221212111xxxnnxnnnnnnxnnnn21,21/NNFNyNxF分布的图象分布的图象 x概率密度概率密度2.2 对总体的描述对总体的描述随机变量的随机变量的 数字特征数字特征一、数学期望一、数学期望二、方

10、差二、方差三、数学期望与方差的图示三、数学期望与方差的图示一、数学期望一、数学期望1、离散型随机变量数学期望的定义离散型随机变量数学期望的定义 假定有一个离散型随机变量X有n个不同的可能取值x1,x2,xn,而p1,p2,pn是X取这些值相应的概率,则这个随机变量X的数学期望定义如下:数学期望描述的是随机变量(总体)的一般水平。2、连续型随机变量数学期望的定义连续型随机变量数学期望的定义 若连续型随机变量X有分布密度函数 ,而积分 绝对收敛,则称 为X的数学期望。niiinnxpxpxpxpxE12211 x dxxx dxxxXE)(数学期望是最容易发生的,因而是可以期待的。它反映数据集中的

11、趋势。求离散型随机变量数学期望举例求离散型随机变量数学期望举例例例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下:试比较两射手的射击技术水平,并计算如果二人各发一弹,他们得分和的估计值。解 EX=1 0.4+2 0.1+3 0.5=2.1 EY=1 0.1+2 0.6+3 0.3=2.2 E(X+Y)=2.1+2.2=4.3 因为EX 时,MSE()=0,亦即Var()=0和Bias()2=0,也就是随着样本加大,的方差变小;的偏差接近于0,这就是一致性描述的情况。事实上一致性和MSE()=0(当n=)这两条标准在计量经济学中往往是通用的。2.5 通过样本,估计总体通过样本

12、,估计总体 估计方法估计方法一、点估计一、点估计(1)矩法)矩法(2)最大似然法)最大似然法(3)最小二乘法)最小二乘法二、区间估计二、区间估计(一)对总体期望值的估计(一)对总体期望值的估计(二)对总体方差的估计(二)对总体方差的估计(三)关于区间估计的几点说明(三)关于区间估计的几点说明关于区间估计的几点说明(1)在进行区间估计时,应针对不同的情况,采用不同的方法。例如分清分布的形式是已知或是未知;是大样本或是小样本;小样本(估计总体数学期望时)又分清是已知方差或是未知方差等。充分利用分布信息可以得到较精确的估计。(2)一般地,越大置信度越低,置信区间越长;反之,则反。2.6 通过样本,估

13、计总体 假设检验一、假设检验的概念二、两类错误三、置信区间法和显著性检验法四、假设检验的应用单正态总体的假设检验五、“小概率原理”在假设检验中的应用一、假设检验的概念定义:称对任何一个随机变量未知分布的假设为统计假设,简称假设。一个仅涉及到随机变量分布中未知参数的假设称为参数假设。一个仅涉及到随机变量分布的形式而不涉及到未知参数的假设称为非参数假设。提出一个统计假设的关键是将一个实际的研究问题用数学语言转换为统计假设。例1.检验一个硬币是否均匀抛掷一个硬币100次,“正面”出现60次,问此硬币是否均匀?分析:若用X描述抛掷硬币的试验,“X=1”和“X=0”分别表示“出现正面”和“出现反面”。上

14、述问题就是检验X是否可以被认为服从p=0.5的 01分布。问题是分布形式已知,检验参数p=0.5的假设。记作,H0:p=0.5 H1:p0.5零假设与备择假设在统计假设H0:p=0.5 H1:p0.5中,H0称为零假设或原假设,是我们进行统计假设检验欲确定其是否成立的假设体现我们进行假设检验的目的。H1称为备择假设,统计假设检验是二择一的判断,当不成立时,不得不接受它。例2.检验1999年新生女婴体重是否等于某个既定值从2003年出生的女婴中随机地抽取20名,测得平均体重=3160克,标准差=300克,根据已有的统计资料新生女婴的体重=3140克,问现在与过去新生女婴的体重是否有变化?分析:把

15、2003年出生的女婴视为一个总体,用X描述,问题就是判断:H0:EX=3140 H1:EX 3140因为通常可以假定经过量测得到的资料是服从正态分布的,无须检验总体的分布形式,显然这是一个关于参数的假设检验问题。二、两类错误(1)两类错误的概念(2)Neyman-Pearson方法(3)显著性水平(1)两类错误的概念由于我们作出判断的依据是一组样本,结论却是对于总体的,即由局部=全面,由特殊=一般,由个别=整体,因而假设检验的结果不可能绝对正确,它有可能是错误的。而且出现错误可能性的大小,也是以统计规律(小概率原理)为依据的统计规律(小概率原理)为依据的。所可能犯的错误有两类:第一类弃真弃真,

16、原假设符合实际情况,而检验结果把它否定了。设犯这类错误的概率为,那么=p(否定H0/H0实际上为真)。为显著性水平第二类取伪取伪,原假设不符合实际情况,而检验结果却把它肯定下来。设犯这类错误的概率为,那么=p(接受H0/H0实际上不正确)。1-称为检验的功效。(2)Neyman-Pearson方法自然我们希望犯两类错误的概率都越小越好。但对一定的样本容量n,一般都不能做到犯这两类错误的概率同时都小。由于减小=增大,或者减小=增大,于是我们面临抉择,计量经济学中常常愿意使犯”第一类错误“的概率较小,则拒绝错了的概率就较小。而不考虑。因此,拒绝H0是坚决有力的(冒险率是确定的),而不拒绝H0则是无

17、可奈何的(冒险率是没有确定的)。Neyman-Pearson提出了一种方法:先固定犯“第一类错误”的概率,再考虑如何减小犯“第二类错误”的概率,也称Fix ,Min 方法。当确定以后,让尽量的小,1-就越大,称不犯“第二类错误”的概率为“检验的功效(Power of test)。(3)显著性水平显著水平指的是犯“第一类错误”的可能性,即“冒险率”冒H0是真而我们抛弃了H0所犯错误的概率反之,而不接受H0,乃是因为客观事实与H0假设存在差异,且这种差异的程度已经太大了,在给定的小概率下,零假设几乎是不可能发生的,从而认为零假设H0是错的,必须抛弃它。同时,即使抛弃零假设H0,这时也只需冒的风险,

18、抛弃H0的可靠性则为1-。如果假设事关重大,譬如载人的宇宙飞船升空或药品试验,则必须减小显著性水平,使我们不能轻易地拒绝H0。三、假设检验:置信区间法(一)问题的提出(二)假设检验的置信区间法(一)问题的提出曾经提到“某甲成绩大概是80 分左右”可以看成一个区间估计问题。“大概80分左右”p(12)=大概的准确程度 如:p(7585)=95%(75,85)是某甲成绩的估计区间,某甲成绩落在此区间的概率在95%以上。类似地,对这个问题,也可举出一个假设检验的问题 在允许你犯5%以下的错误,即以95%的正确性来回答:“某甲的成绩是80,对吗?”假设 检验同样的问题又是一个假设检验的问题。(二)假设

19、检验的置信区间法的定义对比区间估计和假设检验两种情况,我们发现区间估计实际上给出了一种进行假设检验的方法。比如,当涉及“某甲成绩为80分”(=5%)后,首先对问题进行区间估计,得到成绩在7585之间的概率为95%。若原假设H0落在(75,85)内,显然应当接受H0,否则,则拒绝H0。这种利用区间估计法来进行假设检验的方法称为区间估计法。(三)假设检验的检验水平=区间估计中的显著水平对于给定的置信度95%,对成绩进行区间估计结果为(75,85),若原假设落入该区间,我们便接受H0,认为甲的成绩是80分。如此(接受时),我们可能犯第二类错误,即甲的成绩实际上是72,不是80,而把错误的H0接受了(

20、取伪了)。必须指出,这里的置信度95%只保证了我们运用置信区间法进行假设检验时,在95%下,如果H0正确,我们不会拒绝它,即95%地防止了假设检验中第一类错误的发生,也就是显著水平达到了5%。由此可见,在利用置信区间法进行假设检验时,区间估计中的置信度1-中的,就是假设检验中的检验水平。也就是、不可能同时减小的再探在置信区间法下,随着检验水平的减小(第一类错误的概率减小),例如5%1%,区间估计的置信度就会增大(95%99%);置信度的加大,导致置信区间长度变大,比如从(75,85)(70,90);这样就加了大犯第二类错误的概率,换言之,我们不但可能把72 分成绩误认为80分,还可能把70分误

21、认为80 分;所以,也就是、不可能同时减小通过求置信区间进行假设检验的例子例3 根据长期经验和资料分析,某砖厂生产的砖的“抗断强度”服从正态分布,方差=1.21,今从该厂生产的砖中随机地抽取6块砖,测得强度如下(单位千克/cm2):检验这批砖的平均抗断强度为32.50千克/cm2是否成立(=0.05)?解:H0:=32.50 H1:32.50首先求的置信区间:序 号123456抗断强度 32.5629.6631.6430.0031.3731.03101131.1361.211.10.051.961.11.131.131.9631.131.9630.2532.016632.50:32.50nii

22、p xxxnnnnxzzzH 即假设的超过了置信区间,拒绝显著性检验法/2/2/2/2/2/2/2/2/2/2111/11/,p xxnnxpxpnnnxxpUp UnnUUzzzzzzzzzz 应 用 区 间 估 计 法 进 行 假 设 检 验,首 先 要 计 算 置 信 区 间:令因 此,检 验是 否 落 入 置 信 区 间 就 等 价 于用 计 算 出 来 的 与进 行 比 较。若就 拒 绝0/20;UHzH接 受。检验的步骤(检验均值,已知)1、提出零假设 H0:=0 H1:0 (双侧检验)2、根据抽样所得样本计算检验统计量3、确定显著水平=0.05(或0.01)和相应的临界值4、将计

23、算的U与 进行比较。如果U落在拒绝域内,则拒绝H0,否则接收H0.;5、依据统计结论,作出专业(经济学)上的解释2/2/2/0,)U(P,/uUuunxU从而得拒绝域,可得临界值由22/u2/u采用显著性检验法重作例31、提出零假设 H0:=32.5 H1:32.52、根据抽样所得样本计算检验统计量3、确定显著水平=0.05和相应的临界值为1.964、将计算的U=3.05与临界值1.96进行比较5、下结论:因为U=3.05 1.96,故 P临界值”的事件)居然发生了。出错了,那么,错在那里呢?因为,在整个假设检验过程中,抽样是正确的、统计量的选择是正确的、根据显著水平确定的临界值是正确的、统计

24、量的计算是正确的,统计量与临界值的比较也是正确的。因而,只能是提出的假设H0发生了错误,所以必须拒绝H0。检验“大海里丢了一棵针”?(1)提出假设:检验“大海里丢了一棵针”(2)进行抽样,并计算统计量计算打捞起来的“针”的棵数(3)因为“大海里捞针一场空”是一小概率事件,依据小概率原理,在一次试验中几乎是不可能发生的,确定“临界值”认为大海里不只丢了一棵针。(针丢多了才可以捞到)B.得到了“0”棵针,大概率事件发生了(应该发生)=接受H0,认为“大海里只丢了一棵针”。大海里捞针的错误之一“弃真”1.提出假设H0:“大海里丢了一棵针”真实情况:大海里真的只丢了一棵针,2.如果假设为真,一次试验是

25、不可能捞到一棵针的小概率事件3.打捞结果及下结论:在一次试验中捞到了一棵针,小概率事件居然发生了,而不得不拒绝H0,认为大海里不只一棵针。对比真实情况,那么,此时发生了第一类错误“弃真”大海里捞针的错误之一“取伪”1.提出假设H0:“大海里丢了一棵针”。而真实情况是,大海里不是丢了一棵针,是很多很多。2.如果假设为真,一次试验是不可能捞到一棵针的小概率事件。3.打捞结果及结论:在一次试验中没有捞到了一棵针,大概率事件发生了,是完全应该发生,接受H0是顺理成章之事,认为大海里只丢了一棵针。那么,对比真实情况,此时发生了第二类错误“取伪”(把错误的假设接纳了)。本章的几点注意点:(1)数理统计学研究的核心问题是如何从样本来推断总体的性质。作为观察者,我们对总体的情况往往是不了解的,我们只能对总体进行随机抽样,获得一组样本,通过对一组样本的研究,进而估计总体的各种属性。所以,对总体的研究都是基于样本的。(2)为了描述总体引入了随机变量,只有随机变量这类特殊的变量,才能用以对总体进行全面描述。(3)总体就是一个随机变量。(4)我们通常遵循统计量三个优良性来构造各种统计量,而且利用假设检验来具体地评价关于总体参数的假设是否合理。(5)区间估计和假设检验是一个问题的两个方面。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第二章计量经济学的统计学基础课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|