1、1第二章 统计学基础知识回顾2主要内容n第一节 总体、样本和随机函数n第二节 对总体的描述随机变量的数字特征n第三节 对样本的描述样本分布的数字特征n第四节 随机变量的分布总体和样本的连接点n第五节 通过样本,估计总体(一)估计量的特征n第六节 通过样本,估计总体(二)估计方法n第七节 通过样本,估计总体(三)假设检验 3四个基本定义与统计学的逻辑结构n总体和个体n样本和样本容量n随机变量n统计量n统计学的逻辑结构4总体(集合)和个体(构成集合的元素)n研究对象的全体称为总体或母体,组成总体的每个基本单位称为个体。(1)按组成总体个体的多寡分为:有限总体和无限总体;(2)总体具有同质性:每个个
2、体具有共同的观察特征,而 与其它总体相区别;(3)度量同一对象得到的数据也构成总体,数据之间的差 异是绝对的,因为存在不可消除的随机测量误差;(4)个体表现为某个数值是随机的,但是,它们取得某个 数值的机会是不同的,即它们按一定的规律取值,即 它们的取值与确定的概率相对应。5样本和样本容量n总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量,又称为样本的大小。n抽样是按随机原则选取的,即总体中每个个体有同样的机会被选入样本。6随机变量n根据概率不同而取不同数值的变量称为随机变量(Random Variable)。n注意:(1)一个随机变量具有下列特性:RV可以取许多不
3、同的数 值,取这些数值的概率为p,p满足:0=p=1。(2)随机变量以一定的概率取到各种可能值,按其取值情 况随机变量可分为两类:离散型随机变量和连续型随 机变量。离散型随机变量的取值最多可列多个;连续 型随机变量的取值充满整个数轴或者某个区间。7离散型随机变量与连续型随机变量 10 20 30 40 501.0概率概率xx1.0离散型随机变量连续型随机变量8总体与随机变量的关系n表示总体状况的数量特征,在总体中是参差不齐的,往往以一定的概率取不同的数值,显然对于这样的数值我们采用一般的变量是无法加以描述的。但是。可以采用一种特殊的变量来表示它们。这个特殊变量就是随机变量。因为,根据随机变量的
4、定义,随机变量以一定的概率取许多不同的值,而且概率p满足:0=p=1。n由于我们主要研究总体的数量特征,可以直接用随机变量来表示所研究的总体。9总体、随机变量、样本间的联系n总体就是一个随机变量,所谓样本就是n个(样本容量n)相互独立且与总体有相同分布的随机变量X1 , Xn 。n每一次具体抽样所得的数据,就是n元随机变量的一个观察值,记为(X1,Xn)。n通过总体的分布可以把总体和样本连接起来。10总体分布是总体和样本的连接点n所谓分布,它是从全局而言的。通俗地说,分布就是某个对象在什么地方,堆积了多少。n任何一个随机变量都有自己的分布,这个什么地方就是在数轴上取什么值,堆积多少就是在那里占
5、有的比例是多少或者概率有多大。n总体可以表示为随机变量,并具有自身的分布。n样本则是相互独立与总体具有相同分布的n元随机变量。因此,总体分布是总体和样本的连接点。从而,可以通过对样本特征的研究达到对总体进行研究的目的。因为它们具有相同的分布。11统计量n设(x1,x2,xn)为一组样本观察值,函数f( x1,x2,xn )若不含有未知参数,则称为统计量。n统计量一般是连续函数。由于样本是随机变量,因而它的函数也是随机变量,所以,统计量也是随机变量。n统计量一般用它来提取或压榨由样本带来的总体信息。就是统计量。样本方差1122ninixxs12样本与总体之间的关系样本是总体的一部分,是对总体随机
6、抽样后得到的集合。对观察者而言,总体是不了解的,了解的只是样本的具体情况。我们所要做的就是通过对这些具体样本的情况的研究,来推知整个总体的情况。Xn+1XnX1样本总体13统计学的逻辑结构(1)总体和样本 引入一个随机变量来描述总体(2)对总体的描述:随机变量的数字特征(3)对样本的描述:样本分布的数字特征(4)总体与样本的连接点:随机变量的分布(5)如何用样本的数字特征估计总体的数字特征及数据生成过程中的各种参数 a 估计量的优良性 b 估计方法 c 对估计量的检验假设检验 xVarxExx2方差数学期望,描述样本的离散程度样本方差,描述样本的一般水平样本平均数sX214a 估计量的优良性n
7、1、无偏性n2、有效性n3、均方误最小n4、一致性15b 估计方法 矩法最大似然法最小二乘法总体分布未知正态总体一般总体(大样)已知方差方差未知一般总体(大样)正态总体估计期望单个总体两个总体估计方差(常用小样本下,正态总体估计其它参数)点估计区间估计16c 对估计量的检验假设检验n1. 对总体分布特征的假设检验(1)一个正态总体的假设检验a 检验均值:已知方差和未知方差b 检验方差:未知均值(双尾和单尾)(2)两个正态总体的假设检验a 检验均值:未知方差但可假设其相等b 检验方差:未知均值(双尾和单尾)(3)总体分布的假设检验a 总体为离散型分布b 总体为连续型分布n2. 对各种系数、参数估
8、计值的假设检验17一、随机变量的分布18(一)离散型随机变量的分布n定义:如果随机变量只取有限个或可列多个可能值,而且以确定的概率取这些值,则称为离散型随机变量。n通常用分布列表示离散型随机变量:n的概率分布也可用一系列等式表示:nP( =xi)=pi (i=1,2,)称为的概率函数。n显然满足概率的定义:n离散型随机变量的分布就是指它的分布列或概率函数。1110iiippXx1x2.xi.pp1p2.pi.19离散型随机变量举例1n例1 一批产品的废品率为5%,从中任取一个进行检验,以随机变量来描述这一试验并写出的分布。 以X=0表示“产品为合格产品”,X=1表示“产品为废品”,那么分布列如
9、下:其概率函数p(X=0)=0.95, p(X=1)=0.05,或p(X=i)=(0.05)i(0.95)1-i ( i = 0, 1)X0(合格品)1(废品)P0.950.0520离散型随机变量举例2n用随机变量X描述掷一颗骰子的试验。分布的概率函数为:P(X=i)= 1/6(i=1,2,3,4,5,6)X123456P1/61/61/61/61/61/621(二)随机变量的分布函数n定义:若X是一个随机变量(可以是离散的,也可以是非离散的),对任何实数x,令F(x)=P(X=x),称F(x)为随机变量X的分布函数。F(x),即事件“X=x”的概率,是一个实函数。对任意实数x1x2,有P(x
10、1Xx2)=P(X=x2)- P(X=x1)=F(x2)- F(x1)x2x2F(x)F(x)Xx1x122分布函数F(x)的性质 xixxxxFxFxFFxFFxFxFxip足关系:分布函数与概率函数满。且在间断点上右连续至多有可列多个间断点)()(为不减函数)(,)对一切(4103210,1limlim23分布函数举例n例3 求例1中的分布函数n例4 求例2中的分布函数 111095. 000 xxxxXPxF 61656/5546/4436/3326/2216/110 xxxxxxxxXPxF01F(x)x xxiipxF24(三)连续型随机变量的分布n定义:对于任何实数x,如果随机变量
11、X的分布函数 F(x)可以写成n概率分布密度函数的性质: 。常写成概率分布密度函数,也的为为连续型随机变量,称,则称其中xXXxXxdttxFx0 。有的连续点上,并且在显然)()(xxFxdxxbXaPdxxxba120125连续型随机变量分布函数举例 bxbxaabaxaxxFdttxFababdxdxxxFbaXbxaxXx1011,05又因为解。上的均匀分布。试求服从区间则称其它有密度函数若例a x ba x bF(x)(x)26二、二元随机变量nn元随机变量的定义:每次试验同时处理n个随机变量(X1,X2,Xn),它们的取值随试验的进行而变化。如果对任何一组实数(x1,x2,xn),
12、事件“X1x1,X2x2, Xnxn”有着确定的概率,则称n个随机变量(X1,X2,Xn)总体为一个n元随机变量。nn元随机变量分布函数的定义: n元函数F( x1,x2,xn )= P(X1x1,X2x2, Xnxn) (x1,x2,xn)属Rn,为n元随机变量分布函数。 离散二元随机变量的定义:如果二元随机变量(X,Y)所有可能取值为有限或可列多个,并且以确定的概率取各个不同数值,则称(X,Y)为二元随机变量。27(X,Y)的联合分布表和联合分布函数n(X,Y)为离散型的二元随机变量,通常用联合分布函数与联合分布表表示。(X,Y)的概率分布表X Yy1y2yjX的边际分布x1p11p12p
13、1jp1.x2p21p22p2jp2.xipi1pi2pijpi.Y的边际分布p.1p.2p.j1称 p(X=xi,Y=yj)=pij (i,j=1,2,.)为(X,Y)的概率分布上式也称为(X,Y)的联合分布。28离散二元分布函数的示例n例6 同一品种的5个产品中,有2个正品,3个次品,每次从中抽取一个进行质量检查,不放回的抽取,连续两次。令“Xi=0”表示第i次抽取到正品,而“Xi=1”表示第i次抽取到次品,写出(X1,X2)的分布。解 p(X1=0,X2=0)= p(X1=0)P(X2=0)=(2/5)(1/4)=1/10 p(X1=0,X2=1)=p(X1=0)P(X2=1)=(2/5
14、)(3/4)=3/10 p(X1=1,X2=0)=p(X1=1)P(X2=0)=(3/5)(2/4)=3/10 p(X1=1,X2=1)=p(X1=1)P(X2=1)=(3/5)(2/4)=3/10(X1,X2)的概率分布表X1 X201X1边际分布01/103/102/513/103/103/5X2边际分布2/53/5129连续二元随机变量的定义 badcxydxdyyxdYcbXapdcbadsdttsyxyxyxYXyxYXdsdttsyxFyxyxFYXyx,1,20,1,),(,),(,有显然,对于任意实数)(,)对于一切实数(的性质:的联合密度函数。与为称。是二元连续型随机变量则称
15、都有:,对于任意实数的分布函数,使得二元变量如果存在一个非负函数30三、独立性n(一)事件的独立性n(二)随机变量的独立性31(一)事件的独立性定义1.12 事件的独立性的定义 如果事件A发生的可能性不受事件B发生与否的的影响,即P(AB)=P(A),则称事件A对于事件B独立。 显然,若事件A对于事件B独立,事件B对于事件A也一定独立,我们称事件A与事件B相互独立。 A与B独立的充分必要条件是: P(AB)=P(A)P(B)32(二)随机变量的独立性n定义1.13 边际分布的定义 离散型二元随机变量(X,Y)中,分量X(或Y)的概率分布称为(X,Y)的关于X(或Y)的边际分布,边际分布又称边缘
16、分布。n定义1.14 随机变量相互独立的定义 对于任何实数x,y,如果二元随机变量(X,Y)的联合分布函数F(x,y)等于X和Y的边际分布的乘积,即 F(x,y) = FX(x) . FY(y) 则称X与Y相互独立。33四、随机变量函数的概念和分布n定义1.15 随机变量函数的定义 设f(x)是定义在随机变量X的一切可能取值集合上的函数。如果对于X的每一个可能值x,都有另一个随机变量Y的取值y=f(x)与之相对应,则称Y为X的函数,记作Y=f(X)。n 我们常常遇到一些随机变量,它们的分布往往难于直接得到(例如滚珠体积的测量值等),但与它们有关系的另一个随机变量的分布却是容易知道的(如滚珠直径
17、的测量值)。因此,就要研究两个随机变量之间的关系,然后通过它们之间的关系,由已知随机变量的分布求出与之有关的其它随机变量的分布。其间的关系通常用函数关系表示。34第二节 对总体的描述随机变量的数字特征一、数学期望二、方差三、数学期望与方差的图示35一、数学期望n研究数字特征的必要性n两个最重要的数字特征(1)数学期望(2)方差36研究数字特征的必要性n总体就是一个随机变量。对总体的描述就是对随机变量的描述。随机变量的分布就是对随机变量最完整的描述。但是,(1)求出总体的分布往往不是一件容易的事情;(2)而且,在很多情况下,我们并不需要全面考察随机变量的变化情 况,只需要了解总体的一些综合指标。
18、一般说来,常常需要了解总体的一般水平和它的离散程度;(3)如果了解总体的一般水平和离散程度,就已经对总体有了粗略的了解了;(4)在很多情况下,了解这两个数字特征还是深入求出总体分布的基础和关键。37数学期望的定义n定义2.1 离散型随机变量数学期望的定义 假定有一个离散型随机变量X有n个不同的可能取值x1,x2,xn,而p1,p2,pn是X取这些值相应的概率,则这个随机变量X的数学期望定义如下: 数学期望描述的是随机变量(总体)的一般水平。n定义2.2 连续型随机变量数学期望的定义 的数学期望。称为绝对收敛,则,若积分有分布密度函数若连续型随机变量XdxxxxEdxxxxX 平均数。的所有可能
19、取值的加权是随机变量实际上,XXExEniiinnxpxpxpxp1221138n数学期望是最容易发生的,因而是可以期待的。它反映数据集中的趋势。数量概率10.10.120.10.230.41.240.20.850.213.3父亲钓鱼的试验数学期望39数学期望的性质(1)如果a、b为常数,则 E(aX+b)=aE(X)+b(2)如果X、Y为两个随机变量,则 E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分别为X的两个函数,则 Eg(X)+f(X)=Eg(X)+Ef(X)(4)如果X、Y是两个独立的随机变量,则 E(X.Y)=E(X).E(Y) 40求离散型随机变量数学期望举例n例
20、1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下: 试比较两射手的射击技术水平,并计算如果二人各发一弹,他们得分和的估计值。解 EX=1 0.4+2 0.1+3 0.5=2.1 EY=1 0.1+2 0.6+3 0.3=2.2 E(X+Y)=2.1+2.2=4.3 EXEY 乙射手射击水平比较高 二人各发一弹,得分总和最可能在4.3分左右(即4分或5分)X123P0.40.10.5Y123P0.10.60.341二、方差n定义2.3 离均差的定义 如果随机变量X的数学期望E(X)存在,称 X-E(X) 为随机变量X的离均差。显然,随机变量离均差的数学期望是0,即 E X-E(
21、X) = 0n定义2.4 连续型随机变量的方差n定义2.5 随机变量离均差平方的数学期望,叫随机变量的方差,记作Var(x),或D(x)。方差的算术平方根叫标准差。 dxxXVXXxEx2的方差以下式给出:为连续型随机变量,则若 xEExVarxVxxExx22242方差的意义n(1)离均差和方差都是用来描述离散程度的,即描述X对于它的期望的偏离程度,这种偏差越大,表明变量的取值越分散。n(2)一般情况下,我们采用方差来描述离散程度。因为离均差的和为0,无法体现随机变量的总离散程度。事实上正偏差大亦或负偏差大,同样是离散程度大。方差中由于有平方,从而消除了正负号的影响,并易于加总,也易于强调大
22、的偏离程度的突出作用。43方差的性质(1)Var(c )=0(2)Var(c+x)=Var(x )(3)Var(cx)=c2Var(x)(4)x,y为相互独立的随机变量,则 Var(x+y)=Var(x )+Var(y )=Var(x-y)(5)Var(a+bx)=b2Var(x)(6)a,b为常数,x,y为两个相互独立的随机变量, 则Var(ax+by)=a2Var(x)+b2Var(y)(7)Var(x)=E(x2)-(E(x)244例2 计算本节例1中甲射手的方差n例1 甲、乙两射手在一次射击中的得分(分别用X、Y表示)的分布率如下: E(X)=2.1 Var(X)=(- 1.1) 2
23、0.4+(-0.1)2 0.1 +0.92 0.5 = 0.89X123P0.40.10.5Y123P0.10.60.345三、数学期望与方差的图示n数学期望描述随机变量的集中程度,方差描述随机变量的分散程度。n1方差同、期望变大 2期望同、方差变小5105546第三节 对样本的描述样本分布的数字特征一、样本分布函数二、样本平均数三、样本方差47一、样本分布函数 数。,称它们为样本分布函本容量的个数除以样个观察值中不超过等于样本的这里,令排列为按大小的一组观察值,把它们为总体设nxnxxxnkxnxxFxxxxxxFxxxxxxnnkknnn*1*2*1*1*2*121110,48样本分布函数
24、举例随机观察总体X10个数据如下及其排序X*X3.22.5-42.5023.22.542X*-40222.52.52.53.23.24求样本分布函数。 4142 . 310/92 . 3310/835 . 210/75 . 2210/42010/20410/14010 xxxxxxxxxF49二、样本平均数n总体的数字特征是一个固定不变的数,称为参数;样本的数字特征是随抽样而变化的数,是一个随机变量,称为统计量。n定义3.1样本平均数的定义n样本平均数用来描述样本的平均水平(一般Common)水平。为样本平均数。,称对于样本niinxxxxnx1211,50三、样本方差和标准差n定义3.2 样
25、本方差和标准差的定义xxsxxxxxxxxsxxxnnniinsinniiniinininin2122212121212221111111,。来描述样本离散程度的样本方差和标准差是用差。分别为样本方差和标准以及,称对于样本51第四节 随机变量的分布总体和样本的连接点n一、几种重要的分布n二、各种分布之间的联系n三、分布是总体和样本之间的连接点52一、几种重要的分布n如果一个随机变量的分布已经确定,那么这个随机变量的一切性质对于我们便都是已知的。因为随机变量的分布是对随机变量最完整的描述。n例如X是广西十万大山中树木的高度, 它的分布函数为F(x)=P(X 时,MSE()=0,亦即Var()=0
26、和Bias()2 =0,也就是随着样本加大,的方差变小;的偏差接近于0,这就是一致性描述的情况。n事实上一致性和MSE()=0(当n= )这两条标准在计量经济学中往往是通用的。85第六节 通过样本,估计总体(二)估计方法一、点估计(1)矩法(2)最大似然法(3)最小二乘法二、区间估计(一)对总体期望值的估计(二)对总体方差的估计(三)关于区间估计的几点说明86一、点估计n所谓点估计就是给出被估计参数的一个特定的估计值。n常用的点估计方法有三种:矩法、最大似然法、最小二乘法。n这三种方法分别建立在不同的原则上。n对同一样本根据三种方法估计同一参数,所获得的估计结果可能互不相同。n然而由于各种建立
27、原则的合理性,所以三种方法在研究中都经常使用。87(1)矩法n矩法是求估计量最古老的方法。具体作法是:一样本矩作为相应总体矩的估计量;以样本矩的函数作为相应的总体矩同样函数的估计量。n这种方法最常见的应用是用样本平均数估计总体数学期望。n矩法比较直观,求估计量时有时也比较直接,但它求出的估计量往往不够理想。88矩法点估计的例题n例1某灯泡厂某天生产了一大批灯泡,从中抽取了10个进行寿命试验,获得数据如下(单位:小时),问该天生产的灯泡的平均寿命是多少?抽样序号12345678910寿命(小时) 1050 1100 1080 1120 1200 1250 1040 1130 1300 1200计
28、算得样本算术平均数=1147,作为总体数学期望的估计值xxxxdxdxxdxxxxxxxxn2,22021111,001,22001在矩法下又是多少?问在矩法下其它取自均匀分布若样本例89(2)最大似然法(Maximum Likelihood Estimation)1、一个重要的事实2、最大似然法的概念3、似然法函数4、最大似然法的定义5、最大似然法的示例90n不同的总体会产生不同的样本,对于某一特定的样本,在不了解产生它的母体究竟为何物的观察者眼中,它来自一些母体的可能性要比来自另一些母体的可能性大,即一些母体更容易产生出我们所观察到的样本。n举例说,假定我们抽取到(x1,x2,x8)我们知
29、道它来自正态总体,且总体的方差是了解的,但是总体的均值未知。如下图所示。x1 x2 x3 x4 x5 x6 x7 x8 分布B分布A概率x假定样本不是来自B就是来自A。如果样本来自B,观察到它的可能性非常小;真正的母体若是A,得到样本的可能性很大。显然我们宁愿承认样本来自A。是样本“替”我们“选择”了A。912、最大似然法的概念n上述事实诱导我们宁愿作出这样的抉择:将样本最容易来自的总体当作产生样本的总体。n现在要根据从总体中抽取得到的样本(x1,xn)对总体中的未知数进行估计。最大似然法是选择这样的估计量作为的估计值,以便使观察结果(x1,xn)出现的可能性(概率)最大。n对于离散型变量,就
30、是要选择使p(x1)p(x2)p(xn)最大。(连乘表示一次独立地抽取各个样本观察值)n对于连续型变量,就是要选择使(x1)(x2).(xn)最大。注意(xi)是随机变量在xi附近取值的概率,相当于离散型的p(xi)。923、似然法函数niiniinniinnxxxxxxxxxxxxxxxxPLPPLLLxxF1212112121;,;,;,;则似然函数的概率函数为离散型随机变量,它设为样本的似然函数。的函数,称成参数可以看是常数,所以由于每一取定的样本值:的联合分布分布密度是样本的独立性,则是未知参数。由于样本,其中度函数是,分布密的分布函数是为连续型随机变量,它设934、最大似然法的定义的
31、最大似然估计。是则称处达到最大值,在如果定义 ;,1 . 621xxxnL945、最大似然法的估计方法n为了取得的最大似然估计,必须使似然函数L达到最大值,并且把此时的作为的估计量。由于对数函数是单增的,L达到最大亦即LnL达到最大。n这样使LnL达到最大来估计为计算带来了许多方便。n根据微分中的拉格朗日定理,对未知参数求条件极值,令LnL对 的一阶导数等于0,即dLnL/d =0 =得到似然方程,我们所求的就是似然方程中的解。955、最大似然法示例之一的最大似然估计。是得解似然方程似然函数解的最大似然估计。的一组观察值,求是其它的分布为:已知随机变量例1011ln1lnln11;,0001;
32、31121211121211xxnnndLdnLxxLxxniiniiniiniinninnixxxxeexxxxxxexniiii96(3)最小二乘法(Least Square Estimation Method) 最小二乘法是计量经济学中应用最广泛的一种估计方法。97二、区间估计(一)对总体期望值的估计1、已知方差,对数学期望E进行区间估计(1)方差已知,估计总体数学期望(2)正态总体(3)一般总体大样本下数学期望的区间估计2、方差未知,对数学期望E进行区间估计(二)对总体方差的估计(三)关于区间估计的几点说明98区间估计的概念n所谓区间估计就是以一定的可靠性给出被估计参数的一个可能的取值
33、范围。n用点估计估计参数,即使是无偏有效的估计量,也会由于样本的随机性,使得由样本计算出的估计值并不恰恰是真值。而且即使等于真值,由于真值未知,我们也不能肯定这种相等。那么,究竟相差多少?于是问题等价为:在给定可靠程度下,指出被估计参数所在的可能值的范围,就是参数的区间估计问题。n具体作法是找出两个统计量1(x1,xn)与2 (x1,xn),使 P(1 2 )=1- (1 , 2)称为置信区间, 1-称为置信系数(置信水平), 称为显著性水平,一般等于5%或1%。99对区间估计的形象比喻n我们经常说某甲的成绩“大概80分左右”,可以看成一个区间估计问题。(某甲的成绩为被估计的参数) P(1 2
34、 )=大概的准确程度( 1-) 如:P(75 =30时,就可以把样本平均数近似地看作服从正态分布N(,2/n)。n所以,对于大样本仍可以按正态总体进行均值的区间估计。1072、方差未知,对数学期望E进行区间估计(1)大样本下 根据中心极限定理,V 可以用s2代替,所以仍按已知方差正态分布的方法进行的置信区间估计。(2)小样本下11/,1,15. 4) 1(/,221tttttxxnsxnsxpnsxpTptnntnsxTNn的置信区间为:因此,即使分布的临界值的查具有对给定的)(由定理未知,令由于来自正态总体设小样本108例8 新生儿体重的置信区间n假设新生儿(男)的体重服从正态分布。随机抽取
35、12名新生儿,测得体重如下表,试以95%的置信度估计新生儿(男)的平均体重。序 号123456789101112新生儿体重 3100 2520 3000 3000 3600 3160 3560 3320 2880 2600 3400 254033002820201. 2123 .3753057201. 2123 .375305795%3 .37530571113057(201. 21205. 01212)112(即的置信区间是置信度为再计算表的图有错)ixtisxn109(二)对总体方差的估计(只介绍小样本下的)1111,21114. 4,2222222221anbnPbZaPbbPaZPba
36、nnZNsssxxn的置信区间确定为:由此,使得,一般取和分布表可以确定查,定的分布。对于给的服从具有自由度可知,由定理,来自正态总体设样本110总体方差区间估计的例题例9 在本节例8中,请对新生儿体重的方差进 行区间估计( =0.05)。=0.05 n-1=11 ,查X2分布临界值表,得a=3.82 b=21.9 ,a、b满足:p(Z=a)=0.975 p(Z=b)=0.025有上例知,s2=140900 ,所以(n-1)s2=1549000,则 2的置信区间为: 1549000/21.9 2 1549000/3.82即 70700 2405000 111(三)关于区间估计的几点说明(1)区
37、间估计在方法上是定理4.134.17的应用。(2)在进行区间估计时,应针对不同的情况,采用不同的方法。例如分清分布的形式是已知或是未知;是大样本或是小样本;小样本(估计总体数学期望时)又分清是已知方差或是未知方差等。充分利用分布信息可以得到较精确的估计。(3)一般地,越大置信度越低,置信区间越小; 反之,则反。112第七节 通过样本,估计总体(三)假设检验一、假设检验的概念二、两类错误三、假设检验与区间估计间的关系:置信区间法四、假设检验的应用(一)正态总体的假设检验(二)两个正态总体的假设检验(三)总体分布的假设检验五、“小概率原理”在假设检验中的应用113一、假设检验的概念n定义:称对任何
38、一个随机变量未知分布的假设为统计假设,简称假设。n一个仅涉及到随机变量分布中未知参数的假设称为参数假设。一个仅涉及到随机变量分布的形式而不涉及到未知参数的假设称为非参数假设。n提出一个统计假设的关键是将一个实际的研究问题用数学语言转换为统计假设。114例1.检验一个硬币是否均匀n抛掷一个硬币100次,“正面”出现60次,问此硬币是否均匀?n分析: 若用X描述抛掷硬币的试验,“X=1”和“X=0”分别表示“出现正面”和“出现反面”。上述问题就是检验X是否可以被认为服从p=0.5的0-1分布。 问题是分布形式已知,检验参数p=0.5的假设检验。记作,H0:p=0.5 HA:p 0.5115零假设与
39、备择假设n在统计假设H0:p=0.5 HA:p 0.5中, H0称为零假设或原假设,是我们进行统计假设检验欲确定其是否成立的假设体现我们进行假设检验的目的,而且往往是希望否定这个假设,否定其成立所冒的风险为。nHA称为备择假设,统计假设检验是二择一的判断,当不成立时,不得不接受它。116例2.检验1999年新生女婴体重是否等于某个既定值n从1999年出生的女婴中随机地抽取20名,测得平均体重=3160克,标准差=300克,根据已有的统计资料新生女婴的体重=3140克,问现在与过去新生女婴的体重是否有变化?分析:把1999年出生的女婴视为一个总体,用X描述,问题就是判断: H0:EX=3140
40、HA:EX 3140 因为通常可以假定经过量测得到的资料是服从正态分布的,无须检验总体的分布形式,显然这是一个关于参数的假设检验问题。117二、两类错误n(1)两类错误的概念n(2)显著性水平118(1)两类错误的概念n由于我们作出判断的依据是一组样本,结论却是对于总体的,即由局部全面,由特殊一般,由个别整体,因而假设检验的结果不可能绝对正确,它有可能是错误的。而且出现错误可能性的大小,也是以统计规律(小概率原理)为依据的。所可能犯的错误有两类:第一类弃真,原假设符合实际情况,而检验结果把它否定了。设犯这类错误的概率为,那么 =p(否定H0/H0实际上为真)。 称为显著性水平第二类纳伪,原假设
41、不符合实际情况,而检验结果却把它肯定下来。设犯这类错误的概率为,那么 =p(接受H0/H0实际上为不正确)。1- 称为检验能力。119(2)显著性水平n显著水平指的是犯“第一类错误”的可能性,即“冒险率”冒H0是真而我们抛弃了H0所犯错误的概率反之,而不接受H0,乃是因为客观事实与H0假设存在差异,且这种差异的程度已经太大了,在给定的小概率下,零假设几乎是不可能发生的,从而认为零假设H0是错的,必须抛弃它。所以,我们把犯弃真错误的概率也称为差异达到和超过了显著(太大)的水平,以至于达到显著水平后,我们不能接受H0,而不得不抛弃H0。同时,即使抛弃零假设H0,这时也只需冒的风险,抛弃H0的可靠性
42、则为1- 。n如果假设事关重大,譬如人命关载人的宇宙飞船升空或药品试验,则必须提高差异显著水平即减小,使我们不能轻易地拒绝H0。否则,则可以降低显著水平。120三、假设检验与区间估计间的关系:置信区间法n(一)问题的提出n(二)假设检验的置信区间法n(三)假设检验与区间估计的联系与区别121(一)问题的提出曾经提到“某甲成绩大概是80 分左右”可以看成一个区间估计问题。 “大概80分左右” p(12)=大概的准确程度 如: p(7585)=95% (75,85)是某甲成绩的估计区间,某甲成绩落在此区间的概率在95%以上。类似地,对这个问题,也可举出一个假设检验的问题 在允许你犯5%以下的错误,
43、即以95%的正确性来回答:“某甲的成绩是80,对吗?” 假设 检验同样的问题又是一个假设检验的问题。122(二)假设检验的置信区间法的定义n对比区间估计和假设检验两种情况,我们发现区间估计实际上给出了一种进行假设检验的方法。n比如,当涉及“某甲成绩为80分”(=5%)后,首先对问题进行区间估计,得到成绩在7585之间的概率为95%。若原假设H0落在(75,85)内,显然应当接受H0,否则,则拒绝H0。n这种利用区间估计法来进行假设检验的方法称为区间估计法。123通过求置信区间进行假设检验的例子n例3 根据长期经验和资料分析,某砖厂生产的砖的“抗断强度”服从正态分布,方差=1.21,今从该厂生产
44、的砖中随机地抽取6块砖,测得强度如下(单位千克/cm2):检验这批砖的平均抗断强度为32.50千克/cm2是否成立( =0.05)?解:H0:=32.50 HA: 32.50 首先求的置信区间: 序 号123456抗断强度 32.5629.6631.6430.0031.3731.0350.32:50.3201.3225.3096. 161 . 113.3196. 161 . 113.3196. 105. 01 . 121. 1613.311101Hxnnxnxnxpnii拒绝超过了置信区间,假设的即124临界值法,则不下结论。;接受就拒绝若进行比较。与用计算出来的价于是否落入置信区间就等因此,
45、检验令信区间:设检验,首先要计算置应用区间估计法进行假UUUUUpnxUnxpnxpnxnpnxnxpHH00;,1/1/1/11125采用临界值法重作例31、提出零假设 H0: = 32.5 HA: 32.52、根据抽样所得样本计算检验统计量3、确定显著水平=0.05(或0.01)和相应的临界值=1.964、将计算的U=3.05与=1.96进行比较5、下结论:因为U=3.05 =1.96,故 P =0.05小概率事件发生 ,则拒绝H0。不认为抗断强度为32.5。 6、依据统计结论,作出专业(经济学)上的解释05. 36/1 . 15 .3213.31/0nxU126假设检验的步骤1、提出零假
46、设 H0: = 0 HA: 02、根据抽样所得样本计算检验统计量3、确定显著水平=0.05(或0.01)和相应的临界值4、将计算的U与进行比较。如果H0真的成立,必有 0。5、下结论:若U , P ,拒绝H0;若U ,接受H0;若U= ,不能对H0下结论6、依据统计结论,作出专业(经济学)上的解释nxU/0127四、假设检验的应用n(一)正态总体的假设检验n(二)两个正态总体的假设检验n(三)总体分布的假设检验128(一)正态总体的假设检验n设总体N(,2),对于其参数,2的假设检验,讨论4种情况:(1)已知方差2 ,检验假设H0: = 0(2)未知方差2 ,检验假设H0: = 0(3)未知期
47、望 ,检验假设H0: 2= 20(4)未知期望 ,检验假设 H0: 2临界值”的事件)居然发生了。出错了,那么,错在那里呢?n因为,在整个假设检验过程中,抽样是正确的、统计量的选择是正确的、根据显著水平确定的临界值是正确的、统计量的计算是正确的,统计量与临界值的比较也是正确的。因而,只能是提出的假设H0发生了错误,所以必须拒绝H0。134本章的几点注意点:(1)统计学研究的核心问题是如何从样本来推断总体的性质。作为观察者,我们对总体的情况往往是不了解的,我们只能对总体进行随机抽样,获得一组样本,通过对一组样本的研究,进而估计总体的各种属性。所以,对总体的研究都是基于样本的。(2)为了描述总体引入了随机变量,只有随机变量这类特殊的变量,才能用以对总体进行全面描述。(3)总体就是一个随机变量。(4)我们通常遵循统计量三个优良性来构造各种统计量,而且利用假设检验来具体的评价关于总体参数的假设是否合理。(5)区间估计和假设检验是一个问题的两个方面。个人观点供参考,欢迎讨论!