1、经济计量学经济计量学概率论与统计学基础概率论与统计学基础(chp2chp5)2-2主要内容主要内容n概率论基础知识概率论基础知识n数理统计基础知识数理统计基础知识概率论部分概率论部分2-4概率论基础知识主要内容概率论基础知识主要内容n概率概率n随机变量随机变量n概率密度函数概率密度函数n多维随机变量多维随机变量n随机变量的数字特征随机变量的数字特征n一些重要的概率分布一些重要的概率分布2-5一、概率一、概率n随机试验随机试验可以在相同条件下重复进行可以在相同条件下重复进行每次试验的可能结果不止一个,但事先能明确每次试验的可能结果不止一个,但事先能明确所有的可能结果所有的可能结果进行一次试验之前
2、不能确定会出现哪一个结果进行一次试验之前不能确定会出现哪一个结果n实例实例一枚硬币抛掷两次一枚硬币抛掷两次在校园里询问任意一个学生的年龄在校园里询问任意一个学生的年龄2-6n样本空间样本空间(sampling space)/总体总体(population)某一个随机试验的所有可能结果组成的集合,记某一个随机试验的所有可能结果组成的集合,记为为Sn样本点样本点(sampling point)样本空间里的某一元素,即随机试验的某一可能样本空间里的某一元素,即随机试验的某一可能结果结果n实例实例一枚硬币抛掷两次,出现正面记为一枚硬币抛掷两次,出现正面记为H,出现反面,出现反面记为记为Tn样本空间:样
3、本空间:HH, HT, TH, TTn样本点:样本点: HH, HT, TH, TT2-7n事件事件(event)某一随机试验的样本空间的一个子集某一随机试验的样本空间的一个子集n实例:一枚硬币抛掷两次实例:一枚硬币抛掷两次事件事件A:出现两个正面:出现两个正面事件事件B:出现一个正面和一个反面:出现一个正面和一个反面事件事件C:出现两个反面:出现两个反面2-8n频率频率(frequency)在相同条件下,某随机试验进行了在相同条件下,某随机试验进行了n次,其中次,其中事件事件A发生了发生了m次,则比值次,则比值m/n称为事件称为事件A发生发生的频率,记的频率,记fn(A)n实例:抛掷一枚硬币
4、,事件实例:抛掷一枚硬币,事件A为出现正面为出现正面当当n逐渐增大时,频率趋向于某一常数,称为逐渐增大时,频率趋向于某一常数,称为频率稳定性频率稳定性n550500204840401200024000fn(A)0.60.540.4840.51810.50690.50160.50052-9n概率概率(probability)S是某一随机试验的样本空间,对于其中的任意是某一随机试验的样本空间,对于其中的任意一个事件一个事件A赋予一个实数赋予一个实数P(A),如果,如果P(A)满足下满足下列三个条件,则称列三个条件,则称P(A)为事件为事件A的概率。的概率。1. 0 P(A) 12. P(S)=13
5、. 如果如果A1,A2,是两两不相容的事件,那么是两两不相容的事件,那么 P(A1+A2+)=P(A1)+P(A2)+n当当n趋近于无穷大时,频率趋近于无穷大时,频率fn(A)无限接近于概无限接近于概率率P(A),从而用概率来度量事件,从而用概率来度量事件A在一次试验在一次试验中发生的可能性中发生的可能性2-10n条件概率条件概率(conditional probability)设设A、B是两个事件,且是两个事件,且P(A)0,称下式为事件,称下式为事件A发生的发生的条件下事件条件下事件B发生的条件概率:发生的条件概率:n实例实例一枚硬币抛掷两次,出现正面记为一枚硬币抛掷两次,出现正面记为H,
6、出现反面,出现反面记为记为T。样本空间:。样本空间:HH, HT, TH, TT。事件事件A为为“至少有一次至少有一次H”,事件,事件B为为“两次都是两次都是同一面同一面”。则事件。则事件A的概率为的概率为3/4,事件,事件A和和B同同时发生的概率为时发生的概率为1/4,在,在A发生的条件下发生的条件下B发生的发生的概率为概率为1/3)()()|(APABPABP 2-11二、随机变量二、随机变量n随机变量随机变量(stochastic/random variable)一个变量若它的值是由随机试验决定的,称其为随机一个变量若它的值是由随机试验决定的,称其为随机变量。随机变量通常用大写字母变量。
7、随机变量通常用大写字母X、Y、Z表示,其数表示,其数值则用小写字母值则用小写字母x、y、z表示表示n离散型随机变量离散型随机变量(discrete random variable)可能取到的值是有限个的随机变量可能取到的值是有限个的随机变量n例:离散型随机变量:扔一次骰子出现的点数;未出生婴儿的例:离散型随机变量:扔一次骰子出现的点数;未出生婴儿的性别性别n连续型随机变量连续型随机变量(continuous random variable)可能取到的值是无限个的随机变量可能取到的值是无限个的随机变量n例:人的身高;百米跑速度例:人的身高;百米跑速度2-12三、概率密度函数三、概率密度函数(pr
8、obability density function,PDF/probability distribution)n离散型变量的概率函数离散型变量的概率函数/概率分布概率分布n实例实例X:投掷两颗骰子出现的点数之和,:投掷两颗骰子出现的点数之和,X的的PDF为:为:n,2 ,1i),xX(P)X(fi X23456789101112f(X)1/362/363/364/365/366/365/364/363/362/361/362-13n连续型变量的累积分布函数连续型变量的累积分布函数(cumulative distribution function,CDF)n实例实例枪靶的半径为枪靶的半径为2米
9、,若每枪都能击中枪靶,且米,若每枪都能击中枪靶,且击中靶上任一同心圆内的点的概率与该圆的面击中靶上任一同心圆内的点的概率与该圆的面积成正比,则弹着点与靶心的距离积成正比,则弹着点与靶心的距离X是一个连是一个连续型随机变量,其续型随机变量,其CDF为:为:ba),a(F)b(F)bXa(P.b)a(F1)aX(P.a)xX(P)x(F 2-14概率密度函数2, 120 , 4/0, 0)(2xxxxxFF(x)x212-15概率密度函数连续型变量的概率密度函数连续型变量的概率密度函数(PDF)实例在上例中,PDF为:ba,dx)x(f)a(F)b(F)bXa(P.b1dx)x(f.a)t(f)x
10、X(P)x(Fdx)x(fbax 有有以以下下重重要要性性质质:概概率率密密度度函函数数 其其它它,02x0 ,2/x)x(fxf(x)122-16PDF与与CDF关系关系xxxXxPxfx)(lim)(0 概率密度函数概率密度函数(PDF)是是累积分布函数累积分布函数(CDF)的的导数导数,即即xdttfxFxFxf)()(),()( 对于这一点进一步剖析对于这一点进一步剖析,可以得到:可以得到: 这表明,这表明,f(x)不是不是X取值取值x的概率,而是它在的概率,而是它在x点点概率分布的密集程度。但是概率分布的密集程度。但是f(x)的大小能反映的大小能反映X在在x附近取值的概率大小。因此,
11、对于连续型随机变量,附近取值的概率大小。因此,对于连续型随机变量,用密度函数描述它的分布比分布函数直观。用密度函数描述它的分布比分布函数直观。2-17概率密度函数概率密度函数n连续型变量的概率密度函数连续型变量的概率密度函数(PDF)f(x)xab badxxfbXaP)()(2-18多维随机变量多维随机变量n多维随机变量多维随机变量多个变量的取值由同一个随机试验决定,称这多个变量的取值由同一个随机试验决定,称这些变量为多维随机变量。些变量为多维随机变量。以下我们考虑最简单的二维随机变量,用以下我们考虑最简单的二维随机变量,用(X,Y)表示,其数值用表示,其数值用(x,y)表示表示n实例实例离
12、散型二维随机变量:每一位学生的性别和民离散型二维随机变量:每一位学生的性别和民族族连续型二维随机变量:每一位学生的身高和体连续型二维随机变量:每一位学生的身高和体重重2-19多维随机变量离散型变量的联合概率密度函数离散型变量的联合概率密度函数(joint PDF)实例譬如:既是男生又是满族的概率为譬如:既是男生又是满族的概率为0.08,既是女生又是回族的,既是女生又是回族的概率为概率为0),(),(yYxXPyxf 民族民族汉族汉族满族满族回族回族蒙古族蒙古族性别性别男男0.270.080.160女女0.350.1000.042-20多维随机变量离散型变量的离散型变量的边缘概率密度函数边缘概率
13、密度函数 (marginal PDF)实例实例)(),()()(),()(yYPyxfyfxXPyxfxfxy X (民族民族)边缘概边缘概率率汉族汉族满族满族回族回族蒙古族蒙古族Y(性别性别)男男0.270.080.1600.51女女0.350.1000.040.49边缘概率边缘概率0.620.180.160.042-21离散型变量的条件概率密度函数离散型变量的条件概率密度函数 (conditional PDF)n表示在表示在Y=y的条件下的条件下X=x的概率的概率譬如:譬如:f (满族满族, 女生女生)=0.10, f (女生女生)=0.49, f (满族满族|女生女生) =0.10/0.
14、49 =0.20 f (汉族汉族, 男生男生)=0.27, f (男生男生)=0.51, f (汉族汉族|男生男生) =0.27/0.51=0.53)(),()(),()|()|(yfyxfyYPyYxXPyYxXPyxf X (民族民族)边缘概边缘概率率汉族汉族满族满族回族回族蒙古族蒙古族Y(性别性别)男男0.270.080.1600.51女女0.350.1000.040.49边缘概率边缘概率0.620.180.160.042-22多维随机变量统计独立性统计独立性 (statistically independence)n如果两个随机变量的联合如果两个随机变量的联合PDF等于它们边缘等于它们
15、边缘PDF的乘的乘积,则称这两个变量是相互独立的(积,则称这两个变量是相互独立的(independent)。)。两个变量独立意味着其中一个变量的结果不会影响另两个变量独立意味着其中一个变量的结果不会影响另一个。一个。譬如譬如:f (X=H,Y=H)=f (X=H)*f(Y=H)=1/2*1/2=1/4 )()(),()()(),(yYPxXPyYxXPyfxfyxf 即即:实例:抛硬币实例:抛硬币X (第一次第一次)正面正面(H)反面反面(T)Y(第二次第二次)正面正面(H)1/41/4反面反面(T)1/41/42-23多维随机变量多维随机变量连续型变量的联合概率密度函数连续型变量的联合概率密
16、度函数 (joint PDF)连续型变量的边缘概率密度函数连续型变量的边缘概率密度函数 (marginal PDF)统计独立性统计独立性 (statistically independence) dcbayxdxdyyxfdYcbXaPyYxXPyxFdxdyyxf),(),(),(),(),(易易知知:)()(),()()(),(yYPyfdxyxfxXPxfdyyxf )()(),(yfxfyxf 2-24四、随机变量的数字特征四、随机变量的数字特征n以上讨论了随机变量的概率密度函数以上讨论了随机变量的概率密度函数PDF和累积分布函数和累积分布函数CDF,但在处理实际问题,但在处理实际问题
17、时,往往不需要求出这些函数,而是只需时,往往不需要求出这些函数,而是只需要了解变量的某些特征值。要了解变量的某些特征值。n这些特征值包括三类:这些特征值包括三类:度量变量分布的度量变量分布的集中趋势集中趋势(central tendency):数学期望或均值;中位数;众数):数学期望或均值;中位数;众数度量变量分布的度量变量分布的离散性离散性(dispersion):方差;):方差;标准差标准差度量两个变量的度量两个变量的相关性相关性(correlation):协方):协方差;相关系数差;相关系数2-25数学期望数学期望(expectation)或)或均值均值(mean)n离散型变量的期望:离
18、散型变量的期望:n实例:扔两个骰子的点数之和实例:扔两个骰子的点数之和)()(),()()(1iniixfxXExXPxfPDFXxf则,即的为若x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/367)36/1(12)36/2(3)36/1(2)( XE2-26随机变量的数字特征随机变量的数字特征n连续型变量的期望:连续型变量的期望:n实例实例: dxxfxXExXPdxxfPDFXxfx)()()()()(则则,即即的的为为若若49dxx91x)X(E3x0;x91)x(f3022 则则若若2-27随机变量的数字特征期
19、望的性质:期望的性质:)()()(. 5)()()()(),(. 4)()()(. 3),()(. 2,)(. 1YEXEYXEYXdxxfxgXgEYEXgYYEXEYXEcXEcXcEcccE相互独立,则与若则若为常数为常数2-28n随机变量的类型随机变量的类型定类变量(定类变量(nominal variable):性别;民族):性别;民族定序变量(定序变量(ordinal variable):教育水平;收):教育水平;收入等级入等级定距变量(定距变量(interval variable):考试成绩;):考试成绩;收入水平收入水平n一般地,不同类型的变量用不同的数学特一般地,不同类型的变量
20、用不同的数学特征表示其集中趋势。定类变量用众数;定征表示其集中趋势。定类变量用众数;定序变量用中位数;定距变量用均值或中位序变量用中位数;定距变量用均值或中位数数2-29随机变量的数字特征方差(方差(variance)n方差被定义为随机变量对其均值的期望距离,用于方差被定义为随机变量对其均值的期望距离,用于表示随机变量与其均值的偏离程度。方差较小说明表示随机变量与其均值的偏离程度。方差较小说明变量的分布比较集中,反之则说明变量的分布很分变量的分布比较集中,反之则说明变量的分布很分散散n方差的性质2222()() () Var XEXE XE XE X相互独立与,若为常数为常数YXYVarXVa
21、rYXVarcXVarcXcVarccVar)()()(. 3),()(. 2, 0)(. 122-30随机变量的数字特征实例:6/357)36/1(144)36/2(9)36/1(4)()(6/357)36/1()712()36/2()73()36/1()72()(2222222222 XEXEXEXE 或或x23456789101112f(x)1/362/363/364/365/366/365/364/363/362/361/362-31随机变量的数字特征标准差(standard deviation)n方差的量纲与变量的量纲不同,为此引入与变量具有相同量纲的数字特征标准差,同样度量变量的离
22、散程度n标准差的性质:)(XVarSD 为为常常数数、为为常常数数bcXSDcbXcSDbccSDa),()(., 0)(. 2-32随机变量的数字特征度量变量离散程度的其他常用指标还有:度量变量离散程度的其他常用指标还有:n极差极差/全距全距n极差率极差率n变异系数变异系数)X(E)X(SDCV )Xmin()Xmax(range )Xmin()Xmax(I 2-33随机变量的数字特征协方差(协方差(covariance)n协方差度量两个随机变量的相关协方差度量两个随机变量的相关(correlation)程度程度协方差大于协方差大于0表示两个变量正相关表示两个变量正相关(positively
23、 correlated),即其中一个变量随着另一个变量的增大而,即其中一个变量随着另一个变量的增大而增大增大协方差小于协方差小于0表示两个变量负相关(表示两个变量负相关(negatively correlated),即其中一个变量随着另一个变量的增大而),即其中一个变量随着另一个变量的增大而减小减小协方差等于协方差等于0表示两个变量不相关表示两个变量不相关(uncorrelated))()()()()(),(YEXEYXEYEYXEXEYXCovXY 2-34n协方差的性质:若X和Y相互独立,则Cov(X,Y)=0Cov(aX,bY)=abCov(X,Y)|Cov(X,Y)| F (n1,n2
24、)= , 0 2.80)=0.05数量统计基础数量统计基础2-62数量统计基础的主要内容数量统计基础的主要内容n总体与样本总体与样本n参数估计参数估计点估计点估计区间估计区间估计n假设检验假设检验置信区间法置信区间法显著性检验法显著性检验法2-63总体与样本总体(总体(population)n研究对象的全体,记为研究对象的全体,记为X随机样本(随机样本(random sample)/样本(样本(sample)n在相同条件下对总体在相同条件下对总体X进行进行n次重复的、独立的次重复的、独立的观测,每次观测结果都是与观测,每次观测结果都是与X具有相同分布的、具有相同分布的、相互独立的随机变量,记为
25、相互独立的随机变量,记为X1 , X2 , , Xn ,把,把它们称为来自总体的一个简单随机样本,简称它们称为来自总体的一个简单随机样本,简称样本,称样本,称n为样本容量。当观测完成后,得到一为样本容量。当观测完成后,得到一组观测值组观测值x1 , x2 , , xn ,称为样本值。,称为样本值。2-64n我们感兴趣的实际上是总体,但由于不可我们感兴趣的实际上是总体,但由于不可能或很难得到总体的信息,只能从中抽取能或很难得到总体的信息,只能从中抽取一个样本,根据样本数据来推断总体的性一个样本,根据样本数据来推断总体的性质。这其中包含两类问题:质。这其中包含两类问题:参数估计参数估计和和假假设检
26、验设检验2-65参数估计参数(参数(parameters)n与总体有关的数字特征。如总体均值、总体方差等与总体有关的数字特征。如总体均值、总体方差等等。等。参数估计(参数估计(parameter estimation)n根据样本的有关数值来估计总体参数或总体参数的根据样本的有关数值来估计总体参数或总体参数的范围范围点估计点估计区间估计区间估计2-66n点估计(点估计(point estimation)X1,X2,Xn是来自总体是来自总体X的一个样本,的一个样本, x1,x2,xn是对应于该样本的样本值,是对应于该样本的样本值, 是待估是待估参数。点估计问题就是根据样本构造一个函参数。点估计问题
27、就是根据样本构造一个函数数 ,用它的观测值,用它的观测值 来估计未知参数。前者称为估计量来估计未知参数。前者称为估计量(Estimator),后者称为估计值后者称为估计值(Estimate),统称为估计,都简,统称为估计,都简记为记为 。12()nXXX, ,12()nxxx, , ,2-67点估计点估计n估计量是样本的函数,对于不同的样本,估计量是样本的函数,对于不同的样本,参数估计值是不同的。参数估计值是不同的。n点估计的方法:点估计的方法:矩估计法矩估计法极大似然法极大似然法最小二乘法最小二乘法2-68点估计矩(矩(moment)矩估计法(矩估计法(method of moment)n用
28、样本矩作为相应总体矩的估计量,并用样本用样本矩作为相应总体矩的估计量,并用样本矩的连续函数作为总体矩连续函数的估计量。矩的连续函数作为总体矩连续函数的估计量。通过这种方法得到的估计量称为矩估计量。通过这种方法得到的估计量称为矩估计量。nikiknikikkkkkXXnBkXnAkXEXEBkXEAk11)(11)()(阶中心矩:样本的阶原点矩:样本的阶中心矩:总体的阶原点矩:总体的2-69点估计矩估计法:实例11222111()niiniiAXXnBXXn 总体总体X的均值为的均值为 ,方差为,方差为 2,X1,X2,Xn是是来自来自X的一个样本,则可以用样本的的一个样本,则可以用样本的1阶原
29、点阶原点矩估计总体均值,用样本矩估计总体均值,用样本2阶中心矩估计总体阶中心矩估计总体方差,即:方差,即:2-70n极大似然法(极大似然法(method of maximum likelihood)设总体设总体X的的PDF为为P(X=x)=p(x, ), 是待估参数,是待估参数,。设设X1,X2,Xn是来自是来自X的样本,那么的样本,那么X1,X2,Xn的联合的联合PDF,即事件,即事件(X1=x1,Xn=xn)发生的概率为:发生的概率为:L( )称为样本的似然函数,所谓极大似然法,就是在称为样本的似然函数,所谓极大似然法,就是在 可能的取值范围可能的取值范围 内,找到令似然函数达到最大值的估
30、内,找到令似然函数达到最大值的估计量计量 。点估计121( )( ,; )( , ),nniiLL x xxp x 2-71点估计121( )(,; )max(, ),nniiLL xxxp x n也就是说,要找到使实际观测数据出现的也就是说,要找到使实际观测数据出现的可能性最大的可能性最大的 值。值。n具体解法是:具体解法是:( )/0ln( )/0dLddLd 令令,或或者者2-72点估计n极大似然法:实例xxnkkxnkxkdkdkxnkxkLkkkkkxpkLkXXXXxkkxXPPDFXiiiiixxxxniininxxiiii101)ln(0)1ln()(ln)()(ln)1 ()
31、1 (),()(,1 , 0,)1 ()()1(111211解得:,即:其一阶导数应为若要令上式取极大值,有:解:的极大似然估计值。的样本,试求是来自,为的设总体2-73点估计估计量的评选标准估计量的评选标准n估计量是随机变量,会由于估计方法的不同而不同,估计量是随机变量,会由于估计方法的不同而不同,那么,如何判断一个估计量的好坏呢?或者说应该那么,如何判断一个估计量的好坏呢?或者说应该选择哪个估计量更好呢?有以下几条标准:选择哪个估计量更好呢?有以下几条标准:针对小样本的标准针对小样本的标准a.无偏性无偏性b.有效性有效性针对大样本的标准针对大样本的标准a.一致性一致性b.渐进正态性渐进正态
32、性2-74点估计无偏性无偏性(unbiasedness)实例的的无无偏偏估估计计量量。是是那那么么称称如如果果,)(EkkniknikinikikAnAnXEnXEnXnEAE)(1)(1)(11)(111证证明明:求证:样本的求证:样本的k阶原点距是总体阶原点距是总体k阶原点距的无偏估计。阶原点距的无偏估计。特别地,样本的特别地,样本的1阶原点距是总体均值的无偏估计,即:阶原点距是总体均值的无偏估计,即:1111)(1)(11)(AnAnXEnXnEAEniinii2-752222222222121112212222222222222222212211)()()()()()(1)(1)(21
33、)(1)( )()()()()( )()( )()()()()()( )()(1)1()( )(nnnXEAXEAEXEXnEXnXXnXnEXXnEBEeXEXEXEXEAdnXEcXEXEXEXEXEXVarbnXVarnXnVarXVaraniinininiiiniiniinii求证:样本的求证:样本的2 2阶阶中心距中心距是总体方差的有偏估计。是总体方差的有偏估计。2-76点估计有效性(有效性(efficiency)n注意:一个无偏的估计量可能存在很大方差,而一注意:一个无偏的估计量可能存在很大方差,而一个方差很小的估计量可能是偏离总体均值的,因此个方差很小的估计量可能是偏离总体均值的
34、,因此有效性综合考虑了估计量的有效性综合考虑了估计量的集中趋势集中趋势和和离散性离散性两个两个特征特征更更有有效效比比那那么么称称的的无无偏偏估估计计量量,如如果果都都是是和和212121),()(VarVar2-77点估计n实例:有效性和无偏性实例:有效性和无偏性E(X)总体总体X的均值为的均值为 ,方差为,方差为 2,X1, X2, ,Xn是来是来自自X的一个样本,则的一个样本,则E(X1)= ,即,即X1是总体均值是总体均值的无偏估计量。的无偏估计量。由上可知,由上可知, ,即样本均值也是总体均值,即样本均值也是总体均值的无偏估计量。然而,的无偏估计量。然而,所以,所以, 是比是比X更有
35、效的估计量。更有效的估计量。221()()Var XVar Xn,X2-78点估计点估计n线性估计量(线性估计量(linear estimator)例如,对于样本均值来说,是一个线性估计量。例如,对于样本均值来说,是一个线性估计量。n最优线性无偏估计最优线性无偏估计量(量(best linear unbiased estimator, BLUE)的的一一个个线线性性估估计计量量称称其其为为性性函函数数,是是样样本本观观测测值值的的一一个个线线的的估估计计量量如如果果 如如果果 的的线线性性估估计计量量 是是无无偏偏的的,并并且且在在 的的所所有有线线性性无无偏偏估估计计量量中中具具有有最最小小
36、方方差差,称称其其为为 的的最最优优线线性性无无偏偏估估计计量量. .2-79点估计一致性(一致性(consistence)是是一一致致的的那那么么称称,都都有有:之之间间的的距距离离对对于于任任意意与与的的估估计计量量,如如果果当当样样本本无无限限增增大大时时, 1)(0 limPn 100),(nf80),(nf50),(nf20),(nf2-80点估计概率极限(概率极限(probability limits)2121212121212121/)/lim()lim()lim( .)()(lim .)(limpppbhhpapnn的的一一致致估估计计量量,那那么么:、分分别别是是、如如果果的
37、的一一致致估估计计量量,那那么么是是如如果果,它它有有以以下下性性质质:。记记为为:依依概概率率收收敛敛于于或或者者的的概概率率极极限限,是是的的一一致致估估计计量量,也也称称是是如如果果2-81点估计YXXYXYXYniiiniiXYXYniiniiSSSRbXXnSaYYXXnScXXnSbXnXEXa )()(11 )()( )(11 )()(11 )(1)( )(12112221样样本本相相关关系系数数:样样本本标标准准差差:有有偏偏一一致致的的估估计计量量:样样本本协协方方差差:样样本本方方差差:样样本本均均值值:无无偏偏一一致致的的估估计计量量:一些重要的估计量:一些重要的估计量:
38、2-82点估计n实例:为了解中国城市失业率,随机抽取了实例:为了解中国城市失业率,随机抽取了10座城座城市,得到如下样本。则我们可以用这市,得到如下样本。则我们可以用这10座城市的平座城市的平均失业率来估计中国城市的平均失业率均失业率来估计中国城市的平均失业率城市城市(i)12345678910失业率(xi)5.16.49.24.17.58.32.63.55.87.517. 2)(1172. 4)(1100. 61)(1212221niiniiniixxnsxxnsxnXEx样样本本标标准准差差:样样本本方方差差:样样本本均均值值:2-83点估计渐进正态性(渐进正态性(asymptotic n
39、ormality)n当样本容量无限增大时估计量趋向于正态分布当样本容量无限增大时估计量趋向于正态分布中心极限定理中心极限定理(central limit theorem, CLT)n定理一(独立同分布的中心极限定理):当样本容定理一(独立同分布的中心极限定理):当样本容量无限增大时,任何总体的随机样本的均值趋近于量无限增大时,任何总体的随机样本的均值趋近于正态分布正态分布。) 1 , 0(),()(1 ,21221NnXZnNnXnXXXXXniin,即:,即:,那么:,那么:和和均值和方差分别为均值和方差分别为,的样本,它们相互独立的样本,它们相互独立是是若随机变量若随机变量2-84点估计2
40、2111121(),(),1,2,() (,)(0,1)iiiinnniiiiiiniiniiE XVar XinSX nNSZN ,那那么么:即即:中心极限定理中心极限定理定理二:李雅普诺夫(定理二:李雅普诺夫(Liapunov)定理)定理若随机变量若随机变量X1, X2, , Xn相互独立,其均值和方差相互独立,其均值和方差分别为:分别为:2-85区间估计n对于一个未知参数,除了估计其近似值(点估计)对于一个未知参数,除了估计其近似值(点估计)外,还希望知道这个值的精确程度,从而引出外,还希望知道这个值的精确程度,从而引出区间区间估计(估计(interval estimation)问题问题
41、置信区间置信区间(confidence interval))%-1 (100),(11),(1)(:)10(,21212121212121的的真真值值的的概概率率是是含含有有这这意意味味着着随随机机区区间间称称为为置置信信系系数数。信信上上限限,分分别别称称为为置置信信下下限限和和置置和和的的置置信信区区间间,的的置置信信系系数数为为是是那那么么称称随随机机区区间间,满满足足、,如如果果的的函函数数,对对于于给给定定的的都都是是样样本本、估估计计量量PXXXn2-86区间估计n正态总体均值的区间估计:总体方差已知。的置信区间为:的置信区间为:的置信系数为的置信系数为因而因而即:即:有:有:,即
42、:,即:则则已知。已知。,的样本,的样本,是是随机变量随机变量),(111/) 1 , 0(/),(),(,2/2/2/2/2/22221znXznXznXznXPznXPNnXnNXNXXXXXn2-87区间估计n实例:总体方差已知时正态总体均值的区间估计的的置置信信区区间间的的一一个个是是那那么么,如如果果根根据据某某一一样样本本得得到到。的的真真值值的的概概率率为为即即:上上述述区区间间包包含含的的置置信信区区间间为为:的的则则,的的样样本本,是是随随机机变变量量%95)9 .674,1 .665()9 . 4670,9 . 4670(,670 x95%)9 . 4X()z100625X
43、,z100625X(%9505. 0,100n,625),(NXXX,X,X2/05. 02/05. 022n21 2-88区间估计n正态总体均值的区间估计:总体方差未知)1 .507,4 .500()15(t162022. 675.503),15(t162022. 675.503(%9505. 0,16n,2022. 6s ,75.503x)XX(1n1S),1n(tnSX),1n(tnSX(1)1n( tn/SX),(NXXX,X,X2/05. 02/05. 0n1i2i2/2/22n21 的的置置信信区区间间为为:的的一一个个则则,譬譬如如,若若。的的置置信信区区间间为为:的的置置信信系
44、系数数为为,因因而而则则未未知知。,的的样样本本,是是随随机机变变量量 2-89区间估计n标准误标准误(standard error)/ 2()XtSEX ,而,而S是是 的点估计,的点估计,所以所以 是是 的点估计。的点估计。定义定义 为为 的标准误,的标准误,这样,总体均值的这样,总体均值的1- 置信区间为:置信区间为:()SDXn()SDXSn()SSEXnnX2-90区间估计n正态总体均值的区间估计:95%置信区间的简单法则)9 .506, 6 .500()25506. 175.503, 25506. 175.503(%95 5506. 1)(95%)(2(96. 1) 1(,) 1(
45、025. 0025. 02/2/的的置置信信区区间间近近似似为为:的的,则则如如在在上上例例中中,的的置置信信区区间间。作作为为总总体体均均值值近近似似地地可可用用。特特别别地地:即即:分分布布接接近近于于正正态态分分布布,时时,当当xSEXSEXzntznttn2-91n非正态非正态总体均值的区间估计总体均值的区间估计对于非正态总体,中心极限定理保证了当对于非正态总体,中心极限定理保证了当n时,任何分布的样本均值都接近于正态分布。时,任何分布的样本均值都接近于正态分布。因此,无论总体是否为正态分布,一个近似的因此,无论总体是否为正态分布,一个近似的95%的置信区间为:的置信区间为:)(96.
46、 1),(96. 1(XSEXXSEX2-92假设检验假设检验假设检验(hypothesis testing)n在总体的在总体的PDF未知或某些参数未知的情况下,对总体未知或某些参数未知的情况下,对总体的的分布或参数分布或参数提出某些假设,然后根据样本对提出的提出某些假设,然后根据样本对提出的假设作出是拒绝还是接受的判断。假设作出是拒绝还是接受的判断。2-93n实例:实例:Bush和和Kerry竞选总统,竞选总统,Bush获得获得42%的选的选票而票而Kerry获得获得58%的选票。的选票。Bush怀疑大选中怀疑大选中有作弊行为,雇佣一个咨询机构随机抽取有作弊行为,雇佣一个咨询机构随机抽取10
47、0个选民调查其选举意愿,发现有个选民调查其选举意愿,发现有53人支持他,人支持他,47人支持人支持Kerry。由此。由此Bush提出两个假设:提出两个假设:H0(虚拟假设虚拟假设/原假设,原假设,null hypothesis):v 0.42 (没有作弊)(没有作弊)H1(对立假设对立假设/备择假设,备择假设,alternative hypothesis):v0.42(有作弊)(有作弊)2-94n第第类错误(类错误(type error)拒真错误拒真错误n第第 类错误(类错误(type error)取伪错误取伪错误真实情况真实情况H H0 0真真H H0 0假假检验检验结果结果拒绝拒绝类错误类
48、错误无错无错不拒绝不拒绝无错无错类错误类错误2-95n理论上我们希望犯两类错误的概率都尽可理论上我们希望犯两类错误的概率都尽可能小,但事实上不可能同时最小化两类错能小,但事实上不可能同时最小化两类错误。为此,我们首先考虑减少犯第误。为此,我们首先考虑减少犯第类错类错误的概率,并规定了一个可容忍的犯第误的概率,并规定了一个可容忍的犯第类错误的概率类错误的概率 (譬如(譬如0.05, 0.01),称为),称为显著性水平显著性水平(level of significance)。)。2-96n在选定了显著性水平之后,再考虑把犯第在选定了显著性水平之后,再考虑把犯第 类错误的概率减到最小。并把不犯第类错
49、误的概率减到最小。并把不犯第 类错误的概率类错误的概率 1- 称为称为检验的功效检验的功效(power of the test)。但一般来说我们不考虑检验的。但一般来说我们不考虑检验的功效。功效。2-97假设检验假设检验的两种方法假设检验的两种方法n置信区间法置信区间法n显著性检验法显著性检验法v假设检验的目的不是估计参数,而是对有关参假设检验的目的不是估计参数,而是对有关参数的假设做出检验,拒绝或不拒绝提出的假设数的假设做出检验,拒绝或不拒绝提出的假设2-98置信区间法 02/*02/*2/2/2221*1*0)(),(1)(),(1),(,:;:HznXHznXznXPznXNXXXXXH
50、Hn,则则不不能能拒拒绝绝反反之之,若若;就就可可以以拒拒绝绝因因此此,假假若若给给定定的的即即:的的置置信信区区间间为为的的置置信信系系数数为为因因此此已已知知。,的的样样本本,是是随随机机变变量量2-99置信区间法由于由于680不在上述区间内,因此可以不在上述区间内,因此可以95%的概的概率拒绝总体均值等于率拒绝总体均值等于680的假设。的假设。0.05/ 20.05/ 2625625(670,670)(665.1,674.9)100100zz例:随机变量例:随机变量X1,Xn是是X的样本,的样本,XN( , 2),已知:已知: 的的95%的置信区间为:的置信区间为:200625,670,