1、 对随机现象进行观测、试验,以取得对随机现象进行观测、试验,以取得有代表性的观测值有代表性的观测值 对已取得的观测值进行整理、分析对已取得的观测值进行整理、分析, ,作出推断、决策作出推断、决策, ,从而找出所研究的对象从而找出所研究的对象的规律性的规律性数数理理统统计计的的分分类类描述统计学描述统计学推断统计学推断统计学第一节第一节 基本概念基本概念一、总体和个体一、总体和个体二、样本二、样本 简单随机样本简单随机样本一、总体和个体一、总体和个体 一个统计问题总有它明确的研究对象一个统计问题总有它明确的研究对象. .研究某批灯泡的质量研究某批灯泡的质量研究对象的全体称为研究对象的全体称为总体
2、总体( (母体母体) ),组成总体的每个元素称为组成总体的每个元素称为个体个体. .总体总体 然而在统计研究中,人们关心总体仅仅是关心然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项其每个个体的一项( (或几项或几项) )数量指标和该数量指标数量指标和该数量指标在总体中的分布情况在总体中的分布情况. . 这时,每个个体具有的数这时,每个个体具有的数量指标的全体就是总体量指标的全体就是总体. .某批某批灯泡的寿命灯泡的寿命该批灯泡寿命的该批灯泡寿命的全体就是总体全体就是总体国产轿车每公里国产轿车每公里的耗油量的耗油量国产轿车每公里耗油量国产轿车每公里耗油量的全体就是总体的全体就是总体所研
3、究的对象的某个所研究的对象的某个( (或某些或某些) )数量指标的全体称为数量指标的全体称为总体总体, ,它是一个随机变量它是一个随机变量( (或多维随机变量或多维随机变量) ),记为,记为X . . X 的分布函数和数字特征称为总体分布函数的分布函数和数字特征称为总体分布函数和总体数字特征和总体数字特征. 例如例如: :研究某批灯泡的寿命时,总体研究某批灯泡的寿命时,总体X是这批是这批灯泡的寿命,而其中每个灯泡的寿命就是个体。灯泡的寿命,而其中每个灯泡的寿命就是个体。每个每个灯泡的寿命灯泡的寿命个体个体总体总体国产轿车每公里国产轿车每公里的耗油量的耗油量国产轿车每公里耗油国产轿车每公里耗油量
4、的全体就是总体量的全体就是总体 又如又如:研究某批国产轿车每公里的耗油量时,总研究某批国产轿车每公里的耗油量时,总体体X是这批轿车每公里的耗油量,而其中每辆轿车是这批轿车每公里的耗油量,而其中每辆轿车的耗油量就是个体。的耗油量就是个体。 类似地,在研究某地区中学生的营养状况时,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用若关心的数量指标是身高和体重,我们用X和和Y分分别表示身高和体重,那么此总体就可用二维随机变别表示身高和体重,那么此总体就可用二维随机变量量(X,Y) 来表示,而每个学生的身高和体重就是个来表示,而每个学生的身高和体重就是个体体. 为推断总体分布
5、及各种特征,按一定规则从总为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为的信息,这一抽取过程称为 “抽样抽样”,所抽取的部,所抽取的部分个体称为分个体称为样本样本. . 样本中所包含的个体数目称为样本中所包含的个体数目称为样本容量样本容量. .二、样本二、样本 简单随机样本简单随机样本1 1)抽样和样本)抽样和样本 样本的抽取是随机的,每个个体是一个随机样本的抽取是随机的,每个个体是一个随机变量变量.容量为容量为n的样本可以看作的样本可以看作n维随机变量,用维随机变量,用X1,X2,Xn表
6、示表示. 而一旦取定一组样本,得到的是而一旦取定一组样本,得到的是n个具体的个具体的数数 (x1,x2,xn),称其为样本的一个观察值,简,称其为样本的一个观察值,简称称样本值样本值 .2.X1,X2,Xn相互独立相互独立. 由于抽样的目的是为了对总体进行统计推断,由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法考虑抽样方法. .最常用的一种抽样方法叫作最常用的一种抽样方法叫作“简单简单随机抽样随机抽样”,它要求抽取的样本满足下面两点,它要求抽取的样本满足下面两点:1. 样本样本X1,X2,Xn中每一个
7、中每一个Xi与所考察的总体与所考察的总体X有相同的分布有相同的分布.2 2)简单随机样本)简单随机样本 由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样简单随机样本本,它可以用与总体独立同分布的,它可以用与总体独立同分布的n个相互独立个相互独立的随机变量的随机变量X1,X2,Xn表示表示. 简单随机样本是应用中最常见的情形,今后,简单随机样本是应用中最常见的情形,今后,当说到当说到“X1,X2,Xn是取自某总体的样本是取自某总体的样本”时,时,若不特别说明,就指简单随机样本若不特别说明,就指简单随机样本. 设设X1,X2,Xn 是总体是总体X的一个简单随机样本,的一个简单随机
8、样本,1)若若X为离散型总体,其分布律是为离散型总体,其分布律是p(x),则,则X1,X2,Xn的的联合分布律为联合分布律为p(x1) p (x2) p (xn) 2)若若X为连续型总体,其概率密度是为连续型总体,其概率密度是f(x),则,则X1,X2,Xn的联合分布律为的联合分布律为f (x1) f (x2) f (xn) 事实上我们抽样后得到的资料都是具体的、事实上我们抽样后得到的资料都是具体的、确定的值确定的值. 如我们从某班大学生中抽取如我们从某班大学生中抽取10人测量人测量身高,得到身高,得到10个数,它们是样本取到的值而不是个数,它们是样本取到的值而不是样本样本. 我们只能观察到随
9、机变量取的值而见不到我们只能观察到随机变量取的值而见不到随机变量随机变量.3)总体、样本、样本值的关系)总体、样本、样本值的关系 统计是从手中已有的资料统计是从手中已有的资料 样本值,去推断样本值,去推断总体的情况总体的情况 总体分布总体分布F(x)的性质的性质. 总体分布决定了样本取值的概率规律,也就是总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断样本取到样本值的规律,因而可以由样本值去推断总体总体. 4 4)经验分布函数)经验分布函数 设设X1,X2,Xn为取自总体为取自总体X的样本,的样本, x1,x2,xn为其观察值为其观察值.对于每个固定的对于每
10、个固定的x,设事件,设事件Xx在在n次观察中出现的次数为次观察中出现的次数为vn(x),于是事,于是事件件Xx发生的频率为:发生的频率为:( )( )nnvxFxxn 显然显然Fn(x)为不减右连续函数,且为不减右连续函数,且()0,() 1nnFF 称称 Fn(x) 为样本分布函数或经验分布函数为样本分布函数或经验分布函数.定理(格列文科)当定理(格列文科)当n时,经验分布函数时,经验分布函数 Fn(x) 依概率依概率1关于关于x一致收敛与总体分布函数,即一致收敛与总体分布函数,即lim sup |( )( )| 01nnxPFxF x 定理表明:定理表明:当样本容量当样本容量n充分大时,经
11、验分布函数充分大时,经验分布函数 Fn(x) 几乎一定会充分趋近总体分布函数几乎一定会充分趋近总体分布函数F(x),这是这是用样本来推断总体的理论依据用样本来推断总体的理论依据. 由样本值去推断总体情况,需要对样本值进行由样本值去推断总体情况,需要对样本值进行“加工加工”,这就要构造一些样本的函数,它把样本,这就要构造一些样本的函数,它把样本中所含的(某一方面)信息集中起来中所含的(某一方面)信息集中起来. .中不含有任何的未知参数,则称函数中不含有任何的未知参数,则称函数g(X1,X2,,Xn)如果样本如果样本X1,X2,,Xn的函数的函数g(X1,X2,,Xn)为统计量为统计量. .g(x
12、1,x2,,xn)为统计量为统计量g(X1,X2,,Xn)的一个的一个若若x1,x2,,xn是相应的样本值,则称函数值是相应的样本值,则称函数值观察值观察值.若若 , 2 已知已知, 则则,XnXnii 11是统计量,是统计量,而而是是X 的一个样本的一个样本,nXXX,21则则 niiX1221不是统计量不是统计量. . niiXXnS12211也是统计量也是统计量. niiX1221,),(NX22,是未知参数是未知参数, niiXnX11 nii)XX(nS12211它反映了总体均值它反映了总体均值的信息的信息它反映了总体方差它反映了总体方差的信息的信息nikikXnA11nikikXX
13、nB1)(1 k=1,2,它反映了总体它反映了总体 k 阶矩阶矩的信息的信息它反映了总体它反映了总体 k 阶阶中心矩的信息中心矩的信息它们的观察值分别为:它们的观察值分别为: niixnx11 niixxns122)(11 nikikxna11 nikikxxnb1)(1由大数定律可知:由大数定律可知: nikikXnA11)(kXE依概率收敛于依概率收敛于例例1. 从一批相同的电子元件中随机地抽出从一批相同的电子元件中随机地抽出8个,测得使用个,测得使用寿命(单位:小时)分别为:寿命(单位:小时)分别为:2300,2430,2580,2400,2280,1960,2460,2000,试计算样
14、本均值、样本方差及,试计算样本均值、样本方差及样本二阶矩样本二阶矩.解:解: niixnx11(小时)(小时)25.2301 niixxns122)(11)(小时(小时27857.48126 niixna1221)(小小时时25 .5337862 统计量是样本的函数,而样本是随机统计量是样本的函数,而样本是随机变量,故统计量也是随机变量,因而就有变量,故统计量也是随机变量,因而就有一定的分布,它的分布称为一定的分布,它的分布称为“抽样分抽样分布布” ” . . 下面介绍三个来自正态总体的抽样分布下面介绍三个来自正态总体的抽样分布. .)n(222分布分布1、 设设 相互独立相互独立, ,都服从
15、标准正态分布都服从标准正态分布nX,X,X21222212nXXX N(0,1), 则称随机变量:则称随机变量: 所服从的分布为自由度为所服从的分布为自由度为 n 的的 分布,记为分布,记为22分布的概率密度为分布的概率密度为 其其它它00)2(21)(2122yeynyfynn在在其中其中)(001 sdtte)s(st)2(n是函数是函数2ns 处的值处的值. .n=1n=4n=10f(y)0 1 3 5 7 9 11 13 15 17 x0.50.40.30.20.1有所改变有所改变. .2分布的概率密度图形如下:分布的概率密度图形如下:2显然显然分布的概率密度图形分布的概率密度图形随自
16、由度的不同而随自由度的不同而性质性质1.1.),(22n设设nDnE2)(,)(22 则则设设 niiin,i),(NXX1222110nX,X,X21相互独立相互独立, ,则则,)X(D,)X(Eii10 niiXEE1222n )( niiXE12 22)X(E)X(D)X(Eiii , 1 3d21)(2244 xexXExi2)()()(2242 iiiXEXEXD niiXDnD122)(n2 这个性质称为这个性质称为 分布的可加性分布的可加性. .2性质性质2.2.)(2122221nn ),(1221n设设),(2222n且且21与与22相互独立,则相互独立,则t 的概率密度为的
17、概率密度为:2121221 n)nt(n)n()n()t (h 设设XN( 0 , 1 ) , , Y YnYXt 所服从的分布为自由度为所服从的分布为自由度为 n 的的 t 分布分布. .记为记为tt (n).)(2n2、t 分布分布,且,且 X 与与 Y 相互相互独立,则称变量独立,则称变量n=4n=10n=1xt(x;n)o t分布的概率密度函数关于分布的概率密度函数关于t=0对称,且对称,且当当n充分大时充分大时(n30),其图形与标准正态分布的,其图形与标准正态分布的概率密度函数的图形非常接近概率密度函数的图形非常接近.但对于较小的但对于较小的n,t 分布与分布与N (0,1)分布相
18、差很大分布相差很大.由定义可见,由定义可见,3、F分布分布则称统计量则称统计量服从自由度为服从自由度为n1及及 n2 的的F分布,分布,n1称为第一自由度,称为第一自由度,21nYnXF 121nXnYF F(n2,n1),n(Y),n(X2212 设设X 与与 Y 相互独立,相互独立,n2称为第二自由度,记作称为第二自由度,记作 FF(n1,n2) . 0001)()()()()()(2222212112121212121xxxxxnnnnnnnnnnnnn若若XF(n1,n2),则,则X的概率密度为的概率密度为xo)n,n;x(f21 2n201 n252 n102 n注意:注意:统计的三
19、大分布的定义、基本性质在后面的统计的三大分布的定义、基本性质在后面的学习中经常用到,要牢记!学习中经常用到,要牢记!4、上、上分位点分位点 dxxfxXPx )(设随机变量设随机变量X的概率密度为的概率密度为 f(x),对于对于任意给定的任意给定的(01),若存在实数若存在实数x,使得使得:则称点则称点x为该概率分布的上为该概率分布的上分位点分位点 对标准正态分布变量对标准正态分布变量ZN(0, 1)和给定的和给定的 ,上,上 分分位数是由位数是由: PZz =2212tzdte 即即 PZ45),),2其中其中Z是标准正态分布的上是标准正态分布的上分位点分位点22)12(21 nZ3)对于)
20、对于 t 分布分布a)由其对称性,有:由其对称性,有: )()(1ntnt b) 当当n充分大时(充分大时(n45),), Znt )(4)对于)对于F分布,有:分布,有:),(1),(12211nnFnnF 例例2. 查表求下列值查表求下列值: ,)5(01. 0t,)6(95. 0t,)9,10(1 . 0F,)2,28(9 . 0F,)(.202250 3649. 3)5(01. 0 t)6()6(05. 095. 0tt 42. 2)9,10(1 . 0 F解:解:9432. 1 )28, 2(1)2,28(1 . 09 . 0FF 828.23)20(225. 0 , 4 . 050
21、. 21 .z.010332010.z. )3 , 0(2N例例3.设总体设总体X和和Y相互独立,同服从相互独立,同服从分布,而分布,而 X1,X2,, X9 和和 Y1,Y2,, Y9292221921YYYXXXU 的分布的分布.分别是来自分别是来自X和和Y的简单随机样本,求统计量的简单随机样本,求统计量解:解:)9 , 0( NXi)81, 0(91NXii )1 , 0(991NXii )9 , 0( NYi)1()3(22Yi)9(992912912YYiiii 81/9/91291 iiiiYXU)9( t292221921YYYXXX X1,X2,,X15是来自是来自X的简单随机
22、样本,的简单随机样本,求求)2 , 0(2N例例4.设总体设总体X服从服从分布,而分布,而)XXX(XXXY21521221121022212 的分布的分布. .统计量统计量解:解:)2 , 0(2NXi)1()2(22Xi)10(44210121012XXiiii )5(4421511215112XXiiii 20402152122112102221/)XXX(/XXX )()XXX(XXX21521221121022212 Y )5 ,10( F例例5 设总体设总体)1 ,0( NX16,XX为总体为总体 X 的样本的样本,26542321)()(XXXXXXY 试确定常数试确定常数 c
23、,使使解:解:, ) 3 , 0 (321NXXX ) 1 , 0 (31654NXXX 265423213131 XXXXXX故故因此因此1 / 3 .c ) 2(312Y 2分布分布. .cY 服从服从) 3 , 0 (654NXXX ,) 1 , 0 (31321NXXX 当总体为当总体为正态分布正态分布时,教材上给出了几个时,教材上给出了几个重要的抽样分布定理重要的抽样分布定理. .这里我们不加证明地叙述这里我们不加证明地叙述. . 设设X1,X2,Xn是取自正态总体是取自正态总体),(2 N的样本,则有的样本,则有),(2nNX (1 1)样本均值)样本均值(2 2)样本均值)样本均
24、值 与样本方差与样本方差 相互独立。相互独立。X2S(3 3)随机变量)随机变量22)1Sn ()()(12221 nXXnii 设设X1,X2,Xn是取自正态总体是取自正态总体),(2 N的样本的样本, ,2SX和和分别为样本均值和样本方差分别为样本均值和样本方差, ,则有则有) 1(ntnSX )2(112) 1() 1()(21212122221121nntnnnnSnSnYX ,设设),(),(2221NYNX且且X与与Y独立独立,YX和和分别是这两个样本的样本均值分别是这两个样本的样本均值,自自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,则有则有2221SS
25、 和和是取自是取自X的样本的样本,X1 , X2 , ,1nXY1 ,Y 2,2nY是取是取 ) 1, 1(2122222121nnFSS ,设设),(),(222211NYNX且且X与与Y独立独立,YX和和分别是这两个样本的样本均值,分别是这两个样本的样本均值,Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,则有则有2221SS 和和1nXX1, X2,是取自是取自X的样本的样本,Y1,Y2,2nY是取自是取自上述上述4 4个抽样分布定理很重要,要牢固掌握个抽样分布定理很重要,要牢固掌握. .的概率不小于的概率不小于90%,90%,则样本容量至少取多少则样本容量至少取多
26、少? ?例例6.设设(72 ,100)XN, ,为使样本均值大于为使样本均值大于7070的概率的概率解:解:设样本容量为设样本容量为 n , 则则)100,72(nNX)70( XP n1072701)70(1 XP n2 . 0 令令 9 . 02 . 0 n得得29. 12 . 0 n即即6025.41 n所以至少取所以至少取42 n例例7. 从正态总体从正态总体),(2NX中,抽取了中,抽取了 n = 20的样本的样本1220,XXX解:解: (1)(1) )19(11922012222XXSii 即即) 1() 1(222 nSn 202221110.381651.8095520iiP
27、XX () 202221120.37171.708520iiPX ()故故 191361633720122.XX.Pii 191361633712012220122.XXP.XXPiiii98. 001. 099. 0 查查表表 202221110.381651.8095520iiPXX ()(2)(2) )20(22012Xii 故故 173443472012.X.Pii 1734434720122012.XP.XPiiii97. 0025. 0995. 0 202221120.37171.708520iiPX ()3 3 掌握给出的四个抽样分布定理。掌握给出的四个抽样分布定理。第六章第六章
28、 小小 结结1.1.给出了总体、个体、样本和统计量的概念,要掌给出了总体、个体、样本和统计量的概念,要掌2.2.给出了给出了 分布、分布、t t分布、分布、F F分布的定义和性质,要会分布的定义和性质,要会2查表求其上查表求其上分位点。分位点。握样本均值和样本方差的计算及基本性质。握样本均值和样本方差的计算及基本性质。X 0 1Pk 1-p ppXE )(pXE )(2)1()(ppXD 若随机变量若随机变量X服从二点分布,其服从二点分布,其分布律为:分布律为:随机变量随机变量XB(n,p),其其分布律为:分布律为:nkppCkXPknkkn, 2 , 1,)1( 由由二项分布定义可知,二项分
29、布定义可知,X是是n重贝努利试验中事件重贝努利试验中事件A发发生的次数,且在每次试验中生的次数,且在每次试验中A发生的概率为发生的概率为p,设,设nkkAkAXk,2 , 1,01 次次不不发发生生在在第第次次发发生生在在第第则则Xk服从二点分布,其服从二点分布,其分布律为:分布律为:X 0 1Pk 1-p p,)(pXEk )1()(ppXDk nXXXX 21)(XE)(XD)()()(21nXEXEXE np )1(pnp )()()(21nXDXDXD )1()()(pnpXDnpXE ,若随机变量若随机变量XB( n , p ),则则即:即:随机变量随机变量 ,其其分布律为:分布律为
30、:)( X, 2 , 1 , 0,! kkekXPk 0!)(kkkekXE 11)!1(kkke ee 22)()()(XEXEXD 即:即:XDXE )(,)()(2XE)1(XXXE )()1(XEXXE 0!)1(kkkekk 222)!2(kkke ee2 2若随机变量若随机变量X(),则则设随机变量设随机变量X在区间在区间(a,b)上服从均匀分布,其概率上服从均匀分布,其概率密度为密度为,01)( 其它其它bxaabxf dxxxfXE)()( badxabx12ba abxab212 )(2XE badxabx12)(333abab 322baba 22)()()(XEXEXD
31、4232222babababa 12)(2ab 即即12)()(,2)(2abXDbaXE 若随机变量若随机变量XU( a , b ),则则随机变量随机变量 ,其其概率密度概率密度为:为:),(2 NX xexfx,21)(222)( dxxxfXE)()( dxexx222)(21 (令(令 ) xt tdett 22)(21 dtet222 )()(2XEXEXD dxexx222)(221)( (令(令 ) xt tdett22222 222)(2tdet tdetett222222 222 2 2)(,)(XDXE 即即若随机变量若随机变量XN(,2 ), 则则随机变量随机变量X服从参
32、数为服从参数为的指数分布的指数分布,其其概率密度概率密度为:为: 0001)(xxexfx dxxxfXE)()( 01dxexx 0 xdex)(dxeexxx 00|)(0| xe dxxfxXE)()(22 021dxexx 02xdex )(0|22 xedxxeexxx 0220|)( 02xdex )(dxeexxx 020|2)(,22 22)()()(XEXEXD 2 若随机变量若随机变量X服从参数为服从参数为的指数分布的指数分布,则则即即2)()(XDXE ,已知已知 求求 , )3( X,12 XY, )(YE, )(YD)1(32 XE, )3( X则则,3)( XE3)
33、( XD)(YE1)(2 XE5 )(YD)(4XD 12 )1(32 XE3)(32 XE3)()(32 XEXD33 , )9 , 1(NYX在区间在区间(1,5)上服从均匀分布上服从均匀分布, ,已知已知X和和Y相互独立,且相互独立,且X在区间在区间(1,5)上服从上服从均匀分布,均匀分布, 求求(1) (X,Y)的概率密的概率密度度;(2), )243( YXE)243( YXD, )9, 1( NY,05141)( 其它其它xxfX)(XE251 3 )(XD12)15(2 34 ,231)(18)1(2 yeyfyY ,1)( YE9)( YD由由X和和Y相互独立得:相互独立得:)
34、()(),(yfxfyxfYX 其其它它0,51,212118)1(2yxey )243( YXE2)(4)(3 YEXE3 )243( YXD)()4()(92YDXD 156 概率论中用来阐明大量随机现象平均概率论中用来阐明大量随机现象平均结果的稳定性的一系列定理,称为大数定结果的稳定性的一系列定理,称为大数定律律第一节第一节 大数定律大数定律一个常数,若对于任给的正数一个常数,若对于任给的正数 0, 0, 总成立总成立1|lim aYPnn,21nYYY设设是一个是一个随机变量序列,随机变量序列, a 是是则称则称 随机变量随机变量 序列序列,21nYYY依概率收敛于依概率收敛于a,记为
35、记为)( naYPn)()( nagYgPn)( naYPn1.设设,g(x)是连续是连续函数,则函数,则)(,(),( nbagYXgPnn,)( naXPn2.设设g(x , y)是二元连续函数,则是二元连续函数,则,)( nbYPn 设设n重贝努里试验中事件重贝努里试验中事件A发生的次数为发生的次数为n,A在每次试验中发生的概率为在每次试验中发生的概率为 p ,则对任给的,则对任给的0,总,总成立成立1 |pn|Plimnn即:即:)( npnPn贝努里大数定律的意义贝努里大数定律的意义在概率的统计定义中在概率的统计定义中, 事件事件A 发生的频率发生的频率 “ 稳定于稳定于”事件事件A
36、 在一次试验中发生的概率是指:频率在一次试验中发生的概率是指:频率 与与 pnnA有较大偏差有较大偏差 pnnA大时可以用频率近似代替大时可以用频率近似代替 p . . nnA是小概率事件是小概率事件, , 因而在因而在 n 足够足够 贝努里大数定律提供了通过试验来确定事件概率的贝努里大数定律提供了通过试验来确定事件概率的方法方法. . niinXnP11|1|lim 设随机变量序列设随机变量序列X1,X2, 相互独立,并且具有相同相互独立,并且具有相同的数学期望和方差,的数学期望和方差,E(Xi)=,D(Xi)=2,i=1,2, ,则对则对任给的任给的0,总成立,总成立即即)( nXnPni
37、i11定理定理2的意义的意义 具有相同数学期望和方差的独立随机变量序列的算具有相同数学期望和方差的独立随机变量序列的算术平均值依概率收敛于数学期望术平均值依概率收敛于数学期望.当当 n 足够大时足够大时, 实验实验结果的算术平均几乎是一常数结果的算术平均几乎是一常数. 因此,在实际应用中,当试验次数因此,在实际应用中,当试验次数足够大时足够大时, ,可用可用独立重复试验结果的独立重复试验结果的算术平均数来估计随机变量的算术平均数来估计随机变量的数学期望数学期望. . niniiinnXnP111|11|lim 设随机变量序列设随机变量序列X1,X2, 相互独立,它们都具有数相互独立,它们都具有
38、数学期望:学期望:E(Xi)=i,并且都,并且都具有被同一常数具有被同一常数C所限制的所限制的方差:方差:D(Xi)= 0 0,总成立,总成立2i即即)( nnXnniiPnii1111 niiXn11接近于其数学接近于其数学期望的算术平均的概率接近于期望的算术平均的概率接近于1.1.即当即当n充分大时,充分大时, 差不多不再是随机的了,取值差不多不再是随机的了,取值定理定理3的意义的意义 定理表明,独立随机变量序列定理表明,独立随机变量序列Xn,如果方差有共,如果方差有共 niiXn11与其数学期望与其数学期望 nii)X(En11小的概率接近于小的概率接近于1.1.同的上界,则同的上界,则
39、偏差很偏差很 设随机变量序列设随机变量序列X1,X2, 相互独立,服从同一分布,相互独立,服从同一分布,具有相同的数学期具有相同的数学期 望望E(Xi)=, i=1,2,, 则对于任给则对于任给正数正数 0 ,总成立,总成立1|1|lim1 XnPniin即即)( nXnPnii111|1|lim1 XnPknikin 设随机变量序列设随机变量序列X1,X2, 相互独立,服从同相互独立,服从同一分布,且具有相同的一分布,且具有相同的k 阶矩阶矩,)(21 iXEkki则对任给正数则对任给正数0 0,总成立,总成立即即)( nXnkPniki11这一节我们介绍了大数定律这一节我们介绍了大数定律大
40、数定律以严格的数学形式表达了随机现象最根本大数定律以严格的数学形式表达了随机现象最根本的性质之一:的性质之一:它是随机现象统计规律的具体表现它是随机现象统计规律的具体表现. .在理论和实际在理论和实际中都有广泛的应用中都有广泛的应用. .平均结果的稳定性平均结果的稳定性第二节第二节 中心极限定理中心极限定理 客观实际中,许多随机变量是由大量客观实际中,许多随机变量是由大量相互独立的偶然因素的综合影响所形成,每一个微小相互独立的偶然因素的综合影响所形成,每一个微小因素,在总的影响中所起的作用是很小的,但总起来,因素,在总的影响中所起的作用是很小的,但总起来,却对总和有显著影响,这种随机变量往往近
41、似地服从却对总和有显著影响,这种随机变量往往近似地服从正态分布。正态分布。 概率论中有关论证独立随机变量的和的极限分布是概率论中有关论证独立随机变量的和的极限分布是正态分布的一系列定理称为中心极限定理。正态分布的一系列定理称为中心极限定理。 由于无穷个随机变量之和可能趋于由于无穷个随机变量之和可能趋于,故我,故我们不研究们不研究n个随机变量之和本身而考虑它的标准化个随机变量之和本身而考虑它的标准化的随机变量的随机变量 nkknknkkknXDXEXZ111)()(的极限分布的极限分布. .下面介绍常用的三个中心极限定理。下面介绍常用的三个中心极限定理。xnnXPlimniin 1 x-2t -
42、dte212 设设X1,X2, 是独立同分布的随机变量序列,且是独立同分布的随机变量序列,且E(Xi)=,D(Xi)=2,i=1,2,,则,则 定理表明:定理表明:当当n充分大时,标准化随机变量充分大时,标准化随机变量近似服从标准正态分布近似服从标准正态分布. .nnXnii 1 由此可知:由此可知:对于独立的随机变量序列对于独立的随机变量序列 ,不管不管 服从什么分布,只要它们是同服从什么分布,只要它们是同分布,且有有限的数学期望和方差,那么,当分布,且有有限的数学期望和方差,那么,当n n充充分大时,这些随机变量之和分大时,这些随机变量之和 近似地服从正态近似地服从正态分布分布 nX(1,
43、2, )in 1niiX 2,N nn iX(1) (1) 至少命中至少命中180发炮弹的概率发炮弹的概率; ;(2) (2) 命中的炮弹数不到命中的炮弹数不到200发的概率发的概率. .例例1.1.炮火轰击敌方防御工事炮火轰击敌方防御工事 100 次次, , 每次轰击命中每次轰击命中的炮弹数服从同一分布的炮弹数服从同一分布, , 其数学期望为其数学期望为 2 , , 均方差均方差为为1.5. . 若各次轰击命中的炮弹数是相互独立的若各次轰击命中的炮弹数是相互独立的, , 求求100 次轰击中次轰击中解:解:设设 X k 表示第表示第 k 次轰击命中的炮弹数,次轰击命中的炮弹数,100, 2
44、, 1,5 . 1)(, 2)(2 kXDXEkk设设 X 表示表示100次轰击命中的炮弹数次轰击命中的炮弹数, ,则则,1001 kkXX由独立同分布中心极限定理由独立同分布中心极限定理, , 有有), 1015200(NX 近近似似则则10021,XXX相互独立,相互独立,又又,225)(,200)( XDXE(1) 180 XP(2)2000 XP9082. 0)3 . 1( 5 . 0115 . 0 )(33. 115200 XP)33. 1(1 1520020015200152000 XP01520033.13 XP)33.13()0( )33.13(1 )0( 1520018015
45、200 XP例例2.一食品店有三种蛋糕出售,由于售出哪一种蛋一食品店有三种蛋糕出售,由于售出哪一种蛋糕是随机的,因而售出一只蛋糕的价格是一个随机糕是随机的,因而售出一只蛋糕的价格是一个随机变量,它取变量,它取1(元元),1.2 (元元),1.5(元元)各值的概率分别各值的概率分别为为0.3,0.2,0.5.某天售出某天售出300只蛋糕只蛋糕.求这天的收入求这天的收入至少达至少达400 (元元)的概率的概率解:解:设第设第i只蛋糕的价格为只蛋糕的价格为Xi,i=1,2,300,则则Xi的分的分布律为布律为P 1 1.2 1.5Xi 0.3 0.2 0.5)(iXE)(2iXE22)()()(ii
46、iXEXEXD 由独立同分布中心极限定理知:由独立同分布中心极限定理知:即即)10(0489.030029.13003001),NXii 近近似似)10(8301.33873001),NXii 近近似似29. 1 5 . 05 . 12 . 02 . 13 . 01 5 . 05 . 12 . 02 . 13 . 0122 713. 1 229. 1713. 1 0489. 0 4003001 iiXP8301. 33874008301. 33873001 iiXP39. 38301. 33873001 iiXP)39. 3(1 0003. 09997. 01 )1(limxpnpnpPnn
47、设设n重贝努利试验中事件重贝努利试验中事件A发生的次数为发生的次数为n,事事件件A在每次试验中发生的概率为在每次试验中发生的概率为p,则对于任给实则对于任给实数数x,总成立总成立dtext 2221 定理表明:定理表明:若若 服从二项分布,当服从二项分布,当n很大时,很大时,nYnY)1(pnpnpYn 近似服从标准正态近似服从标准正态的标准化随机变量的标准化随机变量 由此可知:当由此可知:当n很大,很大,0p0, 求求,的矩估计的矩估计.解解: :1()xE Xxedx xx de ()|xxx eedx ()|xe 221()xE Xxedx 2xxde ()2|2xxxexedx ()2
48、2 E ( ( X X ) )2222 212xxedx 令令解得解得用样本矩估计用样本矩估计总体矩总体矩,X 2221122niiXn niiXXn1221 X niiXXn1221由课文本节例由课文本节例1 1知:知:不论总体为何分布,总体均值的矩估计量总是不论总体为何分布,总体均值的矩估计量总是,X总体方差的矩估计量总是总体方差的矩估计量总是.2B例例4.4.设从某灯泡厂某天生产的灯泡中随机设从某灯泡厂某天生产的灯泡中随机抽取抽取1010只灯泡,测得其寿命为只灯泡,测得其寿命为( (单位单位: :小时小时) )1050, 1100, 1080, 1120, 1200,1250, 1040
49、, 1130, 1300, 1200,试用矩法估计该厂这天生产的试用矩法估计该厂这天生产的灯泡的平均寿命及寿命分布的方差灯泡的平均寿命及寿命分布的方差. .解:解:2 7-14x )(1147101101hxii 1021110iixx ()2B 26821().h 即:在一次试验中,概率最大的事件最有可能发生即:在一次试验中,概率最大的事件最有可能发生. .引例引例: : 有两个外形相同的箱子有两个外形相同的箱子, ,各装各装100100个球,一箱个球,一箱中中取得的球是白球取得的球是白球. .问问: : 所取的球来自哪一箱?所取的球来自哪一箱?答答: : 第一箱第一箱. .中有中有9999
50、个白球个白球1 1个红球,一箱中有个红球,一箱中有1 1个白球个白球9999个红球。个红球。现从两箱中任取一箱现从两箱中任取一箱, , 并从箱中任取一球并从箱中任取一球, ,结果所结果所 一般说,若事件一般说,若事件A发生的概率与参数发生的概率与参数 有关,有关, 取值不同,取值不同,P(A)也不同。则应记也不同。则应记事件事件A发生的概发生的概率为率为P(A| ).若一次试验,事件若一次试验,事件A发生了,可认为此发生了,可认为此时的时的 值应是在值应是在 中使中使P(A| ) 达到最大的那一个达到最大的那一个。这就是这就是.X1,X2,Xn是取自总体是取自总体X的样本,的样本,x1 , x