1、第六章第六章 大数定律与中心极限定理大数定律与中心极限定理本章要解决的问题 为何能以某事件发生的频率 作为该事件的 概率的估计?为何能以样本均值作为总体 期望的估计?为何正态分布在概率论中占 有极其重要的地位?大样本统计推断的理论基础 是什么?大数大数定律定律中心极中心极限定理限定理1设非负随机变量 X 的期望 E(X)存在,则对于任意实数 0,)()(XEXP马尔可夫(马尔可夫(Markov)不等式不等式证证 仅证连续型随机变量的情形dxxfXP)()(dxxfx)(0)(1dxxxf)(XE 重要不等式重要不等式 6.1 大数定律大数定律2设随机变量 X 的k阶绝对原点矩 E(|X|k)存
2、在,则对于任意实数 0,kkXEXP)|(|)|(|推论推论 1设随机变量 X 的方差 D(X)存在,则对于任意实数 0,2)()|)(|XDXEXP推论推论 2 切贝雪夫(chebyshev)不等式或2)(1)|)(|XDXEXP3例例1 设有一大批种子,其中良种占1/6.试估计 在任选的 6000 粒种子中,良种所占比例与 1/6 比较上下小于1%的概率.解解 设 X 表示 6000 粒种子中的良种数,X B(6000,1/6)01.0616000XP65000)(,1000)(XDXE)60|1000(|XP2606500017685.0108834实际精确计算:1060940XP01.
3、0616000XP1059941600060006561kkkkC959036.0用Poisson 分布近似计算:1060940XP01.0616000XP937934.010599411000!1000kkke取=10005例例2 设每次试验中,事件 A 发生的概率为 0.75,试用 Chebyshev 不等式估计,n 多大时,才 能在 n 次独立重复试验中,事件 A 出现的 频率在0.74 0.76 之间的概率大于 0.90?解解 设 X 表示 n 次独立重复试验中事件 A 发生 的次数,则X B(n,0.75)nXDnXE1875.0)(,75.0)(90.076.074.0nXP要使,
4、求 n6即90.076.074.0nXnP即90.001.0|75.0|nnXP由 Chebyshev 不等式,=0.01n,故2)01.0(1875.0101.0|75.0|nnnnXP令90.0)01.0(1875.012nn解得18750n7若 E(X)=,D(X)=2,类似于正态分布的3 原理,由 Chebyshev 不等式可估计1111.0913|XP25.0412|XP由 Chebyshev 不等式,可看出 D(X)反映了 X 偏离 E(X)的程度.固定,较小者,22|XP较小.Chebyshev 不等式对于 2 2 无实际意义8大数定律大数定律贝努里(Bernoulli)大数定律
5、设 nA 是 n 次独立重复试验中事件 A 发生的次数,p 是每次试验中 A 发生的概率,则0有0limpnnPAn或1limpnnPAn9证证 引入随机变量序列Xk发生次试验第发生次试验第AkAkXk,0,1设,)1(pXPk则pqXDpXEkk)(,)(nXXX,21相互独立,nkkAXn1记,11nkknXnYnpqYDpYEnn)(,)(由Chebyshev 不等式10pnnPA0故0limpnnPAn)(nnYEYPnpq2111nnkkkkXXPEnn11在概率的统计定义中,事件 A 发生的频率“稳定于”事件 A 在一次试验中发生的概率是指:nnAnnA频率与 p 有较大偏差pnn
6、A是小概率事件,因而在 n 足够大时,可以用频率近似代替 p.这种稳定称为依概率稳定.贝努里(贝努里(Bernoulli)大数定律的意义大数定律的意义:12定义定义a 是一常数,0limaYPnn(或)1limaYPnn则称随机变量序列称随机变量序列,21nYYY依概率收敛依概率收敛于常数于常数 a,记作记作aYnPn故pnnnPA,21nYYY是一系列随机变量,设0有若13在 Bernoulli 定理的证明过程中,Y n 是相互独立的服从 0-1分布的随机变量序列 Xk 的算术平均值,Y n 依概率收敛于其数学期望 p.结果同样适用于服从其它分布的独立随机变量序列.14,21nXXX的数学期
7、望与方差设为,2,1,)(,)(22kXDXEkkkk有011lim11nkknkknnXnPChebyshev 大数定律大数定律,21nXXX相互独立相互独立,设随机变量序列(指任意给定 n 1,相互独立),nXXX,21证明:证明:由由chebyshev不等式可得。不等式可得。15推论:推论:独立同分布时的独立同分布时的 Chebyshev 大数定律大数定律,21nXXX相互独立,设随机变量序列,2,1,)(,)(2kXDXEkk则0有01lim1nkknXnP或11lim1nkknXnP且nXXX,21具有相同的数学期望和方差具有相同的数学期望和方差16定理的意义定理的意义:当 n 足够
8、大时,算术平均值几乎就是一个常数,可以用算术平均值近似地代替数学期望.具有相同数学期望和方差的独立随机变量序列的算术平均值依概率收敛于数学期望.176.2 中心极限定理中心极限定理定理定理1 独立同分布的中心极限定理独立同分布的中心极限定理 设随机变量序列,21nXXX相互独立,服从同一分布,且有期望和方差:,2,1,0)(,)(2kXDXEkk则对于任意实数 x,xtnkkndtexnnXP21221lim18注:则 Y n 为nkkX1的标准化随机变量.)(limxxYPnn即 n 足够大时,Y n 的分布函数近似于标准正态随机变量的分布函数nnXYnkkn1记)1,0(NYn近似nkkX
9、1nYnn),(2nnN近似服从19定理定理2 德莫佛德莫佛 拉普拉斯中心极限定理拉普拉斯中心极限定理 (DeMoivre-Laplace)Y n B(n,p),0 p 1,n=1,2,则对任一实数 x,有xtnndtexpnpnpYP2221)1(lim是n次独立试验中事件A出现的次数,p为A发生概率,即nY20即对任意的 a b,batnndtebpnpnpYaP2221)1(limY n N(np,np(1-p)(近似)证明:证明:事事实实上上,据据二二项项分分布布的的定定义义11 0 nniiiAYXXA事事件件 发发生生其其中中事事件件 不不发发生生,()nnEYnpVar Ynpq
10、另另一一方方面面,1据据定定理理,知知结结论论成成立立。21例例1 设有一大批种子,其中良种占1/6.试估计 在任选的6000粒种子中,良种所占比例与 1/6比较上下不超过1%的概率.解解 设 X 表示6000粒种子中的良种数,则X B(6000,1/6)5000()1000,()6E XD Xnpq226500010009406500010001060650006065000601650006029624.001.0616000XP601000 XP65000,1000 NX近似23比较几个近似计算的结果用中心极限定理9624.001.0616000XP用二项分布(精确结果)10.010.9
11、59060006XP用Poisson 分布9379.001.0616000XP用Chebyshev 不等式7685.001.0616000XP24例例2 某车间有200台车床,每台独立工作,开工 率为0.6.开工时每台耗电量为 r 千瓦.问供 电所至少要供给这个车间多少电力,才能以 99.9%的概率保证这个车间不会因供电不足 而影响生产?解解 设至少要供给这个车间 a 千瓦的电力设 X 为200 台车床的开工数.X B(200,0.6),问题转化为求 a,使%9.99)0(arXPX N(120,48)(近似)25由于将 X 近似地看成正态分布,故48120048120)0(raarXP481
12、20ra0)32.17(48120026反查标准正态函数分布表,得%9.9909.3令09.348120ra解得rra141)1204809.3(千瓦)27例例3 检查员逐个地检查某种产品,每检查一只 产品需要用10秒钟.但有的产品需重复检 查一次,再用去10秒钟.假设产品需要重 复检查的概率为 0.5,求检验员在 8 小时内 检查的产品多于1900个的概率.解解 检验员在 8 小时内检查的产品多于1900个 即检查1900个产品所用的时间小于 8 小时.设 X 为检查1900 个产品所用的时间(单位:秒)设 Xk 为检查第 k 个产品所用的时间(单位:秒),k=1,2,190028 XkP 10 200.5 0.525)(,15)(kkXDXE19001kkXX190021,XXX相互独立,且同分布,47500251900)(28500151900)(XDXE)47500,28500(NX近似29)2880019000()83600190010(XpXP589.43376.19162.047500285001900047500285002880030中心极限定理的意义中心极限定理的意义 在实际问题中,若某随机变量可以看作是有相互独立的大量随机变量综合作用的结果,每一个因素在总的影响中的作用都很微小,则综合作用的结果服从正态分布.31作作 业业习题六 1,2,3,4,532