1、1第五章 大数定律和中心极限定理 关键词:契比雪夫不等式大数定律中心极限定理21 大数定律背景 本章的大数定律,对第一章中提出的 “频率稳定性”,给出理论上的论证为了证明大数定理,先介绍一个重要不等式3222225.1,0,1XE XD XP XE XP XE X 定理契比雪夫不等式:设随机变量 具有数学期望方差 则对于任意都有:定理的为:等价形式,f x证明:仅就X为连续型时证之 设X的概率密度为 xP Xf x dx则 22xxf x dx 221xf x dx222D X()f x4 例1:在n重贝努里试验中,若已知每次试验事件A 出现的概率为0.75,试利用契比雪夫不等式估 计n,使A
2、出现的频率在0.74至0.76之间的概率不 小于0.90。nA解:设在 重贝努里试验中,事件 出现的次数为X,,0.75b n则X,0.75,0.1875,E Xnpn D Xnpqn nXfAn又 0.740.760.750.01XPP Xnnn而20.187510.01nn 187510.90n 18750n5 随机变量序列依概率收敛的定义 1235.1,0,0,nnnX Xlim P XXpn 。定义:设随机变量序列X若存在某常数,使得均有:则称随机变量序列依概率收敛于常数,记为:X6122115.2,101limlim1nnnkknnknnkXXnYXnPYPXn 定 理契 比 雪 夫
3、 不 等 式 的 特 殊 情 形:设 随 机 变 量 序 列 X相 互 独 立,且 具 有 相 同 的 数 学 期 望和 相 同 的 方 差,作 前个 随 机 变 量 的 算 术 平 均:则,有:111,nnkkE YEXnnn证明:由于11nnkkD YDXn211nkkD Xn2221nnn22111nkknPXn 由契比雪夫不等式得:111nknklim PXn7大数定律的重要意义:贝努里大数定律建立了在大量重复独立试验中事件出现频率的稳定性,正因为这种稳定性,概率的概念才有客观意义,贝努里大数定律还提供了通过试验来确定事件概率的方法,既然频率nA/n与概率p有较大偏差的可能性很小,我们
4、便可以通过做试验确定某事件发生的频率并把它作为相应的概率估计,这种方法即是在第7章将要介绍的参数估计法,参数估计的重要理论基础之一就是大数定理。5.3,0,1AAnApnnnAlim Ppn 定理贝努里大数定理 设事件 在每次试验中发生的概率为,记为 次独立重复试验 中 发生的次数 则有:,Anb n p证明:利用契比雪夫不等式,因故:11,AAnEE nnppnnn20,1AnpqPpnn 于是,有2211AAnpqDD nnpqnnnn1Annlim Ppn即得:82 中心极限定理背景:有许多随机变量,它们是由大量的相互独立 的随机变量的综合影响所形成的,而其中每 个个别的因素作用都很小,
5、这种随机变量往 往服从或近似服从正态分布,或者说它的极 限分布是正态分布,中心极限定理正是从数 学上论证了这一现象,它在长达两个世纪的 时期内曾是概率论研究的中心课题。95.4 定理独立同分布的中心极限定理2110,1.(,),()()().nniinYNN nnbnanP aXbnn nii此定理表明,当 充分大时,近似服从即:X(近似)从而,1X nii=1思考题:X 的近似n分布是什么?2(,)Nn答案:2122112,1,2,1,2niiniinnitxinnnXXE XD XiXnnYnXnxRlim P Yxlim Pxedtn 设随机变量X相互独立同分布,则前 个变量的和的标准化
6、变量为:有:证明略。105.5 定理德莫佛-拉普拉斯定理2215.4,(1)2tbAnannplim P abedtnpp由定理1 0 iiAiA第 次试验时 发生证明:令X第 次试验时 未发生 2201,1,lim,(1)2AtbAnannAP Appnnpa bP abedtnpp设为 次贝努里试验中 发生的次数,则对任何区间,有:12,(1,).nXXbpi则X相互独立同分布,X12,AnnXXX由于()(,(1).N np nppA即:n近似()(1)()(1)AP anbbnpnppanpnpp 11 例2:设某种电器元件的寿命服从均值为100小时的指 数分布,现随机取得16只,设它
7、们的寿命是相互 独立的,求这16只元件的寿命的总和大于1920小 时的概率。121616,XX解:记只电器元件的寿命分别为X16116iiX则只电器元件的寿命总和为X,2100,100iiE XD X由题设16116 10016000,14 100400iiXXN根据独立同分布的中心极限定理:Y近似服从 192011920P XP X 1920 16001400 10.80.2119 12 例3:某保险公司的老年人寿保险有1万人参加,每人每年交200元,若老人在该年内死亡,公司付给受益人1万元。设老年人死亡率为0.017,试求保险公司在一年内这项保险亏本的概率。200P X,10000,0.0
8、17b n pnp解:设X为一年中投保老人的死亡数,则X由德莫佛-拉普拉斯中心极限定理,保险公司亏本的概率为:1000010000 200PX 20011npnpp 12.3210.01 10思考题:求保险公司至少盈利万元的概率。答案:0.93713 例4:设某工厂有400台同类机器,各台机器发生故障的概 率都是0.02,各台机器工作是相互独立的,试求机 器出故障的台数不小于2的概率。400 0.02 0.982.8121(1)17 0.99382.8npqnpP XP Xnpq ,400,0.02 b解:设机器出故障的台数为X 则X,分别用三种方法计算:1.用二项分布计算4003992101
9、1 0.98400 0.02 0.980.9972P XP XP X 2.用泊松分布近似计算400 0.028 21011 0.0003350.0026840.9969npP XP XP X 查表得3.用正态分布近似计算14第六章 数理统计的基本概念关键词:总 体 个 体 样 本 统 计 量 2分布t 分布F 分布15引言:数理统计学数理统计学是一门关于数据收集、整理、分析 和推断的科学。在概率论中已经知道,由于大量的随机试验中各种结果的出现必然呈现它的规律性,因而从理论上讲只要对随机现象进行足够多次观察,各种结果的规律性一定能清楚地呈现,但是实际上所允许的观察永远是有限的,甚至是少量的。例如
10、:若规定灯泡寿命低于1000小时者为次品,如何确定次品率?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,以样本的信息来推断总体的信息,这是数理统计学研究的问题之一。161 总体和样本总体:研究对象的全体。如一批灯泡。个体:组成总体的每个元素。如某个灯泡。抽样:从总体X中抽取有限个个体对总体进行观察的取值过程。随机样本:随机抽取的n个个体的集合(X1,X2,Xn),n为样本容量简单随机样本:满足以下两个条件的随机样本(X1,X2,Xn)称 为简单随机样本。1.每个Xi与X同分布2.X1,X2,Xn是相互独立的随机变量说明:后面提到的样本均指简单随机样
11、本,由概率论知,若总体X 具有概率密度f(x),则样本(X1,X2,Xn)具有联合密度函数:121,nnniifx xxf x17统计量:样本的不含任何未知参数的函数。常用统计量:设(X1,X2,Xn)为取自总体X的样本 221231232123323121,1 X 2 X2 3 max,1 4 5 iiNXXXXXXXXXXX 思考题:(一)设在总体中抽取样本其中 已知,未知 指出在中哪些是统计量,哪些不是统计量,为什么?111.XniiXn样本均值1113.1,2,1 ()1,2,nkkiinkkiikAXknkBXXkn样本矩阶矩:阶中心矩:22112.(),1niiSXXSn样本方差为
12、样本标准差222,.,(),()()_,()_,()_.nXXXE XD XE XD XE S1(二)设X是总体 的样本,若,则答:只有(4)不是统计量。2n218 随机变量独立性的两个定理 1121111211122111126.,1,2,1,iiiknninnknnnkknnnYgXXYgXXXXnygxxxxRikknnngXnkYX设X是相互独立的 个随机变量,定 又设是 个连续函数,且有则 个随机变量:是相互 理:独立的。11111111111,1,2,6,2,.titntntnn tin ititXXXXit nXXXX设 个随机变量是相互独立的,又设对每一个个随机变量X是相互独立
13、的,定理:随机变量X是相互 则独立的。192 常用的分布 12222221,0,1 1,2,11nnniiiXXXNinnn设随机变量X相互独立,X 则称 服从自由度为 的,定 指式右端包含分布记为自的独立变度义:由量的个数 2212101 02 22 0 6 0.3nynxyeynfynyxe dx分布的概率密度为:其理中定:2分布x()f x010n 1n 4n 2分布的概率密度函数20 2分布的一些重要性质:22221.,2nEn Dn设则有22211221212122.,YnYnY YYYnn设且相互独立,则有22分布的可加性性质 称为,可推广到有限个的情形:221211,mmiimi
14、iiiYnY YYYn设且相互独立,则 22222,01,nnfdynynn为分布的上 分对给定的概率称满足条件的点上 分位数的值可查位数分布表 2n02分布的分位数x()f x21 2212222122223451,1()(2)(),nniiNXXXXXbXXXk 1例:设总体X已知。是取自总体X的样本 求(1)统计量 的分布;(2)设n=5,若a(X 则a,b,k各为多少?1,2,iiXYin解:(1)作变换 12,0,1 1,2,niY YYYNin显然相互独立,且 22211()nniiiiXYn2于是 22212122()(2)(0,2),(1)2XXXXN2223453452(2)
15、2(0,6),(1)6XXXXXXN123452223451222(2)()(2)26XXXXXXXXXX与2相互独立,故221,21,62.abk22 20,1,NYnXTntTtYnY n设X并且X相互独立,服从自由度为 的 分布,记 则称随变量为机定义:,01,tnf t n dttnt ntt对给定的称满足条件的点为分布的上。分布的上 分位数可位数查分分布表t分布 1212226.4 ,1,nnntt nf t ntnn 定理:分布的概率密度为:tn f xx0t分布的分位数10n 313x()f x1n 4n 2021t分布的密度函数1()()tntn 23 221211212212
16、,/,/nYnYX nFn nFFF n nY nnn设X且X独立,则称随机变量服定义:从自由度的 分布,记为 其中 称为第一自由度,称为第二自由度F分布 12121222121212122122121110,1 0,;,0 6.,05 1nnnnnnnbF n nn nxnn xxBf x n nxabB a bxxdx分定理:布的概率密度为:其中ab 11221(,),(,)FF n nFF n n性质:则24121212,1212,01,;,Fn nf x n ndxFn nF n nFn nF 对于给定的称满足条件的点为分布的上 分位数。的值可查 分布表0 x12 f x21,20nn
17、 225n 210n F分布的密度函数0 x12,Fn n()f xF分布的分位数111221(,)(,)Fn nF n n25z,0,1,01XNZP XZZ此外 设若满足条件 则称点为标准正态分布的上 分位数。1ZZ 26 正态总体样本均值和方差的分布222122222,1.X,-1 2.1 6 3.X.6 nnX XXNSNnSnS 设是总体的样本,X分别是样定理:本均值和样本方差,则有:和相互独立221/11/tn XnSXnt nSn且两者独立,由 分布定义得:221,1,6.7nXXNSn Xt nS 设是总体的样本,X和分别是样本 均值和样本方差,则有:定理:22216.60,1
18、,1/nSXNnn证明:由定理知,271222111122221222211222121222121222212,1 1,12(0,1),3 6.8 nnXXYYNNSSSFF nnSXYNnnXY 设样本和分别来自总体和 并且它们相互独立,其样本方差分别为理:时,定则:当121212221122221221111 ,2WWWWt nnSnnnSnSSSSnn其中282111222121122222212222111,111FnSnSF nnnSSn且两者独立,由 分布的定义,有:22112222122212116.61,1nSnSnn证明:1 由定理知,2212121222121212122
19、21212(2)6.6,(,),(,),(,)()()(0,1)XNYNnnXYXYNnnXYNnn由定理且 与 相互独立,所以,即2912120,111XYUNnn 213 222当=时,由(2)得2,且它们相互独立 故有分布的可加性知:22112222122211 1,1nSnSnn又由给定条件知:6.1,UV由定理知:与 相互独立2211222122112nSnSVnn121212122112wtXYUt nnVnnSnn于是按 分布知:复习思考题复习思考题 6 61.什么叫总体?什么叫简单随机样本?总体X的样本X1,X2,Xn有 哪两个主要性质?2.什么是统计量?什么是统计量的值?3.
20、样本均值和样本方差如何计算?4.N(0,1)分布,t分布,2分布和F分布的双侧、下侧、上侧分位点是 如何定义的?怎样利用附表查这些分位点的值?5.对一个正态总体的三个常用统计量及其分布是什么?6.对两个正态总体的三个常用统计量及其分布是什么?31第七章 参数估计关键词:矩估计法 极大似然估计法 置信区间 置信度32222222 ,1 ;,2,xXXf xex 参数估计是统计推断的基本问题之一,实际工作中碰到的总体它的分布类型往往是知道的,只是不知道其中的某些参数,例如:产品的质量指标 服从正态分布,其概率密度为:但参数的值未知,要求估计,有时还希望以一定的可靠性来估计 值是在某个范围内或者不低
21、于某个数。参数估计问题就是要求问题的提出:通过样本估计总体分布所包含的未知参数的值。参数估计的两种方法:点估计法和区间估计法331 参数的点估计1212,1,2,niiiniXXXikXXXi 点估计的问题就是根据样本,对每一个未知参数,构造出一个统计量,作为参数 的估计,称为。的估计量 点估计有两种方法:矩估计法和极大似然估计法34 121212121;,1,2,1 1,2,1121,212kkkvvknnvviiXF xXkE XE XvkXXXXvAXvkkAknA 设总体 的分布函数为是待估计的未知参数,假定总体 的 阶原点矩存在,则有:对于样用样本矩作为总体矩的估计,即本其 阶样本:
22、矩是:令 12122 ,12kkAkkk 解此方程即得的一个矩估计量一 矩估计法:矩估计法:351210,nXXXXX 2222例:设总体 的均值 和方差都存在,且,均未知,是取自 的一个样本,试求的矩估计。112221 1()niiXAAXXn2令解:先求总体矩:22212,E XE XD XEX22121111,nniiiiAXXAXnn再求样本矩:36 1122 01 0 0 ,nXxxf xXXXX例:设总体 的密度为:为未知参数,其他,为取自 的样本,求 的矩估计。E Xxf x dx解:110 xdx1XE XX令21XX37极大似然估计法极大似然估计法 极大似然估计的原理介绍极大
23、似然估计的原理介绍考察以下例子:假设在一个罐中放着许多白球和黑球,并假定已经知道两种球的数目之比是1:3,但不知道哪种颜色的球多。如果用返回抽样方法从罐中任取n个球,则其中黑球的个数为x的概率为:若取n=3,如何通过x来估计p值先计算抽样的可能结果x在这两种p值之下的概率:31;,1,44xn xnP x pp qqppx 其中由假设知,或 0 1 2 334,P xx1 649 6427 64 27 641 6427 6427 649 6414,P x二 38 14342731110,0,0,4644644 1 932731 2,2 0,2,46446441 2 33,xPPpxxPPxpx
24、xxp从上表看到:取更合理;类似;,取更合理;类似;:于是有39 ,;,xp xP x p xP x pPp x极大似然原 对每个 取,使是不同于理:的另一值;1122211,nnininlnL x xxln f xlnLL x xxLL x xx说明 在求的最大值时,通常转称为对数似然函换为求:数通常的最大,记为,值121212,(,),knnXf xp xx xxXXX 设总体 的概率密度为或分布率为未知参数,为参数空间,即 的取值范围极大似然。设是样本的一个估计法:观察值:1211121.2.,(,),nnniiiinL x xxf xp xL x xx 作似然函数或称为求使 的极达到最
25、大大似的 值,然估计量4032例:求矩估计部分的例 中 的极大似然估计量。221 niinlnX的极大似然估计量为:211111,nniinniiiiLf xxx解:似然函数 11ln2niinlnLlnx 111ln0 22niidlnLnxd令1lnniinx 即:1 01 0 Xxxf x的密度为:其他41 11 4,0 0,xnexXf xXXX 例:设总体 的概率密度为:其它其中是未知常量为 的样本,求的矩估计与极大似然估计。1 矩估计解:E Xxf x dx221xE Xxedx21 1()niiE XXD XXXn令D X21211()1()niiniiXXnXXXn1xxedx
26、22xxedx2222222E XEX42 2 极大似然估计11,inxiLe 此处不能通过求偏导数获得 的极大似然估计量,111,niinxnLeL 另一方面,是 的增函数,取到最大值时,达到最大。12,inxxmin x xx故 的取值范围最大不超过111 niixinex 12110niidlnLnXXd 令 121,nXmin XXX故 1XX 11niilnLnlnX 又431250,0,nXx xx例:设总体 服从上的均匀分布,未知,试由样本求出 的极大似然估计和矩估计。1 极解:大似然估计 1 0;0 xXf x因 的概率密度为:其它 121 0,0 nnx xxL故参数 的似然
27、函数为:其它 0,Ldlnnd 由于不能用微分法求:L从义发以下定出求 120,innxxmax x xx因为故 的取值范围最小为 1LnnnLxLxL又对的 是减函数,越小,越大,故时,最大;012E XxdxX由 2 矩估计 12,LnnXmax x xx所以 的极大似然估计量为2X44,0,2 X123例6:设总体 的概率分布率为:其中未知21-3现得到样本观测值2,3,2,1,3,求 的矩估计与极大似然估计。1 矩估计解:kkE Xx p E(X)=X令352223(1 32)2.2X 0.32 2 极大似然估计()(2)(1 32)(2)(1 32)L32116(23)ln()ln1
28、63ln2ln(23)L ln()36023dLd0.445表表1 1 例例2 2,例,例4 4,例,例5 5中两种估计方法所得结果中两种估计方法所得结果 例例 题题 矩估计量矩估计量极大似然估计量极大似然估计量 例 2 例 4 例 521211()1()niiniiXXnXXXn2X nX 11XXX221LniinlnX21XX462 估计量的评选标准 从表1看到,对总体的未知参数可用不同方法求得不同的估计量,如何评价好坏?通常用三条标准检验:无偏性无偏性,有效性有效性,相合性相合性 无偏性无偏性 ,nEliEm E若那么若则称为估计量 的偏差渐近称 是 的无偏估计量 12,nEXXX满足
29、 则称定义是 的一若参数 的估计个无偏量:估计量。472226,XE XD XXS例:设总体 的一阶和二阶矩存在,分布是任意的,记 证明:样本均值 和样本方差分别是 和的无偏估计。12,nXXXX证:因与 同分布,故有:X故 是 的无偏估计11niiE XEXn2211()1niiSXXn2211()1niiE SEXXn2211()1niiEXn Xn22211nn22S故是的无偏估计11niiE Xn1nn211()1niiEXXn111niiD XnD Xn48 752LnXX例:检验例 的矩估计量与极大似然估计量的无偏性。0,2XUE X解:1,nXXX由于与 同分布 2EEX12ni
30、iE Xn22nn 2X因此是 的无偏估计 LnnXX为考察的无偏性,先求的分布,5由第三章第 节知:,nnXFxF x 1 0 0 nnnXnxxfx于是 其它10nnx nxdx LnEE X因此有:1nn LnX所以是有偏的。49 纠偏方法 1,0117,nnnnEaba babanXXXnXX如果 其中是常数,且则是 的无偏估计。在例 中,取则是 的无偏估计 无偏性是对估计量的一个最常见的重要要求,是“好”估计的标准之一。无偏性的统计意义是指在大量重复试验下,由所作的估计值的平均恰是,从而无偏性保证了 没有系统误差。50 有效性有效性 121212,DD 设是 的两个无偏估计,如果对一
31、切成立 则称:比定义有效。51 1121280,12,72nXUXXXnXX nnn例:设总体是取自 的样本,已知 的两个无偏估计 为见例,判别 与哪个有效时?22142123DDXnn解:1 0 0 nnnXnxxfx由 其它 222221nnnDE XE Xn于是221221 32DDnn n因为比 更有效 1220 2nnnnxnE Xdxn22n n52相合性相合性1,0,0nnnnnXXnlim P 设为参数 的估计量,若对于任意,当时,依概率收敛于,定义:则称为 即的相有:成立,合估计量或一 致估计量53 12,EE证:11290,1 2nnXUXXXnXXn例:设总体是取自 的样
32、本,证明:和是 的相合估计。0,n 由契比雪夫不等式,当时,112DP有:2203n12所以 和都是 的相合估计。21,3Dn222Dn n222DP同理:2220n n543 区间估计 111221112,nnnXXXXXXX 点估计是由样本求出未知参数 的一个估计值,而区间估计则要由样本给出参数 的一个估计范围,并指出 该区间包含 的可靠程度。假设是总体 的一个样本,区间估计的方法是给出两个统计量 使区间以一定的可靠程度引:盖住言。55 置信区间置信度 1122111121121;01,11 ,1 7 1nnnnXF xXXXXPXXXX 定义:设总体 的分布函数含有一个未知参数,对给定的
33、值如果有两个统计量,使得:随机区间是 的双侧置信区间 则;称称为置信度;和2分别称为双侧置信下限和双侧置信上限。56 单侧置信区间11111 7 1,7,1,2,1,nnXXPXX 为 的单侧置信下限在以上定义中,若将式改为:则称随机区间是 的置信度为单侧置 的 。信区间。2221172,1,731nnXXPXX 又若将式改为:则称随机区间是 的置信度为 为 的的单侧置信上限单。侧置信区间。57 正态总体均值方差的区间估计2,N 一 单个正态总体的情形2212,1nXXXNXS 来自和分别为样本均值和方差 置信度为1.均值 的置信区间 21 已知时,0,1XXNn是 的无偏估计 由 21XPZ
34、n 有221P XZXZnn 即22,XZXZnn置信区间为:1-?思考题:均值 的置信度的置信下限是什么呢:X-nz答案58 22 未知时1Xt nSn由 22111XPtntnSn 有22111SSP XtnXtnnn 即221,1SSXtnXtnnn置信区间为:0t1220t 5922.方差的置信区间设 未知22211nSn由 22212221111nSPnn 有2222221211111nSnSPnn 即222221211,11nSnSnn置信区间为:222121221-?2思考题:方差的置信度的置信上限是什么221:(n-1)S.(1)n答案60 222210,36,15.,95 1
35、16;2,16;X cmNcmS 例:设某种植物的高度服从正态分布 随机选取棵 其平均高度为就以下两种情形 求 的 双侧置信区间:未知 36,15,4nX解:11.961.960.95P XXnn由1.96 41.961513.69336Xn得:1.96 41.961516.30736Xn13.693,16.307的置信区间为61 2 36,15,16nXS20.0250.0251 0.05SSP XtXtnn 由0.025352.0301t查表得:2.0301 42.0301 4 1513.647,1516.35366又:13.647,16.353的置信区间为 9912求置信度为 时 两种情
36、况下 的置信区间?1 13.333,16.667 2 13.184,16.815?答案:62 12比较两种情形下 的置信区间:22,16,13.693,16.307已知置信区间:22,16,13.647,16.353S未知置信区间:,tX S n2但第二种情形更实用,因为多数时候,未知用 分布求 的置信区间只依赖于样本数据及统计量区间短精度高区间长精度低63置信区间的含义:,若反复抽样多次 每个样本值确定一个区间每个这样的区间或者包含 的真值 或者不包含 的真值。见下图10,0.05,95%0.01,99%在例 中 当即置信水平为时,20个区间中只有大约1个不包含 值;当即置信水平为时,100
37、个区间中将有99个包含 值;ba0.9 90.0 0 50.0 0 5642211,25,4.25.9599S例:一个园艺科学家正在培养一个新品种的苹果 这种苹果除了口感好和颜色鲜艳以外 另一个重要特征是单个重量差异不大。为了评估新苹果 她随机挑选了个测试重量 单位:克其样本方差为试求的置信度为 和的的置信区间。95%解:置信度为时222221 0.0250.025111 0.05nSnSP 220.9750.0252439.4,2412.4;查表得:25 14.2525 14.25 2.59,8.2339.412.4又:2.59,8.232的置信区间为20.99520.00599%,2445
38、.6,249.89,25 14.252.24,45.625 14.2510.319.89置信度为时2.24,10.312的置信区间为65221122,NN 二 两个正态总体的情形1212222121112222211211,11,1.nnnnijijXXXNY YYNXX YYSSnn 来自来自和分别为第一 二个总体的样本方差 置信度为121.的置信区间 22121 ,已知时22121212,XYNnn由 122212120,1XYNnn有 2212212XYZnn置信区间为:66 2222122 ,未知1212126.8,211wXYt nnSnn此时由第六章定理221122221211 ,
39、2wwwnSnSSSSnn其中12212112wXYtnnSnn置信区间为:6721222.的置信区间12,设未知22121222121,1SSF nn由 2212121222122121,11,11SSP FnnFnn 有 22112212122212211,1,11,1SSFnnFnnSS置信区间为:22211122212122221221111,11,1SSPFnnFnnSS 即 68 例12:两台机床生产同一个型号的滚珠,从甲机床生产的滚 珠中抽取8个,从乙机床生产的滚珠中抽取9个,测得这 些滚珠得直径(毫米)如下:甲机床 15.0 14.8 15.2 15.4 14.9 15.1 1
40、5.2 14.8 乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0 22112212121212211222,1 0.18,0.24,0.902 0.904 ,0.90X YXNYN 设两机床生产的滚珠直径分别为且求的置信度为的置信区间;若未知,求的置信度为的置信区间;若未知,求的置信度为的置信区间;69221122 8,15.05,0.04579,14.9,0.0575nxSnyS解:;12122 0.90当时,的置信度为的未知置信区间为:11221 ,0.0.18,0.2490当时 求的置信度为的 置信区间为:2212212 XYZnn0.0
41、51.645,0.018,0.318Z查表得:从而所求区间为0.051211151.7531,0.228,0.486WtSnn21212112WXYtnnSnn0.044,0.344从而所求区间为120当 的置信区间包含 时,可以认为两个总体的均值之间没有显著差异。70说明 置信区间包含两方面含义 1.置信水平 2.区间长度置信水平越高,区间越大,但区间精确度差置信区间越小,精确度高,但置信水平差 2112223 ,0.90 当时,的置信度为的置未知信区间为:22112221212122211,1,11,1SSFnnFnnSS0.050.950.05117,83.50,7,80.2683.73
42、8,7FFF由21220.900.227,2.965得的置信度为的置信区间为2122当的置信区间包含1时,可以认为两个总体的方差之间没有显著差异。7121221222已知2212,已知22122未知12,未知2XZn21SXtnn222221211,11nSnSnn122未知未知2212212XYZnn2122122212121221,1,111,1SFnnSSFnnS21212112wX Y tnnSnn 0,1XZNn1Xtt nSn222211nSn122212120,1XYZNnn22121222121,1SSFF nn121212211wXYtt nnSnnXZnXZn11SXtnn
43、SXtnn22212221111nSnnSn2212121222121212XYZnnXYZnn22112211222221122122211,111,1SFnnSSFnnS121212121212112112wwX Y t n nSn nX Y t n nSn n 正态总体均值、方差的置信区间与单侧置信限1置信度复习思考题复习思考题 7 71.总体未知参数矩估计的思想方法是什么?试写出0-1分布、二项分布b(m,p)、泊松分布()、均匀分布U(a,b)、正态分布N(,2)中有关参数的矩估计式2.极大似然估计的主要步骤是什么?3.未知参数的估计量与估计值有什么区别?5.估计量的三个基本评价标准
44、是什么?你能理解它们的含义吗?6.求参数置信区间的一般方法是什么?对正态总体,试从有关 的统计量自行导出几类参数的置信区间?7.置信度的含义是什么?置信度、区间长度和样本容量的关系怎样?122121,1(),1 (),4.,niiniiXnXXnSXXnE XE XE SD X总体 有容量为 的样本 样本均值 样本方差有性质这是否只对正态总体成立?复习思考题复习思考题 8 81.假设检验的基本思想是什么?其中使用了一条什么原理?2.检验的显著性水平的意义是什么?3.比较双边、左边和右边检验的拒绝域。4.使用U检验法可以进行哪些假设检验?5.使用t检验法可以进行哪些假设检验?6.使用2检验法可以进行哪些假设检验?7.使用F检验法可以进行哪些假设检验?8.正态总体期望与方差的区间估计和假设检验两者之间有什么 相似之处?9.成对数据差的t检验适用于哪些特殊场合?10.分布拟合的2检验的基本步骤是什么?74课件结束!2022-11-26
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。