1、第六章、随机样本与抽样分布第六章、随机样本与抽样分布 数理统计的任务数理统计的任务:观察现象观察现象,收集资料收集资料,创建方法创建方法,分析推断。分析推断。统计推断统计推断:研究如何利用一定的数据资料对所关心的问题作出尽研究如何利用一定的数据资料对所关心的问题作出尽可能精确、可靠的结论可能精确、可靠的结论。特点是特点是:由由“部分部分”推断推断“整体整体”。引言引言试验的设计与分析统计推断 总体总体:研究对象的全体研究对象的全体(整体整体)。个体个体:每一个研究对象。每一个研究对象。6.6.1 1.1 .1 总体总体第第6.16.1节节 简单简单随机样本随机样本样本样本:由部分个体构成的集合
2、。经常说由部分个体构成的集合。经常说,来自来自(或取自或取自 )某总体某总体的样本。的样本。样本具有二重性样本具有二重性:在抽样前在抽样前,它是随机向量它是随机向量,在抽样后在抽样后,它是数值它是数值向量向量(随机向量的取值随机向量的取值)。样本容量样本容量:样本中所含个体的个数。样本中所含个体的个数。6.1.26.1.2简单随机样本样本简单随机样本样本简单随机样本简单随机样本(s.r.s(s.r.s):):具有两个特点的样本具有两个特点的样本:代表性代表性(组成样本的每个个体与总体同分布组成样本的每个个体与总体同分布),),独立性独立性 (组成样本的个体间相互独立组成样本的个体间相互独立)。
3、如如,检验一批灯泡的质量检验一批灯泡的质量,从中选择从中选择100100只只,则则总体总体:这批灯泡这批灯泡的质量的质量个体个体:这批灯泡中的每一只这批灯泡中的每一只的质量的质量样本样本:抽取的抽取的100100只灯泡只灯泡(简单随机样本简单随机样本)的质量的质量样本容量样本容量:100:100样本检验值样本检验值:x:x1 1,x,x2 2,x,x100100X XX X1 1,X,X2 2,X,X100100100100样本值样本值 定义定义:设设X为一随机变量为一随机变量,X1,X2,Xn是一组独立且与是一组独立且与X同分布的同分布的随机变量随机变量,称称X为为总体总体;(X1,X2,X
4、n)为来自总体为来自总体X的的简单随机样本简单随机样本;n为为样本容量样本容量;每一个每一个xi(i=1,2,n)称为样本的一个称为样本的一个观测值观测值;在依次观测中在依次观测中,样本的具体观测值样本的具体观测值x1,x2,xn称为称为样本值样本值.注意注意:样本是一组独立同样本是一组独立同总总体分布的随机变量体分布的随机变量.样本的分布样本的分布统计的一般步骤统计的一般步骤:总体总体选择个体选择个体样本样本观测样本观测样本样本观察值样本观察值(数据数据)数据处理数据处理样本有关结论样本有关结论推断总体性质推断总体性质 统计量统计量6.2 6.2 统计量统计量1 1、定义、定义:设设X X1
5、 1,X,X2 2,X,Xn n是来自总体是来自总体X X的一个样本的一个样本,是是样本的函数样本的函数,若若 中不含任何未知参数中不含任何未知参数,则称则称 为为统计量统计量.)X,X,X(gn21 )X,X,X(gn21 )X,X,X(gn21 是来自总体是来自总体例例4.1.14.1.1 设设nXXX,21),(N2 未知未知,则则()()不是统计量。不是统计量。的的s.r.s,s.r.s,其中其中已知已知,n2122221n1i2Xn1n1i2in1n1i2in1n1iin1.XXX62X5X)(4)X(X3)(X2X1i 样本均值样本均值 2 2、常用统计量、常用统计量:样本方差样本
6、方差(修正修正)样本标准差样本标准差 n1iiXn1X n1i2i2)XX(1n1S n1i2i)XX(1n1S 样本样本k k阶原点矩阶原点矩 样本样本k k阶中心矩阶中心矩 n1ikikXn1A n1ikik)XX(n1B顺序统计量顺序统计量设设X X1 1,X,X2 2,X,Xn n的观察值为的观察值为x x1 1,x,x2 2,x,xn n,从小到大排序得从小到大排序得到到:x:x(1)(1),x,x(2)(2),x,x(n(n),定义定义 X X(k(k)=x=x(k(k),由此得到的由此得到的(X(X(1)(1),X,X(2)(2),X,X(n)(n)或它们的函数都称为或它们的函数
7、都称为顺序统计量顺序统计量.显然显然X X(1)(1)X X(2)(2)X X(n(n)1)1)样本中位数样本中位数 为为偶偶数数为为奇奇数数nXXnXMdnnn,21,122)21(2)2)样本极差样本极差R=XR=X(n)(n)-X-X(1)(1)3 3、较常用的顺序统计量、较常用的顺序统计量3 3)样本分布函数)样本分布函数(经验分布函数经验分布函数)()1()()1(,1)1,2,1(,0)(nkknxxnkxxxnkxxxF),(,)(xXPppnBxnFn这里服从二项分布是一个随机变量格里汶科定理格里汶科定理:设总体设总体X X的分布是的分布是F(x),F(x),则下式成立则下式成
8、立10)x(F)x(FsuplimPnxn 第第6.36.3节节 抽样分布抽样分布统计量的分布称为统计量的分布称为抽样分布抽样分布.6.3.1 6.3.1 样本均值的分布样本均值的分布定理定理1.1.设设X X1 1,X,X2 2,X,Xn n是来自总体是来自总体 的样本的样本,是样本均是样本均值值,则有则有),(N2 X)n,(NX2 注注:在大样本问题时在大样本问题时,由中心极限定理知由中心极限定理知 n1kknX)n,n(N2 注意:注意:1、两个独立的正态分布的随机变量的和仍服从正态分布、两个独立的正态分布的随机变量的和仍服从正态分布.即即:若若X1N(1,12),X2N(2,22),
9、X1,X2独立独立,则则X1+X2N(1+2,12+22)正态分布的可加性正态分布的可加性2、有限个独立的正态分布的线性函数仍服从正态分布、有限个独立的正态分布的线性函数仍服从正态分布.即即:若若XiN(i,i2),(i=1,2,.n),X1,X2,.Xn相互独立相互独立,实数实数a1,a2,.,an不全为零不全为零,则则),(n1i2i2in1iiin1iiiaaNXa )z(z 1-X(x)标准正态分布及其标准正态分布及其100%分位数分位数定义定义:设设XN(0,1),对任意对任意01,若若PX=,则称则称为标准正态分为标准正态分布的布的100%分位数分位数,记为记为 zz 例例6.3.
10、16.3.1 设设XN(0,1),分别为分别为0.95,0.975,0.75,求求X关关于于的的100%分位数分位数.解解:=0.95 时时,95.0)z(95.0 反查表得反查表得:z0.95=1.645类似可得类似可得:z0.975=1.96,z0.75=0.67 分布及其性质分布及其性质2 1.1.定义定义:6.3.26.3.22.2.性质性质:2122221nn nDnE2,22 例例6.3.16.3.1 设设 是来自总体是来自总体 的的s.r.ss.r.s,则则 服从服从()()分布。分布。n21X,X,X),(N2 n1i2X)(i).2(X2 243221)X4X3(b)X2X(
11、aX 例例 6.3.26.3.2 设设 是取自总体是取自总体N N(0,4)(0,4)的的s.r.ss.r.s,当当a a=,b b=时时,4321X,X,X,X解解:由题意得由题意得 )1,0(N)X4X3(b)1,0(N)X2X(a4321 1)X4X3(bD1)X2X(aD4321a=1/20b=1/1003 3、设、设 是来自正态总体是来自正态总体 X X 的的s.r.ss.r.s求系数求系数a,b,ca,b,c,使得使得服从服从 分布,并求其自由度。分布,并求其自由度。91X,X)2,0(N298762543221)XXXX(c)XXX(b)XX(aQ 2 3.3.的密度曲线的密度曲
12、线)n(2 Xf(x)n=1n=4n=10随着随着n n的增大的增大,密度曲线逐渐趋于平缓密度曲线逐渐趋于平缓,对称对称.定义定义:Xf(x)n(2 查表求分位数查表求分位数:(1)若若P(X)=,则则)n(21 4.4.分布的分布的100%100%分位数分位数2 解解:)10(2975.01 查表得查表得:483.201 )10(205.02 查表得查表得:940.32 例例6.3.2.设设 X (10),P(X2)=0.95,求求1,2.2 6.3.3 t 6.3.3 t 分布及其性质分布及其性质1.1.定义:定义:特点特点:关于关于y y轴对称轴对称;随着自由度的逐渐增大随着自由度的逐渐
13、增大,密度曲线逐渐接密度曲线逐渐接近于标准正态密度曲线近于标准正态密度曲线.2.t2.t分布的密度曲线分布的密度曲线:Xf(x)n(t 3.t分布的分布的100%分位数分位数:Xf(x)例例6.3.3 设设Xt(15),求求=0.975=0.005的分位数的分位数;解解:=t0.975(15),查表得查表得=2.1315 =t0.005(15),查表得查表得=-2.9467)n(t)n(t1 例例4.1.7(974)4.1.7(974)设随机变量设随机变量 X X 和和 Y Y 相互独立且都服从正态分相互独立且都服从正态分布布 ,而而 和和 分别是来自总体分别是来自总体 X X 和和 Y Y
14、的的 s.r.ss.r.s,则统计量则统计量 服从服从()()分布分布,参数为参数为().().)9,0(N91X,X 91Y,Y 29Y21Y9X1XU t t9 9解解:),1,0(9191NXXii )1,0(N3Yi故故)9(Y91)3Y(Y291i2i91i2i 与与 独立独立,YX所以所以)9(9/tYXU 6.3.4 F 6.3.4 F 分布及其性质分布及其性质1.1.定义定义2.性质性质:),(1),(1221nnFXnnFX则则若若 21,nnFF 0 0,0,1)2()2(2)(2212112221212111yynynnnynnnnynnnn 3.F3.F分布的密度曲线分
15、布的密度曲线4.F4.F分布的分布的100100%分位数分位数xf(x)n,n(F21 5.5.分位数的计算分位数的计算(1)若若P(F)=,当当 较大则较大则),(21nnF (2)若若P(F)=(比较小比较小),则则P(1/F1/)=1-,)n,n(FX21)n,n(F1121 故故),(1121nnF 例例6.3.46.3.4 设设F F(24,15),(24,15),分别求满足分别求满足.025.0XP)3(;025.0XP)2(;95.0XP)1(的的 (2)=F0.975(24,15)=2.70(3)P(X1/)=0.02544.2)24,15(1975.0 F 所以所以=0.41
16、=2.29解解(1)=F0.95(24,15)思考题:思考题:6.3.5 6.3.5 正态总体中其它几个常用的分布正态总体中其它几个常用的分布定理定理6.3.36.3.3 设设 是来自总体是来自总体 的的 s.r.ss.r.s,分别是分别是样本均值样本均值和和样本方差样本方差,则则 n21X,X,X),(N2 2S,X);1n(S)1n()1(222 相相互互独独立立与与)(2SX2)n,(NX2 );1n(S)1n(222 )1,0(Nn/X )1(/ntnSX 定理定理6.3.46.3.4 设设 是来自总体是来自总体 的的 s.r.ss.r.s,分别是分别是样本均值样本均值和和样本方差样本
17、方差,则则 n21X,X,X),(N2 2S,X 2112111,1niiniiYnYXnX 11212111niiXXnS 21222211niiYYnS2)1()1(212222112 nnSnSnSw其中:其中:则有则有 1,11212221 nnFSS、)2(11)()(2212121 nntnnSYXw 、引理:引理:设设XN(1,12),Y N(2,22),X,Y相互独立相互独立,从中分别抽从中分别抽取容量为取容量为n1,n2的样本的样本,样本均值分别记为样本均值分别记为YX;)n,(NY),n,(NX22221211 ,)(21 YXE222121)(nnYDXDYXD )1,0
18、(Nnn)()YX(22212121 求:求:),(22212121nnNYX )1,0(Nnn)()YX(22212121 例例6.3.56.3.5(993)(993)设设 是来自正态总体是来自正态总体 X X 的的s.r.s,s.r.s,91X,X S)YY(297i22i2129873126161121Z,)YX(S),XXX(Y),XX(Y 证明统计量证明统计量 Zt(2)例例6.3.66.3.6(994)(994)设设 是来自总体是来自总体nXX,1的的s.r.s,s.r.s,是样本均值是样本均值,记记),(N2 X n1i2in124n1i2i1n123n1i2in122n1i2i
19、1n121)X(S,)X(S,)XX(S,)XX(S则服从自由度为则服从自由度为 n n-1-1 的的 t t 分布的随机变量是分布的随机变量是()()n/SXn/SX1n/SX1n/SX4321TTTT 0.3174(1)2-2)1.01.01.0()1.0()1(1XPXP、01.0)()()2(22XDSE6.1)950(2.65)652(9,14)2221.FSSP9750(19.026)1(1142)1(1142(9)212211221.nSnPSP6.2)1 1一枚均匀铜币,最少需抛掷多少次才能保证其正面出现一枚均匀铜币,最少需抛掷多少次才能保证其正面出现的频率介于的频率介于0.4
20、0.4和和0.60.6之间的概率不小于之间的概率不小于90%90%。试用。试用ChebyshevChebyshev不等式以及不等式以及De MoivreDe Moivre-Laplace-Laplace中心极限定理分别计算同一中心极限定理分别计算同一问题。问题。250,685 5、某商店负责所在地区、某商店负责所在地区10001000人的商品供应,人的商品供应,某种商品在一段时间内每人需用一件的概率为某种商品在一段时间内每人需用一件的概率为0.60.6,假定在这一段时间内个人购买与否彼此无关,假定在这一段时间内个人购买与否彼此无关,问商店应预备多少件这种商品,才能以问商店应预备多少件这种商品,
21、才能以99.7%99.7%的的概率保证不会脱销。概率保证不会脱销。6436430(10)2-2)01.01.001.0()1.0(XPXP相互独立。分布的,.100011060ipXi)1,0(4.06.010006.0100011NXnnXYFnkknkkn件商品。至少预备最后得643,6.64275.2240600-N0.997)240600-N(N6 6两个影院为了两个影院为了10001000个顾客而竞争,假设每个顾客个顾客而竞争,假设每个顾客去某一个电影院完全是无所谓的,并且不依赖于去某一个电影院完全是无所谓的,并且不依赖于其他顾客的选择,为了使任何一个顾客由于缺少其他顾客的选择,为了
22、使任何一个顾客由于缺少座位而离去的概率小于座位而离去的概率小于1%1%,每一个电影院应该有多少个座位?,每一个电影院应该有多少个座位?16.332x0.99(x).)10(NnpqnpnYFan,36.77729515.8113933250041000332211000npq332npna *./.*.332npqnpnYan.个座位。个座位。至少预备至少预备最后得最后得537,其它,010,33)(02Xxxxxdyxf其它,010,)1(233)(21Yyyxdxyfy19.1)其它00)(0)(zdxeezfzxzx其它00)()()(zeezfzz其它00)(0)(zdxeezfzxz其它001)(2z02zzedxezfzzm21)(021)(021)(!)!(!)!(!212121mekmkmmekmekemkkmkmkkmk4,142,1820,80,0)(22zzzzzzzzFZ42,4120,44,0,0)(zzzzzzzfZ