1、第六章、样本及抽样分布第六章、样本及抽样分布第一节:随机样本第一节:随机样本第二节:抽样分布第二节:抽样分布引言引言 随机变量及其所伴随的概率分布全面描述了随机随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律。现象的统计性规律。 概率论的许多问题中,随机变量的概率分布通常概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。是在这已知是基础上得出来的。 但实际中,情况往往并非如此,一个随机现象所但实际中,情况往往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分
2、布概服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。型,但是其中的某些参数是未知的。例如:例如: 某公路上行驶车辆的速度服从什么某公路上行驶车辆的速度服从什么分布是未知的分布是未知的; 电视机的使用寿命服从什么电视机的使用寿命服从什么分布是未知的分布是未知的; 产品是否合格服从两点分布,但参数产品是否合格服从两点分布,但参数合格率合格率p是是未知的;未知的; 数理统计的任务则是数理统计的任务则是以概率论为基础,根据试验以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合所得到的数据,对研究对象的客观统计规律性做出合理的推断。理的推断。 从第本章开
3、始,我们学习数理统计的基础知识。从第本章开始,我们学习数理统计的基础知识。主要有主要有参数估计、假设检验、方差分析、回归分析参数估计、假设检验、方差分析、回归分析等等内容内容.本章主要介绍数理统计的一些基本术语、基本本章主要介绍数理统计的一些基本术语、基本概念、重要的统计量及其分布,它们是后面各章的基概念、重要的统计量及其分布,它们是后面各章的基础。础。学习的基本内容学习的基本内容第一节 随机样本总体和样本总体和样本小结小结一、总体与样本一、总体与样本 一一个统计问题总有它明确的研究对象个统计问题总有它明确的研究对象.1 1、总体与个体总体与个体研究某批灯泡的质量研究某批灯泡的质量 研究对象的
4、全体称为研究对象的全体称为总体总体,总体总体总体中所包含的个体的个数称为总体的总体中所包含的个体的个数称为总体的容量容量.总体中每个成员称为总体中每个成员称为个个体体总体总体有限总体有限总体无限总体无限总体 因此在理论上可以把总体与概率分布等同起来因此在理论上可以把总体与概率分布等同起来. 我们关心的是总体中的个体的某项指标我们关心的是总体中的个体的某项指标( (如人的如人的身高、灯泡的寿命身高、灯泡的寿命, ,汽车的耗油量汽车的耗油量) ) . 由于每个个体的出现是随机的,所以相应的数量指由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性标的出现也带有随机性 . 从而从而可以把
5、这种数量指标看可以把这种数量指标看作一个随机变量作一个随机变量X ,因此随机变量,因此随机变量X的分布就是该数的分布就是该数量指标在总体中的分布量指标在总体中的分布. 总体就可以用一个随机变量及其分布来描述总体就可以用一个随机变量及其分布来描述. 例如例如:研究某批灯泡的寿命时,关心的数量指标研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量就是寿命,那么,此总体就可以用随机变量X表示,表示,或用其分布函数或用其分布函数F(x)表示表示.某批某批灯泡的寿命灯泡的寿命总体总体 寿命寿命 X 可用一概率可用一概率(指数)分布来刻划(指数)分布来刻划鉴于此,常用随机变量的记号
6、鉴于此,常用随机变量的记号或用其分布函数表示总体或用其分布函数表示总体. 如如说总体说总体X或总体或总体F(x) .体体寿命总体是指数分布总寿命总体是指数分布总 类似地,在研究某地区中学生的营养状况时类似地,在研究某地区中学生的营养状况时 ,若关心的数量指标是身高和体重,我们用若关心的数量指标是身高和体重,我们用X 和和Y 分分别表示身高和体重,那么此总体就可用二维随机变别表示身高和体重,那么此总体就可用二维随机变量量(X,Y)或其联合分布函数或其联合分布函数 F(x,y)来表示来表示. 统计中,总体这个概念的要旨是:统计中,总体这个概念的要旨是:总体就是一个随机变量总体就是一个随机变量(向量
7、向量)或一个概或一个概率分布率分布.2 2、样本样本 总体中抽出若干个体而成的集体总体中抽出若干个体而成的集体,称为称为样本样本。样本中所含个体的个数,称为样本中所含个体的个数,称为样本容量样本容量。从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为5抽到哪抽到哪5辆是随机的辆是随机的 一旦取定一组样本一旦取定一组样本X1, ,Xn ,得到得到n个具体的数个具体的数 (x1,x2,xn),称为样本的一次观察值,简称,称为样本的一次观察值,简称样本值样本值 .21nXXXnX,观观察察,其其结结果果依依次次记记为为次次重重复复、独独立立在在相相同同的的条条件件下下
8、,进进行行对对总总体体分布.体随机 变随机变量具有的一个随机样一个随机是来自 总来自X,X,这样得到的随机变量Xn21最常用的一种抽样叫作最常用的一种抽样叫作“简单随机抽样简单随机抽样”,其特点:,其特点:1. 代表性代表性: X1,X2,Xn中每一个与所考察的总体有中每一个与所考察的总体有 相同的分布相同的分布.2. 独立性独立性: X1,X2,Xn是相互独立的随机变量是相互独立的随机变量.注注1:所谓样本就是:所谓样本就是n个与总体同分布的随机变量。个与总体同分布的随机变量。注注2定义:定义:.,212121个个独独立立的的观观察察值值的的又又称称为为称称为为样样本本值值,值值简简称称样样
9、本本,它它们们的的观观察察的的简简单单随随机机样样本本,)得得到到的的容容量量为为、或或总总体体(或或总总体体为为从从分分布布函函数数变变量量,则则称称的的、相相互互独独立立的的随随机机是是具具有有同同一一分分布布函函数数的的随随机机变变量量,若若是是具具有有分分布布函函数数设设nXxxxnXFFXXXFXXXFXnnn 由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本简单随机样本,它可以用与总体独立同分布的它可以用与总体独立同分布的n个相互独立的随机个相互独立的随机变量变量X1,X2,Xn表示表示. 简单随机样本是应用中最常见的情形,今后,简单随机样本是应用中最常见的情形
10、,今后,当说到当说到“X1,X2,Xn是取自某总体的样本是取自某总体的样本”时,若时,若不特别说明,就指简单随机样本不特别说明,就指简单随机样本.=F(x1) F(x2) F(xn) 若总体的分布函数为若总体的分布函数为F(x)、概率密度函数为、概率密度函数为f(x),则其简单随机样本的联合分布函数为则其简单随机样本的联合分布函数为),(2*nxxxF其简单随机样本的联合概率密度函数为其简单随机样本的联合概率密度函数为),(2*nxxxf=f(x1) f(x2) f(xn) 事实上我们抽样后得到的资料都是具体的、确事实上我们抽样后得到的资料都是具体的、确定的值定的值. 如我们从某班大学生中抽取
11、如我们从某班大学生中抽取10人测量身高人测量身高,得到得到10个数,它们是样本取到的值而不是样本个数,它们是样本取到的值而不是样本. 我我们只能观察到随机变量取的值而见不到随机变量们只能观察到随机变量取的值而见不到随机变量.3. 总体、样本、样本值的关系总体、样本、样本值的关系总体(理论分布)总体(理论分布) ? 样本样本 样本值样本值 统计是从手中已有的资料统计是从手中已有的资料-样本值,去推断总样本值,去推断总体的情况体的情况-总体分布总体分布F(x)的性质的性质. 总体分布决定了样本取值的概率规律,也就是总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断
12、样本取到样本值的规律,因而可以由样本值去推断总体总体. 样本是联系二者的桥梁样本是联系二者的桥梁 由样本值去推断总体情况,需要对样本值进由样本值去推断总体情况,需要对样本值进行行“加工加工”,这就要构造一些样本的函数,它把,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来样本中所含的(某一方面)的信息集中起来. 统计量统计量及其分布及其分布如何对样本进行加工?如何对样本进行加工?第二节 抽样分布统计量与经验分布函数统计量与经验分布函数统计三大抽样分布统计三大抽样分布几个重要的抽样分布定理几个重要的抽样分布定理小结小结1. 统计量统计量 不含任何未知参数的样本的函数称为统计量
13、不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量它是完全由样本决定的量.一、统计量与经验分布函数一、统计量与经验分布函数.),(,),(,21212121个个统统计计量量称称是是一一中中不不含含未未知知参参数数,则则的的函函数数,若若是是的的一一个个样样本本,是是来来自自总总体体设设nnnnXXXggXXXXXXgXXXX不是统计量,为什么?不是统计量,为什么?哪些哪些之中哪些是统计量之中哪些是统计量试指出试指出的简单随机样本的简单随机样本是来自是来自数,数,是未知参是未知参,其中,其中服从两点分布服从两点分布、设总体、设总体,)( ,2,max,.,), 1(22155512
14、151XXpXXXXXXXppbXii .2)( ,max,52155121是是未未知知数数)不不是是统统计计量量(因因为为都都是是统统计计量量,但但ppXXXXXXii 例例解解:请注意请注意 :.),X(),(,X)2(21212121的的观观察察值值计计量量也也是是统统则则是是一一个个样样本本的的观观察察值值的的一一个个样样本本是是来来自自总总体体设设nnnnXXfxxxfxxxXXX(1)统计量是一个随机变量。)统计量是一个随机变量。 几个常见统计量几个常见统计量样本平均值样本平均值niiXnX11它反映了它反映了总体均值总体均值的信息的信息样本方差样本方差niiXXnS122)(11
15、它反映了总体它反映了总体方差的信息方差的信息 niiXnXn12211样本标准差样本标准差 niiXXnS12)(11nikikXnA11它反映了总体它反映了总体k 阶矩的信息阶矩的信息样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩nikikXXnB1)(1 k=1,2,它反映了总体它反映了总体k 阶阶中心矩的信息中心矩的信息统计量的观察值统计量的观察值, 2 , 1)(11, 2 , 11;)(11)(11;111121212 kxxnbkxnxxnsxxnsxnxnikiknikikniiniinii请注意请注意 :., 2 , 11)(1 kXnAnXEkXkpnikikkk时,时
16、,存在,则当存在,则当阶矩阶矩的的若总体若总体.),(),(2121为连续函数为连续函数其中其中可将上述性质推广为可将上述性质推广为由依概率收敛性质知,由依概率收敛性质知,再再ggAAAgkpk .根据根据这就是矩估计法的理论这就是矩估计法的理论., 2 , 1)(,2121上述结论上述结论再由辛钦大数定律可得再由辛钦大数定律可得同分布同分布独立且与独立且与有有同分布,同分布,独立且与独立且与由由事实上事实上nkXEXXXXXXXXkkikknkkn 2. 经验分布函数经验分布函数.,)(,2121的随机变量的个数的随机变量的个数中不大于中不大于表示表示的一个样本,用的一个样本,用是总体是总体
17、设设xxxxxxsFXXXnn xxsnxFn)(1)(经验分布函数为经验分布函数为定义定义 2, 121,321, 0)()(21133xxxxFxFF若若若若若若的观察值为的观察值为,则经验分布函数,则经验分布函数,具有一个样本值具有一个样本值设总体设总体例例)1, 2 , 1(, 1, 0)()(.,)()1()()1()()2()1(21 nkxxxxxnkxxxFxFxxxnxxxnkknnnn若若若若若若的观察值为的观察值为则经验分布函数则经验分布函数如下:如下:将它们按大小次序排列将它们按大小次序排列值值的样本的样本是总体的一个容量为是总体的一个容量为一般,设一般,设 二、统计三
18、大抽样分布二、统计三大抽样分布)(22n记为记为2分布分布1、定义定义: 设设 相互独立相互独立, 都服从正态分布都服从正态分布N(0,1), 则称随机变量:则称随机变量: 所服从的分布为所服从的分布为自由度为自由度为 n 的的 分布分布.nXXX,21222212nXXX22分布是由正态分布派生出来的一种分布分布是由正态分布派生出来的一种分布. . 2 2 分布分布2分布的密度函数为分布的密度函数为000)2(21);(2122xxexnnxfxnn来定义来定义.其中伽玛函数其中伽玛函数 通过积分通过积分0,)(01xdttexxt)(x2),(2N1. 设设 相互独立相互独立, 都服从正态
19、分布都服从正态分布nXXX,21则则)()(121222nXnii).(21221nnXX 则则),(),(222121nXnX这个性质叫这个性质叫 分布的可加性分布的可加性.2分布的性质分布的性质2 ,),(22充充分分大大时时则则当当nn 3若若的的分分布布nnX2 近似正态分布近似正态分布N(0,1).(应用中心极限定理可得应用中心极限定理可得 ) 2设设 且且X1,X2相互独立,相互独立, E(X)=n, D(X)=2n.,),(.222分分布布的的数数学学期期望望与与方方差差若若 n1)()(),1 , 0(2 iiiXDXENX故故事实上,由事实上,由213)()()(2242 i
20、iiXEXEXD.2)()(,)()(122122nXDDnXEEniinii 分布的分位点分布的分位点2. 5 )(222)()(ndyyfnP, 10 ,对于给定的正数对于给定的正数称满足条件称满足条件.382.34)25()(.)()(20.1222 可通过查表求,例可通过查表求,例如图所示如图所示分位点,分位点,分布的上分布的上为为的点的点nnn)(2n 概率密度函数为:概率密度函数为: tntnnnthn212)1()2(2)1()( 定义定义: 设设XN(0,1) , Y , 且且X与与Y相互相互 独立,则称变量独立,则称变量nYXt 所服从的分布为所服从的分布为自由度为自由度为
21、n的的 t 分布分布.)(2n2、t 分布分布).(ntt记为记为分布的分布的分布又称为学生氏分布分布又称为学生氏分布)(. ntt分布的性质:分布的性质:t)2()2()(, 0)(),(. 1 nnntDtEntttn与与方方差差为为:其其数数学学期期望望分分布布的的具具有有自自由由度度为为.21)(lim,.0. 222tnethntt 函函数数的的性性质质有有由由再再分分布布概概率率密密度度的的图图形形,其其图图形形近近似似于于标标准准正正态态充充分分大大时时当当对对称称分分布布的的密密度度函函数数关关于于).1 , 0(Ntn近似近似足够大时,足够大时,即当即当.)()(如图所示如图
22、所示分位点分位点分布的上分布的上为为的点的点 ntnt)(nt )()()(ntdtthnttp称满足条件称满足条件,对于给定的对于给定的分布的分位点分布的分位点, 10. 3 t)(nt )()(1ntntt 分位点的性质:分位点的性质:分布的上分布的上.1315. 2)15()(025. 0 tntt求得,例求得,例可查表可查表分位点分位点分布的上分布的上 zntn)(45的值,可用正态近似的值,可用正态近似时,对于常用的时,对于常用的当当由定义可见,由定义可见,3、F分布分布121nUnVF F(n2,n1),(),(2212nVnU 定义定义: 设设 U 与与V 相互相互独立,则称随机
23、变量独立,则称随机变量服从服从自由度为自由度为n1及及 n2 的的F分布分布,n1称为称为第自第自由度由度,n2称为称为第二自由度第二自由度,记作,记作21nVnUF FF(n1,n2) .即它的数学期望并不依赖于第一自由度即它的数学期望并不依赖于第一自由度n1. 0001)()()()()()(2222221211211212121yyyyynnnnnnnnnnnn1.F分布的数学期望为分布的数学期望为:2)(22 nnFE若若n22若若FF(n1,n2), F的概率密度为的概率密度为分分布布的的性性质质F ),(21nnF 2.F分布的分位数分布的分位数称满足条件称满足条件,对于给定的对于
24、给定的, 10 ),(2121)(),(nnFdyynnFFp.),(),(2121如图所示如图所示分位点分位点分布的上分布的上为为的点的点 nnFnnF分位点的性质:分位点的性质:分布的上分布的上 F),(1),(12211nnFnnF 357. 080. 21)12, 9(1)9 ,12(,.05. 095. 0 FFF例例分位点可查表求得分位点可查表求得分布的上分布的上三、几个重要的抽样分布定理三、几个重要的抽样分布定理有有和样本方差和样本方差则样本均值则样本均值来自总体的一个样本,来自总体的一个样本,是是,方差为,方差为的均值为的均值为设总体设总体2212,XSXXXXn 2(),()
25、,E XD Xn 22)( SE 当总体为当总体为正态分布正态分布时,给出几个重要的抽样分时,给出几个重要的抽样分布定理布定理. niiXnXnEsE122211)(事实上事实上 niiXnEXEn122)()(11 21222211 ninnn 定理定理 1 (样本均值的分布样本均值的分布) 设设 X1, X2, , Xn 是来自正态总体是来自正态总体),(2 N的样本,的样本, 是样本均值,则有是样本均值,则有),(2nNX ) 1 , 0( NnX 即即X01( , )XNn n取不同值时样本取不同值时样本均值均值 的分布的分布X请注意请注意 :.X2本均值本均值可用本定理计算样可用本定
26、理计算样时,时,在已知总体在已知总体 ),(2nNX 定理定理 2 (样本方差的分布样本方差的分布) 1() 1() 1 (222nSn 设设X1,X2,Xn是来自正态总体是来自正态总体),(2 N的样本的样本,2SX和分别为样本均值和样本方差分别为样本均值和样本方差, 则有则有.)2(2独独立立与与SXn取不同值时取不同值时 的分布的分布22) 1(Sn 定理定理 3 (样本均值的分布样本均值的分布) 设设X1,X2,Xn是取自正态总体是取自正态总体),(2 N的样本的样本,2SX和分别为样本均值和样本方差分别为样本均值和样本方差,则有则有) 1(ntnSX 且相互独立且相互独立分布的定义可
27、得分布的定义可得、由定理由定理证证)1()1(,)1 , 0(t2,1222 nSnNnX)1()1(22 ntSnnX则则.X2本均值时,可用本定理计算样在未知总体 定理定理 4 (两总体样本均值差、样本方差比的分布两总体样本均值差、样本方差比的分布) ) 2(112) 1() 1()(221212122221121 nntnnnnSnSnYX、,设),(),(2221 NYNXYX和分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,1nX是来自是来自X的样本的样本,是取自是取自Y的样本的样本,这两个样本的样本方差这两个样本的样本方差,则有则有2221SS 和Y1,Y2,
28、2nY样本均值,样本均值,分别是分别是)1, 1(12122222121 nnFSS、四、例题四、例题例例1.57. 522)1(.5 .12,25),12(22 SXNX未止,但已知样本方差未止,但已知样本方差);(;(知知已已如果如果的概率的概率大于大于求样本均值求样本均值的样本的样本抽取容量为抽取容量为服从正态分布服从正态分布设总体设总体解解 2521251225212512(1).XP.XP1063. 0)25. 1(125. 14 . 012 XP 059. 1255 .1225125 .12)2( TPSSXPXP .15. 05 .12.15. 0059. 1,059. 1)24
29、(,2415. 0 XPTPtt故故有有即即分分布布表表的的查查自自由由度度为为六、小结六、小结 在这一节中我们学习了统计量的概念在这一节中我们学习了统计量的概念 , 几几个重要的统计量及其分布个重要的统计量及其分布 ,即抽样分布即抽样分布. 要求大要求大家熟练地掌握它们家熟练地掌握它们 .常用的统计量常用的统计量样本平均值样本平均值niiXnX11样本方差样本方差niiXXnS122)(11样本标准差样本标准差 niiXXnS12)(11样本样本k阶原点矩阶原点矩nikikXnA11样本样本k阶中心矩阶中心矩nikikXXnB1)(1抽样分布抽样分布分分布布2 ).(,)1 , 0(,2221221nnXNXXniin 记记为为分分布布的的服服从从自自由由度度为为则则称称随随机机变变量量,且且均均服服从从正正态态分分布布相相互互独独立立设设t 分布分布).(),()1 , 0(2ntttnnYXtYXnYNX分分布布,记记为为的的服服从从自自由由度度为为随随机机变变量量相相互互独独立立,则则称称与与且且,设设 F分布分布).,(,),()(2121212212nnFFnnnVnUFVUnVnU记记为为)的的分分布布服服从从自自由由度度为为(随随机机变变量量相相互互独独立立,则则称称与与,设设
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。