浙大概率论与数理统计课件第六章样本及抽样分布.ppt

上传人(卖家):晟晟文业 文档编号:4286911 上传时间:2022-11-26 格式:PPT 页数:41 大小:1.61MB
下载 相关 举报
浙大概率论与数理统计课件第六章样本及抽样分布.ppt_第1页
第1页 / 共41页
浙大概率论与数理统计课件第六章样本及抽样分布.ppt_第2页
第2页 / 共41页
浙大概率论与数理统计课件第六章样本及抽样分布.ppt_第3页
第3页 / 共41页
浙大概率论与数理统计课件第六章样本及抽样分布.ppt_第4页
第4页 / 共41页
浙大概率论与数理统计课件第六章样本及抽样分布.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

1、第六章、样本及抽样分布第六章、样本及抽样分布第一节:随机样本第一节:随机样本第二节:抽样分布第二节:抽样分布2022-10-42022-10-41 1引言引言 随机变量及其所伴随的概率分布全面描述了随机随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律。现象的统计性规律。概率论的许多问题中,随机变量的概率分布通常概率论的许多问题中,随机变量的概率分布通常是已知的,或者假设是已知的,而一切计算与推理都是已知的,或者假设是已知的,而一切计算与推理都是在这已知是基础上得出来的。是在这已知是基础上得出来的。但实际中,情况往往并非如此,一个随机现象所但实际中,情况往往并非如此,一个随机现象所服从

2、的分布可能是完全不知道的,或者知道其分布概服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。型,但是其中的某些参数是未知的。2022-10-42022-10-42 2例如:例如:某公路上行驶车辆的速度服从什么某公路上行驶车辆的速度服从什么分布是未知的分布是未知的;电视机的使用寿命服从什么电视机的使用寿命服从什么分布是未知的分布是未知的;产品是否合格服从两点分布,但参数产品是否合格服从两点分布,但参数合格率合格率p p是是未知的;未知的;数理统计的任务则是数理统计的任务则是以概率论为基础,根据试验以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合所

3、得到的数据,对研究对象的客观统计规律性做出合理的推断。理的推断。2022-10-42022-10-43 3 从第本章开始,我们学习数理统计的基础知识。从第本章开始,我们学习数理统计的基础知识。主要有主要有参数估计、假设检验、方差分析、回归分析参数估计、假设检验、方差分析、回归分析等等内容内容.本章主要介绍数理统计的一些基本术语、基本本章主要介绍数理统计的一些基本术语、基本概念、重要的统计量及其分布,它们是后面各章的基概念、重要的统计量及其分布,它们是后面各章的基础。础。学习的基本内容学习的基本内容2022-10-42022-10-44 4第一节 随机样本总体和样本总体和样本小结小结2022-1

4、0-42022-10-45 5一、总体与样本一、总体与样本 一一个统计问题总有它明确的研究对象个统计问题总有它明确的研究对象.1 1、总体与个体总体与个体研究某批灯泡的质量研究某批灯泡的质量 研究对象的全体称为研究对象的全体称为总体总体,总体总体总体中所包含的个体的个数称为总体的总体中所包含的个体的个数称为总体的容量容量.总体中每个成员称为总体中每个成员称为个个体体总体总体有限总体有限总体无限总体无限总体 2022-10-42022-10-46 6因此在理论上可以把总体与概率分布等同起来因此在理论上可以把总体与概率分布等同起来.我们关心的是总体中的个体的某项指标我们关心的是总体中的个体的某项指

5、标(如人的身高、如人的身高、灯泡的寿命灯泡的寿命,汽车的耗油量汽车的耗油量).).由于每个个体的出现是随机的,所以相应的数量由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性指标的出现也带有随机性.从而从而可以把这种数量指可以把这种数量指标看作一个随机变量标看作一个随机变量X X ,因此随机变量,因此随机变量X X的分布就是的分布就是该数量指标在总体中的分布该数量指标在总体中的分布.总体就可以用一个随机变量及其分布来描述总体就可以用一个随机变量及其分布来描述.2022-10-42022-10-47 7 例如例如:研究某批灯泡的寿命时,关心的数量指标研究某批灯泡的寿命时,关心的数量

6、指标就是寿命,那么,此总体就可以用随机变量就是寿命,那么,此总体就可以用随机变量X X表示,表示,或用其分布函数或用其分布函数F F(x x)表示表示.某批某批灯泡的寿命灯泡的寿命总体总体 寿命寿命 X X 可用一概率可用一概率(指数)分布来刻划(指数)分布来刻划鉴于此,常用随机变量的记号鉴于此,常用随机变量的记号或用其分布函数表示总体或用其分布函数表示总体.如如说总体说总体X X或总体或总体F F(x x).).体体寿命总体是指数分布总寿命总体是指数分布总2022-10-42022-10-48 8 类似地,在研究某地区中学生的营养状况时类似地,在研究某地区中学生的营养状况时 ,若关心的数量指

7、标是身高和体重,我们用若关心的数量指标是身高和体重,我们用X X 和和Y Y 分分别表示身高和体重,那么此总体就可用二维随机变别表示身高和体重,那么此总体就可用二维随机变量量(X X,Y Y)或其联合分布函数或其联合分布函数 F F(x x,y y)来表示来表示.统计中,总体这个概念的要旨是:统计中,总体这个概念的要旨是:总体就是一个随机变量总体就是一个随机变量(向量向量)或一个概或一个概率分布率分布.2022-10-42022-10-49 92 2、样本样本 总体中抽出若干个体而成的集体总体中抽出若干个体而成的集体,称为称为样本样本。样本中所含个体的个数,称为样本中所含个体的个数,称为样本容

8、量样本容量。从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为5 5抽到哪抽到哪5 5辆是随机的辆是随机的2022-10-42022-10-41010 一旦取定一组样本一旦取定一组样本X X1 1,,X ,Xn n ,得到得到n n个具体的数个具体的数 (x x1 1,x x2 2,x xn n),称为样本的一次观察值,简称,称为样本的一次观察值,简称样本值样本值.21nXXXnX,观察,其结果依次记为观察,其结果依次记为次重复、独立次重复、独立在相同的条件下,进行在相同的条件下,进行对总体对总体分布.体随机变随机变量具有的一个随机样一个随机是来自总来自X,X,

9、这样得到的随机变量Xn21最常用的一种抽样叫作最常用的一种抽样叫作“简单随机抽样简单随机抽样”,其特点:,其特点:1.1.代表性代表性:X X1 1,X X2 2,X Xn n中每一个与所考察的总体有中每一个与所考察的总体有 相同的分布相同的分布.2.2.独立性独立性:X X1 1,X X2 2,X Xn n是相互独立的随机变量是相互独立的随机变量.注注1 1:所谓样本就是:所谓样本就是n n个与总体同分布的随机变量。个与总体同分布的随机变量。注注2 22022-10-42022-10-41111定义:定义:.,212121个独立的观察值个独立的观察值的的又称为又称为称为样本值,称为样本值,值

10、值简称样本,它们的观察简称样本,它们的观察的简单随机样本,的简单随机样本,)得到的容量为)得到的容量为、或总体、或总体(或总体(或总体为从分布函数为从分布函数变量,则称变量,则称的、相互独立的随机的、相互独立的随机是具有同一分布函数是具有同一分布函数的随机变量,若的随机变量,若是具有分布函数是具有分布函数设设nXxxxnXFFXXXFXXXFXnnn 由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单随机样本简单随机样本,它可以用与总体独立同分布的它可以用与总体独立同分布的n n个相互独立的随机个相互独立的随机变量变量X X1 1,X X2 2,X Xn n表示表示.2022-10-

11、42022-10-41212 简单随机样本是应用中最常见的情形,今后,简单随机样本是应用中最常见的情形,今后,当说到当说到“X X1 1,X X2 2,X Xn n是取自某总体的样本是取自某总体的样本”时,若时,若不特别说明,就指简单随机样本不特别说明,就指简单随机样本.=F=F(x x1 1)F F(x x2 2)F F(x xn n)若总体的分布函数为若总体的分布函数为F F(x x)、概率密度函数为、概率密度函数为f f(x x),),则其简单随机样本的联合分布函数为则其简单随机样本的联合分布函数为),(2*nxxxF其简单随机样本的联合概率密度函数为其简单随机样本的联合概率密度函数为)

12、,(2*nxxxf=f=f(x x1 1)f f(x x2 2)f f(x xn n)2022-10-42022-10-41313 事实上我们抽样后得到的资料都是具体的、确事实上我们抽样后得到的资料都是具体的、确定的值定的值.如我们从某班大学生中抽取如我们从某班大学生中抽取1010人测量身高人测量身高,得到得到1010个数,它们是样本取到的值而不是样本个数,它们是样本取到的值而不是样本.我我们只能观察到随机变量取的值而见不到随机变量们只能观察到随机变量取的值而见不到随机变量.3.3.总体、样本、样本值的关系总体、样本、样本值的关系2022-10-42022-10-41414总体(理论分布)总体

13、(理论分布)?样本样本 样本值样本值 统计是从手中已有的资料统计是从手中已有的资料-样本值,去推断样本值,去推断总体的情况总体的情况-总体分布总体分布F F(x x)的性质的性质.总体分布决定了样本取值的概率规律,也就是总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断样本取到样本值的规律,因而可以由样本值去推断总体总体.样本是联系二者的桥梁样本是联系二者的桥梁2022-10-42022-10-41515 由样本值去推断总体情况,需要对样本值进由样本值去推断总体情况,需要对样本值进行行“加工加工”,这就要构造一些样本的函数,它把,这就要构造一些样本的函数,它把

14、样本中所含的(某一方面)的信息集中起来样本中所含的(某一方面)的信息集中起来.统计量统计量及其分布及其分布如何对样本进行加工?如何对样本进行加工?2022-10-42022-10-41616第二节 抽样分布统计量与经验分布函数统计量与经验分布函数统计三大抽样分布统计三大抽样分布几个重要的抽样分布定理几个重要的抽样分布定理小结小结2022-10-42022-10-417171.1.统计量统计量 不含任何未知参数的样本的函数称为统计量不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量它是完全由样本决定的量.一、统计量与经验分布函数一、统计量与经验分布函数.),(,),(,2121212

15、1个统计量个统计量称是一称是一中不含未知参数,则中不含未知参数,则的函数,若的函数,若是是的一个样本,的一个样本,是来自总体是来自总体设设nnnnXXXggXXXXXXgXXXX2022-10-42022-10-41818不是统计量,为什么?不是统计量,为什么?哪些哪些之中哪些是统计量之中哪些是统计量试指出试指出的简单随机样本的简单随机样本是来自是来自数,数,是未知参是未知参,其中,其中服从两点分布服从两点分布、设总体、设总体,)(,2,max,.,),1(22155512151XXpXXXXXXXppbXii .2)(,max,52155121是未知数)是未知数)不是统计量(因为不是统计量(

16、因为都是统计量,但都是统计量,但ppXXXXXXii 例例解解:2022-10-42022-10-41919请注意请注意:.),X(),(,X)2(21212121的观察值的观察值计量计量也是统也是统则则是一个样本的观察值是一个样本的观察值的一个样本的一个样本是来自总体是来自总体设设nnnnXXfxxxfxxxXXX(1 1)统计量是一个随机变量。)统计量是一个随机变量。2022-10-42022-10-42020么么么么方面么么么么方面 Sds绝对是假的 几个常见统计量几个常见统计量样本平均值样本平均值niiXnX11它反映了它反映了总体均值总体均值的信息的信息样本方差样本方差niiXXnS

17、122)(11它反映了总体它反映了总体方差的信息方差的信息 niiXnXn12211样本标准差样本标准差 niiXXnS12)(112022-10-42022-10-42222nikikXnA11它反映了总体它反映了总体k k 阶矩的信息阶矩的信息样本样本k k阶原点矩阶原点矩样本样本k k阶中心矩阶中心矩nikikXXnB1)(1 k k=1,2,=1,2,它反映了总体它反映了总体k k 阶阶中心矩的信息中心矩的信息2022-10-42022-10-42323统计量的观察值统计量的观察值,2,1)(11,2,11;)(11)(11;111121212 kxxnbkxnxxnsxxnsxnxn

18、ikiknikikniiniinii2022-10-42022-10-42424请注意请注意:.,2,11)(1 kXnAnXEkXkpnikikkk时,时,存在,则当存在,则当阶矩阶矩的的若总体若总体.),(),(2121为连续函数为连续函数其中其中可将上述性质推广为可将上述性质推广为由依概率收敛性质知,由依概率收敛性质知,再再ggAAAgkpk .根据根据这就是矩估计法的理论这就是矩估计法的理论.,2,1)(,2121上述结论上述结论再由辛钦大数定律可得再由辛钦大数定律可得同分布同分布独立且与独立且与有有同分布,同分布,独立且与独立且与由由事实上事实上nkXEXXXXXXXXkkikknk

19、kn 2022-10-42022-10-42525 2.2.经验分布函数经验分布函数.,)(,2121的随机变量的个数的随机变量的个数中不大于中不大于表示表示的一个样本,用的一个样本,用是总体是总体设设xxxxxxsFXXXnn xxsnxFn)(1)(经验分布函数为经验分布函数为定义定义 2,121,321,0)()(21133xxxxFxFF若若若若若若的观察值为的观察值为,则经验分布函数,则经验分布函数,具有一个样本值具有一个样本值设总体设总体例例2022-10-42022-10-42626)1,2,1(,1,0)()(.,)()1()()1()()2()1(21 nkxxxxxnkxx

20、xFxFxxxnxxxnkknnnn若若若若若若的观察值为的观察值为则经验分布函数则经验分布函数如下:如下:将它们按大小次序排列将它们按大小次序排列值值的样本的样本是总体的一个容量为是总体的一个容量为一般,设一般,设2022-10-42022-10-42727 二、统计三大抽样分布二、统计三大抽样分布)(22n记为记为2分布分布1 1、定义定义:设设 相互独立相互独立,都服从正态分布都服从正态分布N N(0,1),(0,1),则称随机变量:则称随机变量:所服从的分布为所服从的分布为自由度为自由度为 n n 的的 分布分布.nXXX,21222212nXXX22分布是由正态分布派生出来的一种分布

21、分布是由正态分布派生出来的一种分布.c c2 2 分布分布2022-10-42022-10-428282分布的密度函数为分布的密度函数为000)2(21);(2122xxexnnxfxnn来定义来定义.其中伽玛函数其中伽玛函数 通过积分通过积分0,)(01xdttexxt)(x22022-10-42022-10-42929),(2N1.1.设设 相互独立相互独立,都服从正态分布都服从正态分布nXXX,21则则)()(121222nXnii).(21221nnXX 则则),(),(222121nXnX这个性质叫这个性质叫 分布的可加性分布的可加性.2分布的性质分布的性质2,),(22充分大时充分

22、大时则当则当nn 3 3若若的分布的分布nnX2 近似正态分布近似正态分布N(0,1).N(0,1).(应用中心极限定理可得应用中心极限定理可得)2 2设设 且且X X1 1,X X2 2相互独立,相互独立,2022-10-42022-10-43030E E(X X)=)=n n,D D(X X)=2)=2n.n.,),(.222分布的数学期望与方差分布的数学期望与方差若若 n1)()(),1,0(2 iiiXDXENX故故事实上,由事实上,由213)()()(2242 iiiXEXEXD.2)()(,)()(122122nXDDnXEEniinii 2022-10-42022-10-4313

23、1分布的性质:分布的性质:t)2()2()(,0)(),(.1 nnntDtEntttn与方差为:与方差为:其数学期望其数学期望分布分布的的具有自由度为具有自由度为.21)(lim,.0.222tnethntt 函数的性质有函数的性质有由由再再分布概率密度的图形,分布概率密度的图形,其图形近似于标准正态其图形近似于标准正态充分大时充分大时当当对称对称分布的密度函数关于分布的密度函数关于).1,0(Ntn近似近似足够大时,足够大时,即当即当2022-10-42022-10-43232)(nt )()(1ntntt 分位点的性质:分位点的性质:分布的上分布的上.1315.2)15()(025.0

24、tntt求得,例求得,例可查表可查表分位点分位点分布的上分布的上 zntn)(45的值,可用正态近似的值,可用正态近似时,对于常用的时,对于常用的当当2022-10-42022-10-43333由定义可见,由定义可见,3 3、F F分布分布121nUnVF F(n2,n1),(),(2212nVnU 定义定义:设设 U 与与V 相互相互独立,则称随机变量独立,则称随机变量服从服从自由度为自由度为n1及及 n2 的的F分布分布,n1称为称为第自第自由度由度,n2称为称为第二自由度第二自由度,记作,记作21nVnUF FF(n1,n2).2022-10-42022-10-43434即它的数学期望并

25、不依赖于第一自由度即它的数学期望并不依赖于第一自由度n n1.1.0001)()()()()()(2222221211211212121yyyyynnnnnnnnnnnn1.1.F F分布的数学期望为分布的数学期望为:2)(22 nnFE若若n22若若F F F F(n n1 1,n n2 2),F F的概率密度为的概率密度为分布的性质分布的性质F2022-10-42022-10-435350 1(,)XNn n取不同值时样本取不同值时样本均值均值 的分布的分布X请注意请注意:.X2本均值本均值可用本定理计算样可用本定理计算样时,时,在已知总体在已知总体 ),(2nNX 2022-10-420

26、22-10-43636 定理定理 2 2 (样本方差的分布样本方差的分布)1()1()1(222nSn 设设X1,X2,Xn是来自正态总体是来自正态总体),(2 N的样本的样本,2SX和分别为样本均值和样本方差分别为样本均值和样本方差,则有则有.)2(2独立独立与与SXn取不同值时取不同值时 的分布的分布22)1(Sn 2022-10-42022-10-43737 定理定理 3 3(样本均值的分布样本均值的分布)设设X1,X2,Xn是取自正态总体是取自正态总体),(2 N的样本的样本,2SX和分别为样本均值和样本方差分别为样本均值和样本方差,则有则有)1(ntnSX 且相互独立且相互独立分布的

27、定义可得分布的定义可得、由定理由定理证证)1()1(,)1,0(t2,1222 nSnNnX)1()1(22 ntSnnX则则.X2本均值时,可用本定理计算样在未知总体2022-10-42022-10-43838 定理定理 4 4(两总体样本均值差、样本方差比的分布两总体样本均值差、样本方差比的分布)2(112)1()1()(221212122221121 nntnnnnSnSnYX、,设),(),(2221 NYNXYX和分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1,X2,1nX是来自是来自X的样本的样本,是取自是取自Y的样本的样本,这两个样本的样本方差这两个样本的样本方差

28、,则有则有2221SS 和Y1,Y2,2nY样本均值,样本均值,分别是分别是)1,1(12122222121 nnFSS、2022-10-42022-10-43939六、小结六、小结 在这一节中我们学习了统计量的概念在这一节中我们学习了统计量的概念,几几个重要的统计量及其分布个重要的统计量及其分布,即抽样分布即抽样分布.要求大要求大家熟练地掌握它们家熟练地掌握它们.2022-10-42022-10-44040常用的统计量常用的统计量样本平均值样本平均值niiXnX11样本方差样本方差niiXXnS122)(11样本标准差样本标准差 niiXXnS12)(11样本样本k k阶原点矩阶原点矩nikikXnA11样本样本k k阶中心矩阶中心矩nikikXXnB1)(12022-10-42022-10-44141

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(浙大概率论与数理统计课件第六章样本及抽样分布.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|