1、从本章起转入课程的第二部分从本章起转入课程的第二部分数理统计数理统计 由于学时有限,课程的的这部分内容我由于学时有限,课程的的这部分内容我们只介绍理论部分,即抽样分布。至于具体们只介绍理论部分,即抽样分布。至于具体的方法的方法,学生可以自己推导并学会处理问题。学生可以自己推导并学会处理问题。数理统计是具有广泛应用的一个数学分支,数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础,根据试验或观察得到的它以概率论为理论基础,根据试验或观察得到的数据,来研究随机现象,对研究对象的客观规律数据,来研究随机现象,对研究对象的客观规律性作出种种合理的估计和判断性作出种种合理的估计和判断 数理统计学
2、主要研究怎样以数理统计学主要研究怎样以有效的方有效的方式式收集、收集、整理和分析整理和分析带有随机性的数据带有随机性的数据,以便对所考察的问题作出推断和预测,直以便对所考察的问题作出推断和预测,直至为采取的决策和行动提供依据和建议至为采取的决策和行动提供依据和建议.1.收集资料收集资料(有关数据资有关数据资),对它进行整理对它进行整理,包括列包括列 开展数理统计研究的步骤开展数理统计研究的步骤:3.根据分析研究对总体进行推断及预测根据分析研究对总体进行推断及预测.2.分析研究分析研究,即发掘带规律性的东西即发掘带规律性的东西;(描述性的工作描述性的工作)表、作图及计算某些特征指标表、作图及计算
3、某些特征指标;(分析性的工作分析性的工作)(推断性的工作)推断性的工作)第六章、数理统计基础第六章、数理统计基础 6.1 6.1 基本概念基本概念一、总体与样本一、总体与样本 在数理统计中,我们往往研究有关对象的某一在数理统计中,我们往往研究有关对象的某一(数量)(数量)指标指标研究某批灯泡的寿命研究某批灯泡的寿命(X)为此,我们就考虑与这一指为此,我们就考虑与这一指标相联系的随机试验,对这一指标相联系的随机试验,对这一指标进行实验观察,我们将试验或标进行实验观察,我们将试验或观察的观察的所有可能的观测值所有可能的观测值称为称为总总体体,每每一个观测值一个观测值称为称为个体个体1.考察我校一年
4、级男生(考察我校一年级男生(1000人)的身高人)的身高(m)。10001.73,1.76,1.76,个总体总体2.考察一批灯管(考察一批灯管(1000个)的质量个)的质量(次品:次品:0,正品:,正品:1)。总体总体m0,1000-m1个个6.1 由于总体中的个体是随机试验的观测值,由于总体中的个体是随机试验的观测值,其发生与否具有随机性。从而,个体是某个随其发生与否具有随机性。从而,个体是某个随机变量机变量X的观测值,总体就是随机变量的观测值,总体就是随机变量X所有所有可能的取值。我们对总体的研究就是对随机变可能的取值。我们对总体的研究就是对随机变量量X的研究,随机变量的研究,随机变量X的
5、分布函数和数字特的分布函数和数字特征就是总体的分布函数和数字特征。本课程将征就是总体的分布函数和数字特征。本课程将不区分总体与相应的随机变量,笼统的称为总不区分总体与相应的随机变量,笼统的称为总体体X。总体就等同于随机变量及其分布总体就等同于随机变量及其分布.6.1 为推断总体分布及各种特征,按一定规则为推断总体分布及各种特征,按一定规则从总体中从总体中抽取抽取若干个体进行观察试验,以获得若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为有关总体的信息,这一抽取过程称为“抽样抽样”所抽取的部分个体称为所抽取的部分个体称为样本样本.样本中所包含的样本中所包含的个体数目称为个体数目称为样
6、本容量样本容量.2.样本的数学描述样本的数学描述从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为56.1 样本是随机向量样本是随机向量 .抽到哪抽到哪5辆是随机的辆是随机的容量为容量为n的样本可以看作的样本可以看作n维随机向量维随机向量.但是但是,一旦取定一组样本一旦取定一组样本,得到的是得到的是n个具体的个具体的数数 ,称为样本的一次观察值,简称样称为样本的一次观察值,简称样本观测值本观测值.nxxx,21 nXXX,216.1 样本的双重含义样本的双重含义:泛指容量为:泛指容量为n抽样抽样 nXXX,21n是一个是一个n维向量维向量,称为样本的一个观测值。
7、称为样本的一个观测值。n维随机向量;指某次具体抽样结果维随机向量;指某次具体抽样结果 nxxx,21 最常用的一种抽样方法叫作最常用的一种抽样方法叫作“简单随机抽简单随机抽样样”,它要求抽取的样本满足下面两点,它要求抽取的样本满足下面两点:2.独立性独立性:X1,X2,Xn是相互独立的随机变量是相互独立的随机变量.1.代表性代表性:X1,X2,Xn中每一个与所考察的总中每一个与所考察的总 体有相同的分布体有相同的分布.6.1 独立独立,且每一个且每一个kX与与X有相同的分布有相同的分布,则称则称定义定义1 设总体设总体X具有分布函数具有分布函数),(xFnXXX,21是来自总体是来自总体X的样
8、本,若的样本,若nXXX,21相互相互为为简单的随机样本简单的随机样本,简称样本。,简称样本。nXXX,21 简单随机样本是应用中最常见的情形,简单随机样本是应用中最常见的情形,今后,当说到今后,当说到“X1,X2,Xn是取自某总体的样是取自某总体的样本本”时,若不特别说明,就指时,若不特别说明,就指简单随机样本简单随机样本.6.1 3.样本的分布样本的分布)X,X,X(n21 )(xpxXP nnxpxpxpxxxp2121*,1)如果总体)如果总体X是离散型随机变量,其分布律为:是离散型随机变量,其分布律为:,则样本,则样本 的分布律为:的分布律为:12(,)nXXX)(xf nnxfxf
9、xfxxxf2121*,2)如果总体)如果总体X是连续型随机变量,其密度函数是连续型随机变量,其密度函数为为 ,则样本,则样本 的密度函数为:的密度函数为:12(,)nXXX6.1 设设 是来自总体是来自总体X的样本,的样本,例例2 设某种电灯泡的寿命设某种电灯泡的寿命X服从指数分布,求服从指数分布,求 来自这一总体的简单随机样本来自这一总体的简单随机样本 的联合概率密度。的联合概率密度。12(,)nXXX 0,12(,)nXXX例例1 设电话交换台一小时内的呼唤次数设电话交换台一小时内的呼唤次数X服从服从 泊松分布泊松分布 ,求来自这一总体的简,求来自这一总体的简 单随机样本单随机样本 的分
10、布函数。的分布函数。6.1 二、经验分布函数二、经验分布函数 设总体的分布函数设总体的分布函数 ,从总体,从总体中抽取容量为中抽取容量为n的样本,得到的样本,得到n个样本观测值,个样本观测值,若样本容量若样本容量n较大,则相同的较大,则相同的n观测值可能重复观测值可能重复出现若干次,为此,应当把这些观测值整理,出现若干次,为此,应当把这些观测值整理,并写出下面的样本频率分布表:并写出下面的样本频率分布表:xXPxF 1 频频 率率 频频 数数 总计总计 观测值观测值 1x1n1f 2x2n2f lxlnlfn lxxx 21 nl nnfii li,2,1liinn1liif11其中其中6.1
11、(2)是非减函数是非减函数 xFn 01nFx(1)xFn易知样本分布函数易知样本分布函数 具有下列性质:具有下列性质:定义定义1 1设函数设函数 1101iniiixxlxxFxfxxxxx 1,2,1il其中和式其中和式 是对小于或等于是对小于或等于x的一切的一切 的的频率频率 求和,则称求和,则称 为为经验分布函数(样本经验分布函数(样本分布函数)分布函数)。xxi ixif xFn6.1 1,0 nnFF(3)(4)在每个观测值在每个观测值 处是右连续的处是右连续的,点点 是是 的跳跃间断点,的跳跃间断点,在该点的跃度就等于在该点的跃度就等于频率频率 xFn ixif ix xFn x
12、Fn样本分布函数 的图形如图6-1所示 xFn图6-16.1 二、直方图二、直方图 数理统计中研究连续随机变量数理统计中研究连续随机变量X的样本分布的样本分布时,通常需要作出样本的频率直方图(简称时,通常需要作出样本的频率直方图(简称直直方图方图),作直方图的步骤如下:),作直方图的步骤如下:ba,bttttttalii,11211 1 iiitttli,2,1 第第 i个子区间的长度为个子区间的长度为 ,min21*1nxxxx nnxxxx,max21*1 1.取取 2.2.适当选取略小于适当选取略小于 的数的数a与略大于与略大于 的数的数b,并用分点并用分点 1,t,tolt*1x*nx
13、btttttall 1210把区间把区间 分成分成l个子区间个子区间;labti 各子区间的长度可以相等,也可以不等;各子区间的长度可以相等,也可以不等;若使各子区间的长度相等,则有若使各子区间的长度相等,则有 子区间的个数一般取为子区间的个数一般取为8至至15个,太多则由个,太多则由于频率的随机摆动而使分布显得杂乱,太少于频率的随机摆动而使分布显得杂乱,太少则难于显示分布的特征。则难于显示分布的特征。3 3.把所有样本观测值逐个分到各子区间内,把所有样本观测值逐个分到各子区间内,并计算样本观测值落在各子区间内的频数并计算样本观测值落在各子区间内的频数 及频率及频率innnfii .,2,1l
14、i 6.2 iiiiiiifttfttS 11 .,2,1li 4.4.在在x轴上截取各子区间,并以各子区间为底,轴上截取各子区间,并以各子区间为底,1 iiittfiS以以 为高作小矩形,各个小矩形的面积为高作小矩形,各个小矩形的面积就等于样本观测值落在该子区间内的频率,即就等于样本观测值落在该子区间内的频率,即所有小矩形的面积的和所有小矩形的面积的和.111 liiliifS这样作出的所有小矩形就构成了直方图。这样作出的所有小矩形就构成了直方图。iitt,1 iiitXtPf 1li,2,16.2 因为样本容量因为样本容量n充分大时,随机变量充分大时,随机变量X的的取值落在各个子区间取值落
15、在各个子区间 内的频率近内的频率近似等于其概率似等于其概率,即即 所以直方图大致地描述了总体所以直方图大致地描述了总体X的概率分布。的概率分布。例例1 测量测量100个某种机械零件的质量,得到个某种机械零件的质量,得到样本观测值如下(单位:样本观测值如下(单位:g)246 251 259 254 246 253 237 252 250 251 249 244 249 244 243 246 256 247 252 252 250 247 255 249 247 252 252 242 245 240 260 263 254 240 255 250 256 246 249 253 246 255
16、 244 245 257 252 250 249 255 248 258 242 252 259 249 244 251 250 241 253 250 265 247 249 253 247 248 251 251 249 246 250 252 256 245 254 258 248 255 251 249 252 254 246 250 251 247 253 252 255 254 247 252 257 258 247 252 264 248 244 写出零件质量的频率分布表并作直方图。写出零件质量的频率分布表并作直方图。6.2 由此得到零件质量的频率分布表:由此得到零件质量的频率分
17、布表:ginif6.2 零件质量/频数 频率 236.5239.5 1 0.01 239.5242.5 5 0.05 242.5245.5 9 0.09 245.5248.5 19 0.19 248.5251.5 24 0.24 251.5254.5 22 0.22 254.5257.5 11 0.11 257.5260.5 6 0.06 260.5263.5 1 0.01 263.5266.5 2 0.02 总计 100 1.00直方图如图62所示图626.2 6.3 6.3 由样本值去推断总体情况,需要对样本值进由样本值去推断总体情况,需要对样本值进行行“加工加工”,这就要构造一些样本的函
18、数,它,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来把样本中所含的(某一方面)的信息集中起来.定义定义1 设设 是来自总体是来自总体X的一个样本的一个样本,是一个连续函数,如果是一个连续函数,如果 中不包含任何未知参数中不包含任何未知参数,则称则称 是是 的一个的一个统计量统计量。nXXX,21),(21nXXXgg),(21nxxxgnXXX,21几个常见统计量几个常见统计量样本均值:样本均值:样本方差:样本方差:11nkkXXn2211()1nkkSXXn它反映了总体均值它反映了总体均值的信息的信息它反映了总体方差它反映了总体方差的信息的信息样本标准差:样本标准差:
19、未修正样本方差:未修正样本方差:nkkXXnS1220)(1 nkkXXnS12)(11 6.3 6.3 样本样本k阶原点矩:阶原点矩:样本样本k阶中心矩:阶中心矩:nikikXnA11 nikikXXna1)(1 k=1,2,它反映了总体它反映了总体k阶原点阶原点矩的信息矩的信息它反映了总体它反映了总体k阶阶中心矩的信息中心矩的信息 6.3 我们指出,若总体我们指出,若总体X的的k阶原点矩存在且阶原点矩存在且kk(X),E 由辛钦大数定律,由辛钦大数定律,11.nPkkikiAXn 由依概率收敛的性质,知若由依概率收敛的性质,知若g为为m元连续函数,元连续函数,则则1212(,)(,).Pm
20、mg A AAg 6.3 6.4 抽样分布抽样分布 统计量是样本的函数统计量是样本的函数,而样本又是随机向而样本又是随机向量量,故统计量是随机变量故统计量是随机变量,因而就有一定的分布因而就有一定的分布,这个分布叫做这个分布叫做统计量的统计量的“抽样分布抽样分布”.抽样分布就是通常的随机向量函数的分布抽样分布就是通常的随机向量函数的分布.只是强调这一分布是由一个统计量所产生的只是强调这一分布是由一个统计量所产生的.研究统计量的性质和评价一个统计推断的优良研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质性,完全取决于其抽样分布的性质.抽样分布抽样分布精确抽样分布精确抽样分布
21、渐近分布渐近分布(小样本问题中使用)(小样本问题中使用)(大样本(大样本(n50)问题中使用)问题中使用)6.3 一、三个重要分布一、三个重要分布1.分布分布2 000221)(2122xxexnxfxnn定义定义1 如果随机变量如果随机变量X的概率密度为的概率密度为则称则称X服从服从自由度为自由度为 的的 分布分布.记为记为n2).(2nX 6.3概率密度图形的示意图概率密度图形的示意图)(2n 可以将绿色的曲线视为可以将绿色的曲线视为 概率密度的代表图形概率密度的代表图形n=2n=6n=10oxy的样本,则的样本,则12 nkkX)(2n 设设nXXX,21是来自正态总体是来自正态总体X)
22、1,0(N定理定理1(构造定理)(构造定理)6.3 6.3 性质性质1 设设)(),(222121nXnX ,且21,XX独立独立,则则)(21221nnXX 且且 相互独立,则随机变量相互独立,则随机变量 nXXX,2112mXXXX服从服从自由度为自由度为 的的 分布分布.1mkkn2 kX2(),1,2,knkm=L L性质性质2 若随机变量若随机变量211()mmkkkkXn即即 的性质的性质 )(2n 6.4 性质性质3 若若),(2nX 则则nDnE2)(,)(22 例例1:设设 是来自总体是来自总体 的一的一个样本。问个样本。问a,b为何值时,为何值时,并确定并确定n的值。的值。
23、1234,1(0,4)N 21234(2)b(34)(n)a 6.4 性质性质5 若随机变量若随机变量 则当则当n=2时时,X服从服从),(2nX 参数为参数为1/2的指数分布的指数分布;且当且当n充分大时充分大时,2 分布的密度函数趋于对称分布的密度函数趋于对称,即当即当n时时,分布以正态分布为极限。分布以正态分布为极限。2 6.4 如图所示如图所示)(2n ox)(2n 分布的上分位点分布的上分位点2 通过查表(通过查表(P281)可求出)可求出).(2n 22(),.P n=若若称称 为为水水平平 上上分分位位点点 记记作作()6.4 2.t 分布分布定义定义2 如果随机变量如果随机变量
24、X的概率密度为的概率密度为12212()1,2nnxf xxnnn 注注 f(x)是偶函数是偶函数,因此其图形关于因此其图形关于y轴对称轴对称.称称X服从服从自由度为自由度为 的的 分布分布,记为记为nt).(ntt 6.4 n=5n=20N(0,1)ox)(xf 取不同值时取不同值时 分布及分布及 的概率密度的比较图的概率密度的比较图nt)1,0(N 6.4 相互独立,相互独立,且且YX,),(),1,0(2nYNX 构造定理构造定理 设设 nYXT/则随机变量则随机变量).(nt t 分布的上分位点分布的上分位点性知性知,有有/2|(),P Ttn并且并且1()()tnt n 若若(),T
25、t n则有则有(),P Ttn由对称由对称 6.4)(nt)(2/nt)(2/nt 2/ox)(nt例例2 设设XN(0,1),Y),3(2 且且X与与Y相互独立,求相互独立,求YX3在区间在区间的概率的概率.)3841.5,3182.3(6.4 t-分布的性质分布的性质(1)t-分布密度函数的图像是一个关于分布密度函数的图像是一个关于y轴对称轴对称的分布,且的分布,且lim(x)0.xf(2)t-分布密度函数的图像与标准正态密度函分布密度函数的图像与标准正态密度函数形状类似,只是峰不标准正太分布的低一些,数形状类似,只是峰不标准正太分布的低一些,尾部比标准正态密度的厚一些。实际上当尾部比标准
26、正态密度的厚一些。实际上当n充分充分大时大时t-分布近似标准正态分布,分布近似标准正态分布,i.e.,221lim(x)0e.2xnf 6.4(3)若)若 则则(n),t 0;E (n2).2nDn 当当n=1时,时,t-分布就是标准柯西分布,期望和方分布就是标准柯西分布,期望和方差均不存在。差均不存在。例例3.设总体设总体 和和 相互独立且都服从相互独立且都服从 分布分布 (0,9)N而样本而样本 和和 是分别来自总是分别来自总体体129,129,和和 ,求统计量,求统计量129222129T 的分布。的分布。6.4 3.F分布分布1/22()/2()/2(/)0()1(/)2200nnn
27、mnmn mxxnmf xnxmx 定义定义3 若随机变量若随机变量X的概率密度为的概率密度为称称X服从服从自由度为自由度为n,m的的F分布分布,记为记为).,(mnFF 6.4 n=10,m=25n=10,m=5n=15,m=25ox)(xf概率密度图形的示意图概率密度图形的示意图 6.4),(12n),(22nY 且且X与与Y相互独立,相互独立,性质性质1 设设X/1YnXF ).,(1nF则随机变量则随机变量2n2n/11nXYF 而而).,(1nF2n2n性质性质2.若若 ,则,则(n)Xt2(1,n)XF 6.4 例例4:设总体设总体X服从标准正态分布服从标准正态分布N(0,1),是
28、来自总体是来自总体X的一个样本,试的一个样本,试问统计量问统计量12,nXXX52216(1),55niiiinYXXn服从和分布?服从和分布?F分布的上分位点分布的上分位点),(21nnF),(112nnFF由定义由定义,若若),(21nnFF则则所以有所以有ox)(xf112211(,)(,)Fn nFn n 6.4 二、正态总体统计量分二、正态总体统计量分布布 6.4 研究数理统计的问题时,往往需要知道所讨研究数理统计的问题时,往往需要知道所讨论的统计量论的统计量 的分布一般说来,的分布一般说来,要确定某个统计量的分布是困难的,有的甚至要确定某个统计量的分布是困难的,有的甚至是不可能的然
29、而,对于总体服从正态分布的是不可能的然而,对于总体服从正态分布的情形已经有了详尽的研究情形已经有了详尽的研究.),(21nXXXg 6.4 下面我们讨论总体服从下面我们讨论总体服从正态分布正态分布的统计量的分布的统计量的分布.(1)一个正态总体的统计量的分布)一个正态总体的统计量的分布 nNX2,定理定理1 设设 的样本,的样本,则:则:nXXX,21是来自正态总体是来自正态总体X),(2 N 1,0/NnX 6.4 XS 有有2)2(相互独立。相互独立。)(1)1(21222 nkkXXSn)1(2 n(证明略)(证明略)122 Sn)()1(2 n 定理定理2 设设nXXX,21是来自正态
30、总体是来自正态总体X),(2 N的样本,的样本,nkkXnX11 21211 nkkXXnS则则 6.4 nSX/)1(nt的样本,则的样本,则推论推论 设设nXXX,21是来自正态总体是来自正态总体X),(2 N 6.4(2)两个正态总体的统计量的分布)两个正态总体的统计量的分布定理定理3 设设1,21nXXX是来自正态总体是来自正态总体X),(211 N的样本,的样本,2,21nYYY是来自另一个正态总体是来自另一个正态总体),(222 NY的样本的样本,且且X与与Y相互独立相互独立,则则随机变量随机变量22212121)(nnYX )1,0(N 6.4 212111)(nnSYXTW )
31、2(21 nnt nkknkkYnYXnX111,12)1()1(212222112 nnSnSnSW 112121)(11nkkXXnS 212222)(11nkkYYnS的样本,的样本,2,21nYYY是来自另一个正态总体是来自另一个正态总体推论推论1 设设1,21nXXX是来自正态总体是来自正态总体X),(1 N2 的样本的样本,且且X与与Y相互独立相互独立,则随则随),(2 N2 Y机变量机变量其中其中 6.4/22222121 SS)1,1(21 nnF推论推论2 设设1,21nXXX是来自正态总体是来自正态总体X),(211 N的样本,的样本,2,21nYYY是来自另一个正态总体是来自另一个正态总体Y),(222 N的样本的样本,且且X与与Y相互独立相互独立,则随机变量则随机变量 6.4 正态总体正态总体X的样本,求的样本,求2S不小于不小于2.35的概率。的概率。例例2 设总体设总体X),5,(N1521,XXX是来自是来自 例例3 设正态总体设正态总体 ,而而 是是)2,0(2NX1021,XXX 252121022212XXXXXY 试确定随机变量试确定随机变量Y的分布的分布.来自总体来自总体X的样本,令的样本,令
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。