1、概率论的基本概念概率论的基本概念数理统计的基本概念数理统计的基本概念抽样分布抽样分布返回返回退出退出本章小结本章小结习题习题数理统计的基本概念数理统计的基本概念z总体和样本总体和样本z统计量统计量z顺序统计量和经验分布函数顺序统计量和经验分布函数返回返回继续继续 我们今后所讨论的统计问题主要属于下面这我们今后所讨论的统计问题主要属于下面这种类型:从一个集合中选取一部分元素,对这部种类型:从一个集合中选取一部分元素,对这部分元素的某些数量指标进行测量,根据测量获得分元素的某些数量指标进行测量,根据测量获得的这些数据来推断这集合中全部元素的这些数量的这些数据来推断这集合中全部元素的这些数量指标的分
2、布情况。在统计学中,我们把所研究的指标的分布情况。在统计学中,我们把所研究的全部元素组成的集合称为母体,或全部元素组成的集合称为母体,或总体总体。而把组。而把组成母体的每个元素称为成母体的每个元素称为个体个体,例如在研究某批灯,例如在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了母体,泡的平均寿命时,该批灯泡的全体就组成了母体,而其中每个灯泡就是个体。但是在统计里,由于而其中每个灯泡就是个体。但是在统计里,由于我们关心的不是每个个体的种种具体特性,而仅我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或某几项数量指标仅是它的某一项或某几项数量指标X和该数量指和该数量指标标X在总体中的分
3、布情况。在上述例子中在总体中的分布情况。在上述例子中X是表示是表示灯泡的寿命,就此数量指标灯泡的寿命,就此数量指标X而言,每个个体所而言,每个个体所总体、个体、样本、样本容量、样本值总体、个体、样本、样本容量、样本值取的值是不同的。在试验中,抽取了若干个个体取的值是不同的。在试验中,抽取了若干个个体就观察到了就观察到了x的这样或那样的数值,因而这个数量的这样或那样的数值,因而这个数量指标指标X是一个随机变量,而是一个随机变量,而X的分布就完全描写了的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以由于
4、我们关心的正是这个数量指标,因此我们以后就把总体和数量指标后就把总体和数量指标X可能取值的全体组成的可能取值的全体组成的集合等同起来,所谓总体的分布也就是指数量指集合等同起来,所谓总体的分布也就是指数量指标标x的分布。的分布。为了对总体的分布律进行各种研究,就必须为了对总体的分布律进行各种研究,就必须对总体进行抽样观察,一般说来,我们还不止进对总体进行抽样观察,一般说来,我们还不止进行一次抽样观察,而是进行几次观察。通过观察行一次抽样观察,而是进行几次观察。通过观察就得到总体指标就得到总体指标X的一组数值的一组数值(x1,x2,xn),其中,其中每个每个xi是一次抽样观察的结果。即某一个被观察
5、是一次抽样观察的结果。即某一个被观察总体、个体、样本、样本容量、样本值总体、个体、样本、样本容量、样本值的个体的的个体的X指标值,指标值,(x1,x2,xn)称为称为容量为容量为n的样的样本的观察值本的观察值。由于我们是利用样本观察来对总体。由于我们是利用样本观察来对总体的分布进行推断,因而从总体中抽取样本进行观的分布进行推断,因而从总体中抽取样本进行观察时必须是随机的。所以对于随机抽样来说,对察时必须是随机的。所以对于随机抽样来说,对其某一次观察结果而论,是完全确定的一组值,其某一次观察结果而论,是完全确定的一组值,但它又是随每次抽样观察而改变的,由于我们要但它又是随每次抽样观察而改变的,由
6、于我们要依据这一观察结果进行分析推断,并研究比较各依据这一观察结果进行分析推断,并研究比较各种推断方法的好坏,因而一般考虑问题时,就不种推断方法的好坏,因而一般考虑问题时,就不能把看为确定的数值,而应该看作为随机向量能把看为确定的数值,而应该看作为随机向量X=(X1,X2,Xn),称它为容量是,称它为容量是n的样本,因而对样的样本,因而对样本也有分布可言。本也有分布可言。总体、个体、样本、样本容量、样本值总体、个体、样本、样本容量、样本值 我们抽取样本的目的是为了对总体的分布律我们抽取样本的目的是为了对总体的分布律进行各种分析推断,因而要求抽取的样本能很好进行各种分析推断,因而要求抽取的样本能
7、很好地反映总体的特性,这就必须对随机抽样的方法地反映总体的特性,这就必须对随机抽样的方法提出一定的要求。通常提出下面两点:代表性:提出一定的要求。通常提出下面两点:代表性:要求样本的每个分量要求样本的每个分量Xi与所观察的总体与所观察的总体X具有相同具有相同的分布的分布F(x);独立性:;独立性:X1,X2,Xn为相互独立为相互独立的随机变量,也就是说,每个观察结果既不影响的随机变量,也就是说,每个观察结果既不影响其他观察结果,也不受其它观察结果的影响。满其他观察结果,也不受其它观察结果的影响。满足上述两点性质的样本称为简单随机子样。在今足上述两点性质的样本称为简单随机子样。在今后如不作特殊声
8、明,所说的样本将理解为简单随后如不作特殊声明,所说的样本将理解为简单随机样本,对于简单随机样本机样本,对于简单随机样本 X=(X1,X2,Xn),其分布可以由总体其分布可以由总体X的分布函数的分布函数F(x)简单随机样本简单随机样本(或概率密度(或概率密度f(x))完全决定,)完全决定,X的分布函数为的分布函数为简单随机样本简单随机样本)()(11 niiniixfxF或或概概率率密密度度为为在数理统计中,研究对象的全体称为总体;在数理统计中,研究对象的全体称为总体;组成总体的每个元素称为个体。组成总体的每个元素称为个体。从总体中抽取的一部分个体,称为总体的一从总体中抽取的一部分个体,称为总体
9、的一个样本;样本中个体的个数称为样本的容量。个样本;样本中个体的个数称为样本的容量。从分布函数为从分布函数为F(x)的随机变量的随机变量X中随机地抽取中随机地抽取的相互独立的的相互独立的n个随机变量,具有与总体相同的分个随机变量,具有与总体相同的分布,则布,则X1,X2,Xn称为从总体称为从总体X得到的容量为得到的容量为n的的随机样本,简称样本。一次具体的抽取记录随机样本,简称样本。一次具体的抽取记录x1,x2,xn是随机变量是随机变量X1,X2,Xn的一个观察值。的一个观察值。总体与样本总体与样本例例1 A厂生产的某种电器的使用寿命服从指数分布,参数厂生产的某种电器的使用寿命服从指数分布,参
10、数 为为未知,为此抽查了未知,为此抽查了n件电器,测量其实际寿命。是确定本问件电器,测量其实际寿命。是确定本问题的总体,样本及样本的分布。题的总体,样本及样本的分布。其其它它为为,所所以以样样本本的的联联合合密密度度总总体体相相互互独独立立,且且来来自自同同一一的的使使用用寿寿命命,因因为为件件电电器器中中各各件件电电器器表表示示抽抽取取的的样样本本,其其概概率率密密度度为为是是一一件件电电器器的的使使用用寿寿命命总总体体解解,00,),(,0,00,)(21)(21212121nxxxnnnnxxxxexxxfXXXXnXXXxxexfXn 样本是总体的代表和反映,但在我们抽取样样本是总体的
11、代表和反映,但在我们抽取样本之后,并不直接利用样本进行推断,而需要对本之后,并不直接利用样本进行推断,而需要对样本进行一番样本进行一番“加工加工”和和“提炼提炼”,把样本所包,把样本所包含的关于我们所关心的事物的信息集中起来,这含的关于我们所关心的事物的信息集中起来,这便是针对不同的问题构造出样本的某种函数,这便是针对不同的问题构造出样本的某种函数,这种函数在统计学中称为统计量。种函数在统计学中称为统计量。引进统计量的目的是为了将杂乱无序的样本引进统计量的目的是为了将杂乱无序的样本值归结为一个便于进行统计推断和研究分析的形值归结为一个便于进行统计推断和研究分析的形式,集中样本所含信息,使之更易
12、揭示问题实质,式,集中样本所含信息,使之更易揭示问题实质,从而解决问题。统计量中应该不含有未知参数,从而解决问题。统计量中应该不含有未知参数,如果统计量中仍含有未知参数,就无法依靠样本如果统计量中仍含有未知参数,就无法依靠样本观测值求出未知参数的估计值,因而失去利用统观测值求出未知参数的估计值,因而失去利用统计量估计未知参数的意义,这是违背我们引进统计量估计未知参数的意义,这是违背我们引进统计量的初衷的。计量的初衷的。统计量概念的引入统计量概念的引入来自总体来自总体X的样本的样本X1,X2,Xn的函数的函数g(X1,X2,Xn),若是连续的且不含任何未知参数,若是连续的且不含任何未知参数,则称
13、为一个统计量。则称为一个统计量。统计量统计量却却都都是是统统计计量量。们们含含有有未未知知参参数数,而而都都不不是是统统计计量量,因因为为它它是是未未知知参参数数,则则,维维样样本本,其其中中抽抽取取的的一一个个的的正正态态总总体体中中是是从从具具有有分分布布密密度度为为若若设设例例2221111212221,3,)(212),(,XXXXXXXNXX 常用的统计量常用的统计量 niiniiniiniinnXXnSSXnXnXXnSXnXxxxXXXX12221212212121)(11)3()(11)(11)2(11,样样本本标标准准差差样样本本方方差差)样样本本平平均均值值(样样本本的的观
14、观察察值值,定定义义是是这这一一的的一一个个样样本本,是是来来自自总总体体设设常用的统计量常用的统计量,2,1,)(1)5(,2,1,1)4(11 kXXnBkkXnAknikiknikik阶阶(中中心心)矩矩样样本本阶阶(原原点点)矩矩样样本本常用统计量的性质常用统计量的性质nXDXEXxFXXXXxFXXEEXXEXDEXkknkkkkkkkk221222)()(),(),(1)(,)()(,,有有均均值值本本的的二二阶阶矩矩存存在在,则则对对样样样样本本,如如果果中中抽抽得得的的一一个个简简单单随随机机是是从从该该总总体体服服从从分分布布设设总总体体定定理理。)时时,假假定定它它是是存存
15、在在的的(或或并并且且约约定定,在在我我们们用用到到阶阶中中心心矩矩,即即记记表表示示总总体体的的阶阶原原点点矩矩,总总体体的的表表示示表表示示总总体体的的方方差差,表表示示总总体体的的均均值值,以以下下约约定定:常用统计量的性质常用统计量的性质nADEAAkkxFnnnnnSDESxFkkkkkknn2222322422242242222)(2)(33)2(21)()(2 ,有有阶阶原原点点矩矩阶阶矩矩存存在在,则则对对样样本本的的的的如如果果定定理理其其中中本本方方差差,有有的的四四阶阶矩矩存存在在,则则对对样样如如果果定定理理定理定理1的证明的证明nXEnXEnXnEXEXDnXEnXn
16、EXEniiniiniininiinii2212212212111)(1)(1)1()()(1)(1)1()(证证明明定理定理2的证明的证明2122212222442322422242242222222212221122)()()()()1(,)(,03)2(21)()1()1(11)1(11)()1(111 niiniiniiiiinjijiniiniiniinXnXXXSnEYYDEYXYnnnnnSDnnnnnnnXXXEnnnnXnnXnEES ,且且有有,则则记记证证明明定理定理2的证明的证明224224242222422222214221422221441221122122122)
17、1)(32()12()1(31)1(2)1()()1()23(1)(2)()(1)(2)(nnnnnnnnnnnnnnnnSEnYYYYYYYYYYnYYYYYYnYYYYnYYnYYnYnlkjikjijikjijinjjkjijikniijijijijiniinjjnjjniiniinii对上式两边取期望得:定理定理2的证明的证明得得证证。由由于于22222)()()(nnnESSESD 定理定理3的证明的证明nnnnnXXnXnEXnEEAEAADXEnXnEEAkkkkkkjikjkinikiknikikkkknikinikik222222221222122211)1(11)11()1
18、()()()(1)1(证证明明例例2 设有一容量设有一容量n=8的样本观察值为的样本观察值为(8,6,7,5,7,8,9,6),求样本,求样本均值及样本方差的观察值。均值及样本方差的观察值。276767871)(117)69875768(8122221221 )()()(,得得由由,得得由由解解SXXnSxnXXniinii例例3 已知某种纱的强力服从已知某种纱的强力服从N(1.56,0.222)(单位:千克)今抽(单位:千克)今抽取容量为取容量为n=50的样本,求样本均值小于的样本,求样本均值小于1.45千克的概率。千克的概率。00019.0)55.3(1)55.3()031.056.145
19、.1(45.1)031.0(50/22.0/)(56.1)(222 XPnXDXE所所以以,解解 设设 x1,x2,xn为总体为总体X的一组观察值,将它们的一组观察值,将它们按有小到大的顺序排列,得到按有小到大的顺序排列,得到 x1*x2*xn*称它为顺序统计量。则称它为顺序统计量。则称它为经验分布。称它为经验分布。顺序统计量和经验分布顺序统计量和经验分布 *1*2*1*1*,1,1,0)(nkknxxxxxnkxxxnxxxF当当当当当当当当顺序统计量和经验分布顺序统计量和经验分布,4,3),()()(1,3,2),(1)()()(1)(1)(1)(0*1*1*2122*1*kxFdxxxx
20、nbkxFdxxnaxFdxxxxnsxFxdxnxxxFxxFnknikiknknikiknniinnniinn经经验验分分布布函函数数。我我们们有有为为数数所所要要求求的的性性质质,故故称称的的函函数数,它它具具备备分分布布函函看看作作为为函函数数,把把的的函函数数是是一一非非减减右右连连续续且且作作为为显显然然抽样分布抽样分布z正态总体样本的线性函数的分布正态总体样本的线性函数的分布zX X2-分布分布zt-分布分布zF-分布分布z正态母体子样均值和方差的分布正态母体子样均值和方差的分布返回返回继续继续 统计量是我们对母体的分布律或数字特征进统计量是我们对母体的分布律或数字特征进行推断的
21、基础,因此求统计量的分布是数理统计行推断的基础,因此求统计量的分布是数理统计的基本问题之一。的基本问题之一。我们所感到兴趣的是下面两类问题第一类我们所感到兴趣的是下面两类问题第一类问题是:对于任意一个自然数问题是:对于任意一个自然数n,要找出给定的统,要找出给定的统计量计量Un=f(X1,X2,Xn)的分布,这分布称为这统的分布,这分布称为这统计量的精确分布。求统计量的精确分布对于数理计量的精确分布。求统计量的精确分布对于数理统计中的所谓小样问题(即子样容量比较小时的统计中的所谓小样问题(即子样容量比较小时的统计问题)的研究是非常有用的。统计问题)的研究是非常有用的。第二类问题是:不对任何个别
22、的第二类问题是:不对任何个别的n求出统计量求出统计量Un的分布,而只求出当的分布,而只求出当n时,统计量时,统计量Un的极限的极限分布,这极限分布对于数理统计中的所谓大样分布,这极限分布对于数理统计中的所谓大样抽样分布抽样分布问题问题(即子样容量较大时的统计问题即子样容量较大时的统计问题)的研究很有用的研究很有用处。处。一般说来,要确定一个统计量的精确分布是一般说来,要确定一个统计量的精确分布是非常复杂的,可是对于一些重要的特殊情形,如非常复杂的,可是对于一些重要的特殊情形,如正态母体,这个问题有较简单的解法。正态母体,这个问题有较简单的解法。在今后各章中将会看到,正态母体的研究处在今后各章中
23、将会看到,正态母体的研究处于特别显著的地位,这一方面是由于其统计量的于特别显著的地位,这一方面是由于其统计量的精确分布的数学分析比较容易;另一重要原因是:精确分布的数学分析比较容易;另一重要原因是:在许多领域的统计研究中所遇到的母体,正态分在许多领域的统计研究中所遇到的母体,正态分布是它的一个很好的近似。当然,中心极限定理布是它的一个很好的近似。当然,中心极限定理也保证了这一状况。也保证了这一状况。正态总体样本的线性函数的分布正态总体样本的线性函数的分布 nkknkknnnaUDaUEUXaXaXaUUNXX1221221121)()(),(,值值和和方方差差分分别别为为也也是是正正态态随随机
24、机变变量量,均均则则性性函函数数是是样样本本的的任任意意确确定定的的线线统统计计量量的的一一个个样样本本,是是抽抽自自正正态态总总体体设设定定理理正态总体样本的线性函数的分布正态总体样本的线性函数的分布21211)()(1),(,nXDXEXnXNXXnkkn 也也是是正正态态随随机机变变量量,且且则则样样本本均均值值的的一一个个样样本本,是是抽抽自自正正态态总总体体设设推推论论X X2分布分布 000,)2/(21);(1)()1,0(,21222222222221221xxexnnxnnXXXNXXXxnnnn,的的分分布布密密度度函函数数是是上上式式所所定定义义的的统统计计量量定定理理的
25、的独独立立变变量量的的个个数数。自自由由度度是是指指上上式式所所包包含含。分分布布,记记为为的的服服从从自自由由度度为为随随机机变变量量,则则称称统统计计量量分分布布的的于于是是相相互互独独立立,且且同同服服从从设设定定义义 定理定理1的证明的证明定理定理1的证明的证明定理定理1的证明的证明定理定理1的证明及密度函数图的证明及密度函数图X X2分布分布)(,)()(32)()(221221212221212nnXXXXnXnXnXDnEXXnX 相相互互独独立立,则则,且且和和设设定定理理的的数数学学期期望望和和方方差差是是,则则设设定定理理 时时成成立立。因因此此当当而而,当当,当当得得有有
26、因因时时,)当当解解:(的的密密度度函函数数。求求,相相互互独独立立,同同服服从从12121000221212122122121111022021222202022222221212222222 ndteduedxex)(xxxe)n()y(fdttedxedxeyXyPyYP)y(Fe)x(fnXXXY),(NX,X,XttuuuxxnxnYytxtyxyyxYxXnn 得得证证。则则有有令令时时成成立立,)假假设设当当(),n(ye)()n(dt)t(tye)()n(dz)zy(ze)()n(dz)zy(e)(ze)n(dz)zy(f)z(f)y(fXXXZnnynnnynytzynynz
27、ynznXZYnn21212212111221211221211221122111212222110232222210232221221023221212221 。因因此此而而则则有有。相相互互独独立立,同同服服从从其其中中设设解解:。分分布布的的数数学学期期望望与与方方差差求求n)X(D)(dxetdxexdxex)X(E)X(E)X(E)X(nD)X(Dn)X(nE)XXX(E),(NX,X,X,XXXX),n(XttxXXnnn23254422211002320241241412214121212222121222212222 t分布分布 tnxnnnnxtTntTtnnYXTYXnYN
28、Xn,1)2/(2/)1();(1)(/)()1,0(2/)1(22 的的分分布布密密度度函函数数是是上上式式所所定定义义的的统统计计量量定定理理。分分布布,记记为为的的服服从从自自由由度度为为独独立立,则则称称随随机机变变量量相相互互和和,且且分分布布和和设设定定义义定理定理1的证明的证明定理定理1的证明的证明t分分布的密度函数图布的密度函数图t分布与正态分布分布与正态分布率率。布布的的尾尾部部有有着着更更大大的的概概态态分分分分布布的的尾尾部部比比在在标标准准正正,也也就就是是说说,在在其其中中差差异异,而而且且有有在在有有较较大大的的分分布布于于正正态态分分布布之之间间存存值值,然然而而
29、对对于于比比较较小小的的实实上上,。事事分分布布很很接接近近于于正正态态分分布布很很大大时时,。当当且且是是对对称称的的,分分布布关关于于可可见见,分分布布的的密密度度函函数数的的公公式式由由 tNXtXPtTPtnenxtnnxtxttxnnx)1,0(|1lim0);(lim002/2/)1(22t分布分布)2/()(,02)(2,)2/()2/1(2/)(2/)1(,01),(2)(/)(/),(122/222 nnEXXDEXnntXnnrnrnrEXEXnrnntXntttnnYXtYXnYNXrrr,则则,如如果果设设推推论论是是偶偶数数当当是是奇奇数数当当存存在在,且且,则则对对
30、设设定定理理。分分布布,记记为为的的服服从从自自由由度度为为独独立立,则则称称随随机机变变量量相相互互和和,且且分分布布和和设设推推论论 整整理理可可得得。作作变变量量替替换换,令令因因而而有有则则记记解解:的的密密度度函函数数。求求相相互互独独立立。与与,znytdtezn)n(ndte)nz()n(nzezdz)tz(f)z(zfdz)tz(f)z(fz)n;t(t)n;nz(nz)z(fnYZnYXTYX),n(Y),(NXzynznnnnznnyzXZXZZ2202122021222202222221221221221210222222 。因因此此。,解解得得为为作作变变量量替替换换,
31、令令而而又又由由于于。为为轴轴对对称称,则则其其数数学学期期望望分分布布的的密密度度函函数数关关于于由由于于解解:。分分布布的的数数学学期期望望与与方方差差求求221222100122121122 nn)T(Dnytdyyey)n()Y(E)Y(E)X(nE)T(E)T(Dyttnyn F分布分布 0,00,)/(1)2/()2/()/(2/)(),;(1),(),(/)(),(2/)(1)2/(2/22xxnmxnmxnmnmnmxfFnmFFFnmnYmXFYXnYmXnmmm的的分分布布密密度度函函数数是是上上式式所所定定义义的的统统计计量量定定理理。分分布布,记记为为的的服服从从自自由
32、由度度为为独独立立,则则称称随随机机变变量量相相互互和和,且且设设定定义义 定理定理1的证明的证明定理定理1的证明的证明F分布分布分分布布。分分布布,则则如如果果推推论论分分布布。则则,且且相相互互独独立立,如如果果推推论论相相互互独独立立。与与则则相相互互独独立立,且且,设设推推论论),(/1),(3),()(/)(/2/)()(122222121212221mnFXnmFXnmFmnYXFnYmXXXZXXYXXnXmX F分布分布4)4()2()422()(222)2()2()2()2(0),(222 nnnmnmnXDnnnEXnrnmrnmrmnEXrnmFXrr,对对和和,对对特特
33、别别有有,对对有有,则则对对设设定定理理整理可得。因而有,则,令解:的密度函数。求相互独立。与dzmfmzmnnznznffnnznzfmmzmzfnYZmXZnYmXFYXnYmXZZ);();();();()();()(,),(),(22222222121212221。因此。,解得为作变量替换,令又因因而解:。分布的数学期望与方差求)2()22)(12(4)2(2)()4)(2(12)2(21)()()()()()()(2)()()(2012222222222221nnnnmnFDnnytdyyeynYEYEXEmnFEFEFEFDnnYEXEmnFEFnyn)1,1(2/2/12/12/
34、)2,0(2212212212212221222122121FXXXXXXXXFXXXXNXXXX)()()()(分分布布定定义义,知知由由)()(),()(,所所以以均均服服从从和和因因为为解解 服服从从什什么么分分布布。的的一一个个样样本本,试试求求是是,设设总总体体例例221221212)/()(,),0(4XXXXYXXXNX 正态总体的样本均值与样本方差的分布正态总体的样本均值与样本方差的分布。独独立立;和和)(方方差差,则则有有分分别别是是样样本本均均值值和和样样本本的的样样本本,是是来来自自正正态态总总体体设设定定理理)1()1()3();/,()2(1,),(,12222222
35、21 nSnnNXSXSXNXXXn 定理定理1的证明的证明定理定理1的证明的证明定理定理1的证明的证明正态总体的样本均值与样本方差的分布正态总体的样本均值与样本方差的分布)1(/,),(,22221 ntnSXSXNXXXn 方方差差,则则有有分分别别是是样样本本均均值值和和样样本本的的样样本本,是是来来自自正正态态总总体体设设定定理理正态总体的样本均值与样本方差的分布正态总体的样本均值与样本方差的分布);1,1()1()11,)111,1),(),(,321222122211222212121121122221121212121nnFSSYYnSXXnSYnYXnXNNYYYXXXniiniiniiniinn差,则有是这两个样本的样本方分别(值;分别是两个样本的均独立。设相互的样本,且这两个样本和总体分别是来自正态与设定理正态总体的样本均值与样本方差的分布正态总体的样本均值与样本方差的分布221222211221212122221,2)1()1()2(11)()(2(wwwwSSnnSnSnSnntnnSYX 其其中中时时,)当当 P171本章小结本章小结习题习题返回返回P174