1、第一章数理统计基本概念数理统计篇数理统计篇 数理统计学数理统计学是以概率论为理论基础的具有广泛应用的一个数学分支,是一门研究随机现象统计规律的学科。数理统计数理统计研究如何有效地收集数据,如何对所获得的数据进行整理分析,从而为随机现象选择合适的数学模型并提供检验方法,在此基础上对随机现象的性质、特点和统计规律做出推断和预测,直至为决策提供依据和建议。1.1 数理统计简介数理统计简介 1.2 总体、样本与统计量总体、样本与统计量称研究对象的全体为总体,总体中的每个单元为个体。从总体中随机地抽取n个个体,称这n个个体为容量为n的样本。一、一、总体与样本总体与样本例如:研究某工厂生产的某种产品的废品
2、率,则这种产品的全体就是总体,而每件产品都是一个个体。实际上,我们真正关心的是总体或个体的某项数量指标。某电子产品的使用寿命某天的最高气温加工出来的某零件的长度等数量指标。因此,将总体理解为那些研究对象的某项数量指标的全体。例如:总体的三层含义:总体的三层含义:样本具有样本具有两两重性重性 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1,X2,Xn 表示;另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1,x2,xn 表示。独立性:样本中每一样品的取值不影响其 它样品的取值-x1,x2,x
3、n 相互独立。要使得推断可靠,对样本就有要求,使样本能很好地代表总体。通常有如下两个要求:随机性:总体中每一个个体都有同等机会 被选入样本-xi 与总体X有相同的分布。设总体设总体X X具有分布函数具有分布函数F F(x x),),x x1 1,x x2 2,x xn n 为取自该总为取自该总体的容量为体的容量为n n的样本,则样本的样本,则样本联合分布函数联合分布函数为为11(,.,)().nniiFxxFx总体 X 服从正态分布N(,2),概率密度为 现从总体 X 中随机抽取样本 X1,Xn,因其独立同分布于总体 X即:Xi N(,2),i1,2,n.于是,样本X1,X2,Xn 的联合概率
4、密度为.,21)(222)(Rxexfx.)2(1),(122)(212/21niixnnnnexxxf例例1定义定义1(统计量)统计量)X1,Xn 是来自总体X的一个样本,g(X1,Xn)是X1,Xn的函数,若g中不含未知参数,则称g(X1,Xn)是一个统计量。二、统计量不含任何未知参数的样本的函数称为统计量。它是完全由样本所决定的量。几个常见统计量几个常见统计量样本均值样本均值样本方差样本方差niiXnX11niiXXnS122)(11 反映总体均值的信息 反映总体方差的信息样本标准差样本标准差niiXXnS12)(11样本样本 k 阶原点矩阶原点矩样本样本 k 阶中心矩阶中心矩,.2,1
5、,11kXnmnikiknikikXXnM1)(1 k=2,3,反映总体k 阶矩的信息反映总体k 阶中心矩的信息常用统计量的观察值记为常用统计量的观察值记为niixnx11niiniixnxnxxns122212)(11)(11niixxnss122)(11,2,1,11kxnanikik,3,2,)(11kxxnbkniik定理2数据观测值与均值的偏差平方和 最小,即在形如 (xic)2 的函数中,样本均值与样本方差的基本性质:定理1若把样本中的数据与样本均值之差称为偏差,则样本所有偏差之和为0,即 最小,其中c为任意给定常数。1()0.niixx2()ixx样本均值的数学期望和方差,以及样
6、本方差的数学期望都不依赖于总体的分布形式。定理3 设总体 X 具有二阶矩,即 E(x)=,Var(x)=2 x1,x2,xn 为从该总体得到的样本,x和s2 分别是样本均值和样本方差,则 E(x)=,Var(x)=2/n,E(s2)=2 1.3 1.3 次序统计量及其分布次序统计量及其分布 另一类常见的统计量是次序统计量。定义2 设 x1,x2,xn 是取自总体X的样本,x(i)称为该样本的第i 个次序统计量,它的取值 是将样本观测值由小到大排列后得到的第 i 个 观测值。其中 x(1)=minx1,x2,xn称为该样本的最小次序统计量,x(n)=maxx1,x2,xn称为该样本的最大次序统计
7、量。小结小结 本讲首先介绍了样本与统计量的基本概念,包括:总体、个体、样本、总体分布与样本分布;然后介绍了统计量的概念和几个常见的统计量:样本均值、方差、标准差、k 阶原点矩和k 阶中心矩。作业作业教材第19页习题一:第1题第9题 统计量既然依赖于样本,而后者又是随机变量,故统计量既然依赖于样本,而后者又是随机变量,故统计量也是随机变量,有一定的分布,这个分布称为统统计量也是随机变量,有一定的分布,这个分布称为统计量的抽样分布。计量的抽样分布。1.4 抽样分布抽样分布.2 分布分布 定义定义1:设设 X1,X2,Xn 相互独立相互独立,且均,且均服从标准正态服从标准正态分布分布 N(0,1),
8、则称随机变量则称随机变量服从自由度为服从自由度为 n 的的卡方卡方分布,记成分布,记成 )(2 2n一、一、三个重要的分布三个重要的分布222212nXXX2 分布的密度函数为分布的密度函数为.0,0,0,)2(21);(2122xxexnnxfxnn通过积分函数,为伽玛其中 Gamma)()(来定义。0 ,)(01dxexx该密度函数的图像是一只取非负值的偏态分布 2分布密度函数曲线分布密度函数曲线2由由 分布的定义,不难得到其如下性质:分布的定义,不难得到其如下性质:分布的可加性。称为性质 1 2.2)(Var )(n).2(2nXn,XEX则,若.)n(n )(n )(n ).1(212
9、21222121YYYY则独立,且二者相互,设 2 2 分布上分布上 分位数有表分位数有表可查,见附表可查,见附表3 3。对于对于给定的给定的(0,1),(0,1),称满足条件称满足条件)(222)()(ndxxfnP的点的点 2(n n)为为 2 2分布的上分布的上 分位数。分位数。分布分位数分布分位数2t 分布的密度函数为分布的密度函数为.,1)2(2)1();(212xnxnnnnxfn为服从自由度为服从自由度 n 的的 t 分布,记为分布,记为 T t(n)。2 t 分布分布nYXT 定义定义2:设设 X N(0,1),Y 2(n),且且 X与与Y 相互独立相互独立则称随机变量则称随机
10、变量 t 分布的密度函数的图象是一个关于纵轴对称的分布,与标准正态分布的密度函数形状类似,只是峰比标准正态分布低一些尾部的概率比标准正态分布的大一些。t t分布密度函数曲线分布密度函数曲线若若 T t(n),对给定的对给定的 (0,1)(0,1),称满足条件称满足条件t 分布的分位数分布的分位数的点 t(n n)为为 t(n)分布上分布上 分位数。分位数。)()()(ntdttfntTPt 分布的上分布的上 分位数有表分位数有表可查,见附表可查,见附表2 2。t(n)分布上分布上 分位点分位点示意图示意图3.F 分布相互独立,与且,设YXnYmX )()(22 则称则称 F=(X/m)/(Y/
11、n)服从第一自由服从第一自由度为度为m,第二自由度为,第二自由度为n 的的 F 分布。分布。记为记为 F F(m,n)。定义定义3 3:),(1 ),(mnFmXnYFnmF F则,若由定义可见:F 分布的密度函数为分布的密度函数为.0,0 ,0,1222)(2122xxxnmxnmnmnmxfnmmm该密度函数的图象也是一只取非负值的偏态分布 若若 FF(m,n),对给定的,对给定的 (0,1),(0,1),称满足条件称满足条件F 分布的分位数分布的分位数的点的点 F(m,n)为为F分布的上分布的上 分位数。分位数。.xxfm,nFFPnmF),(d )()(F 分布上分布上 分位数有表分位
12、数有表可查,见附表可查,见附表5 5。F 分布上分布上 分位点分位点示意图示意图分布分位数的性质分布分位数的性质证明:证明:若若 X F(m,n),则,则 Y=X-1-1 F(n,m)。依分位数定义,依分位数定义,),(11nmFXP),(11nmFYP),(1),(1mnFnmF上式等价于上式等价于),(11nmFYP再根据再根据 F(n,m)的上的上 分位点定义,有分位点定义,有这就证明了性质这就证明了性质),(1),(1nmFmnF 例如:对例如:对m=12,n=9,=0.95,我们在我们在 F 分布表中查不到分布表中查不到 F0.95(12,9),但由性质知,但由性质知可从可从F 分布
13、分布 表中查到表中查到在通常在通常 F 分布表中,只对分布表中,只对 比较小的值较小的值,如如 =0.01,0.05,0.025及及0.1等列出了分位数。但有时我们也需要知道等列出了分位数。但有时我们也需要知道 比较大的较大的分位分位数数,它们在它们在 F 分布表中查不到。这时我们就可利用分位数的分布表中查不到。这时我们就可利用分位数的性质把它们计算出来。性质把它们计算出来。375.080.21)12,9(1)9,12(05.095.0FF定理定理 2.1:二、抽样分布定理二、抽样分布定理则值与样本方差,分别为样本均与的简单样本,是抽自正态总体,设 )(2221SXNXXXn;)1(/)1()
14、2(222nSn相互独立;与 )3(2SX.)1(/)4(ntnSX);1,0(/),/,()1(2NnXnNX 定理定理2.:设:设 X1,X2,Xm是抽自正态总体是抽自正态总体X 的样本,的样本,XN(1,12),样本均值与样本方差为,样本均值与样本方差为Y1,Y2,Yn 是抽自正态总体是抽自正态总体 Y 的样本,的样本,Y N(2,22),样本均值与样本方差为,样本均值与样本方差为;,21211)(11 1XXmSXmXmiimii.)(11 ,121221YYnSYnYmiinii ).2()()(.II1121222221nmtnmSYX未知时,当.2)1()1(22212nmSnS
15、mS其中当两样本相互独立时,有当两样本相互独立时,有)1,1(I.22212221nmFSS证明证明:也相互独立。则有与由两样本相互独立,2221 S SI.I.由由定理定理2.2.1,知,知 故,式成立;故,式成立;)1(/)1(),1(/)1(2212222121nSnmSm)1,1()1()1()1()1(22222121nmFnSnmSm得由定理时,当1.2 .II22221 )1()1()1()1(22222221,nSnmSm且二者相互独立。且二者相互独立。分分布布的的可可加加性性,有有根根据据2 式式,得得由由时时,另另一一方方面面,当当)1(22221且且(3)式与式与(4)式
16、中的随机变量相互独立。式中的随机变量相互独立。由由 t 分布的定义,得分布的定义,得 )3()2()1()1(222221;nmSnSm)4(1 ,0 )(1121,NnmYX1121)()(nmSYX22221112112)1()1()()(nmSnSmnmYXN(0,1)221121)()(SnmYX换形式换形式分母互换分母互换)2()1()1()()(222211121nmSnSmnmYX 2(m+n-2)t(m+n-2).-2).例1.从正态总体N(4.2,52)中抽取容量为n的样本,若要求其样本均值位于区间(2.2,6.2)内的概率不小于0.95,则样本容量至少为多少?,于是知解:由
17、定理)5,2.4(.22nNX)5252.452()2.62.2(nnXnPXP95.01)52(2n.01.24975.0)52(nn,故可得到若要求其样本均值位于区间内的概率不小于0.95,则样本容量至少为25。例例2 设随机变量设随机变量Xt(n)(n1),Y1=X2,Y21/X2,求,求Y1,Y2的的分布。分布。),1(,)(),1,0(,:212nFnVUYnVNUnVUX则其中令解.),1(,)1(2122nFXYU所以这里再由F分布的性质,Y2F(n,1).小结 本讲首先介绍数理统计中三个常用的重要统计量的本讲首先介绍数理统计中三个常用的重要统计量的分布分布:2分布、分布、t 分布和分布和 F 分布分布;然后以定理的形式然后以定理的形式 给出了正态总体样本均值与样本方差给出了正态总体样本均值与样本方差的分布及其相关结论。的分布及其相关结论。作业作业教材第19页习题一:第4题第7题第14题第16题
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。