1、安徽师范大学数学计算机科学学院徐林Email:第四章第四章 数理统计基本概念数理统计基本概念引言引言总体与样本总体与样本统计中常用的三种分布统计中常用的三种分布抽样分布抽样分布引引 言言数理统计学是数学的一个重要分支,它研究怎样数理统计学是数学的一个重要分支,它研究怎样有效地有效地收集、整理和分析收集、整理和分析带有随机性的数据,以带有随机性的数据,以对所考察的问题作出推断或预测,并为采取一定对所考察的问题作出推断或预测,并为采取一定的决策和行动提供依据和建议的决策和行动提供依据和建议。几个实际问题:几个实际问题:1.估计产品寿命问题估计产品寿命问题:根据用户调查获得某品牌洗衣根据用户调查获得
2、某品牌洗衣机机50台的使用寿命为,台的使用寿命为,5,5.5,3.5,6.2,.。根。根据这些数据希望得到如下推断:据这些数据希望得到如下推断:A可否认为产品的平均寿命不低于可否认为产品的平均寿命不低于4年?年?B保质期设为多少年,才能保证有保质期设为多少年,才能保证有95%以上的产品以上的产品过关?过关?2 2商品日投放量问题:如草莓的日投放量多少合理?商品日投放量问题:如草莓的日投放量多少合理?如何安排银行各营业网点的现金投放量?快餐食品以如何安排银行各营业网点的现金投放量?快餐食品以什么样的速度生产最为合理等等。什么样的速度生产最为合理等等。例例 制衣厂为了合理的确定服装各种尺码的生产比
3、制衣厂为了合理的确定服装各种尺码的生产比例,需要调查人们身长的分布。现从男性成人人群例,需要调查人们身长的分布。现从男性成人人群中随机中随机选取选取100100人人,得到他们的身长数据为得到他们的身长数据为:(1)(1)试推断试推断男性成人身长男性成人身长X X的概率密度的概率密度(2)(2)若已知若已知X X服从正态分布服从正态分布N(N(,2 2),),试估计参数的试估计参数的,2 2值值已知已知“总体总体”的分布类型的分布类型,对分布中的未知参数所对分布中的未知参数所进行的统计推断属于进行的统计推断属于“参数统计参数统计”.数理统计方法的特点1.1.数理统计方法的归纳性质数理统计方法的归
4、纳性质数理统计是数学的一个分支,但是他们在推理方法上有区别的。数学的方法主要是演绎,而统计的方法主要是归纳。例子1 抽烟有害健康问题的证明例子2 证明等腰三角形两底角相等在几何学和统计学上方法是不一样的。数理统计方法的特点2.数理统计方法得到的结果具有不确定性 数理统计所依据的数据在采集的时候具有随机性,虽然它也可以反映总体的特征,但是有不确定性,这是逻辑的必然。统计学的作用就是提供归纳推理的方法以及计算这种不确定性程度的方法。这种带有不确定性的推断称为统计推断,而不确定的程度可以用概率表示4.1 随机样本随机样本一、总体与样本一、总体与样本 1.1.总体总体:研究对象的全体。通常指研究对:研
5、究对象的全体。通常指研究对象的某项数量指标。象的某项数量指标。组成总体的元素称为组成总体的元素称为个体。个体。从从本质上讲,总体就是所研究的随机变量或本质上讲,总体就是所研究的随机变量或随机变量的分布。随机变量的分布。2.样本样本:来自总体的部分个体来自总体的部分个体X X1 1,X Xn n 如果满足:如果满足:(1 1)同分布性:同分布性:X Xi i,i=1,ni=1,n与总体同分布与总体同分布.(2 2)独立性:独立性:X X1 1,X Xn n 相互独立;相互独立;则称为则称为容量为容量为n n 的简单随的简单随机样本机样本,简称,简称样本样本。而称而称X X1 1,X Xn n 的
6、的一次一次实现为样本观察值,记为实现为样本观察值,记为x x1 1,x xn n 样本的双重性质1.1.在具体的试验实施之前,其结果是未知在具体的试验实施之前,其结果是未知的,只能预料其取值范围,因此是随机的,只能预料其取值范围,因此是随机变量,因此才有样本的统计分布,这样变量,因此才有样本的统计分布,这样才可以谈到统计推断。但是在样本观察才可以谈到统计推断。但是在样本观察之后,样本就是具体的数字。之后,样本就是具体的数字。2.2.对于理论工作者而言,更应重视样本是对于理论工作者而言,更应重视样本是随机变量这一事实。随机变量这一事实。来自总体X的随机样本X X1 1,X Xn n可记为),.(
7、),(,1xFxfXXXiidn或显然,样本联合分布函数或密度函数为 niinxFxxxF121*)(),(或或 niinxfxxxf121*)(),(3.总体、样本、样本观察值的关系总体、样本、样本观察值的关系总体总体 样本样本 样本观察值样本观察值 理论分布理论分布 统计是从手中已有的资料统计是从手中已有的资料样本观察值,去推断样本观察值,去推断总体的情况总体的情况总体分布。样本是联系两者的桥梁总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值本取到样本观察值的规律,因而可以用样
8、本观察值去推断总体去推断总体统计推断1.二、统计量二、统计量定义:定义:称样本称样本X X1 1,X Xn n 的函数的函数g(g(X X1 1,X Xn n )是总体是总体X X的一个的一个统计量统计量,如果如果g(g(X X1 1,X Xn n )不含未知参数不含未知参数,1.11 niiXnX样样本本均均值值,)()(11.22122SSXXnSnii 标标准准差差样样本本均均方方差差样样本本方方差差几个常用的统计量几个常用的统计量 :nikiknikikXXnBXnA11,)(11中中心心矩矩原原点点矩矩3.样本样本k阶矩阶矩4.经验分布函数经验分布函数 用用S(x)表示样本表示样本X
9、1,Xn中不大于中不大于x得随机变量个数。定义经验分布函得随机变量个数。定义经验分布函数数Fn(x)为为)(1)(xSnxFn4.2 统计中常用的三种分布统计中常用的三种分布一、一、2分布分布 统计量的分布称为抽样分布。数理统计中常用到如下三个分布:2 2分布、t t 分布和F F分布。.).(),1,0(,.1221221分布分布的的称为自由度为称为自由度为则则设设构造构造 nnXNXXniiiidn2.2分布的分布的密度函数密度函数f(y)曲线曲线 0y,00y,ey)y(f2y12n)2/n(212/n例例1:设:设X1,X10是取自是取自N(0,0.32)的样本的样本,求求 10124
10、4.1iiXP3.分位点分位点 设设X 2(n),若对于若对于:0 1,存在存在0)(2 n 满足满足,)(2 nXP则称则称)(2n 为为)(2n 分布的上分布的上 分位点。分位点。)(2nP220附表附表34.性质:性质:a.分布可加性分布可加性 若若X 2(n1),Y 2(n2),X,Y独立,则独立,则 X+Y 2(n1+n2)b.期望与方差期望与方差 若若X 2(n),则则E(X)=n,D(X)=2n1.构造构造 若若XN(0,1),Y 2(n),X与与Y独立,则独立,则).(/ntnYXT t(n)称为自由度为称为自由度为n的的t分布。分布。二、二、t分布分布t(n)(n)的概率密度
11、为的概率密度为tntnnnthn,)1()2()21()(2122.2.基本性质基本性质:(1)f(t)(1)f(t)关于关于t=0(t=0(纵轴纵轴)对称。对称。(2)f(t)(2)f(t)的极限为的极限为N(0N(0,1)1)的密度函数,即的密度函数,即 3.3.分位点分位点 设设T Tt(n)t(n),若对若对:0:0 1,0(n)0,满足满足PTPT t t(n)=(n)=,则称则称t t(n)(n)为为t(n)t(n)的上侧分位点的上侧分位点 x,e21)t()t(flim2tn2)(nt注注:)()(1ntnt )(1nt)(nt1234,XXXX2(,)XN 34221()()i
12、iXXYX三、三、F分布分布 1.构造构造 若若U 2(n1),V 2(n2),U,V独立,则独立,则).,(/2121nnFnVnUF 称为第一自由度为称为第一自由度为n1,第二自由度为第二自由度为n2的的F分布分布,其概率密度为其概率密度为 0y,00y,)ynn1)(2n()(y)n/n)(2nn()y(h2/)nn(2122n12n2/n2121211112.2.FF分布的分位点分布的分位点对于对于:00 10)0,满足满足PFPF F F(n(n1 1,n n2 2)=)=,则则称称F F(n(n1 1,n n2 2)为为F(nF(n1 1,n n2 2)的的上侧上侧 分位点;分位点
13、;),(21nnF 1),(211nnFFP证明证明:设设FF(n1,n2),则则),(1),(12211nnFnnF 注:注:1),(11211nnFFP),(112nnFF),(11211nnFFP),(112nnFFP得证得证!4.3 抽样分布抽样分布211.,(,),(0,1)/iidnXXXNUNn 若则证明证明:niiXnX11是是n 个独立的正态随个独立的正态随机变量的线性组合机变量的线性组合,故故服从正态分布服从正态分布niiXEnXE1)(1)(nXDnXDnii212)(1)(),(2nNX)1,0(/NnX;)1(),(,.2221相互独立相互独立与与则则若若SXNXXi
14、idn );1()1()2(2222 nSn ).1(/)3(ntnSXT(3)证明证明:)1,0(/NnXU 且且U与与V独立独立,根据根据t分布的构造分布的构造);1()1(222 nSnV )1(1 ntnVU得证得证!121212222112212(2)-(-)(-1,-1).1/1/(-1)(-1)-2wwX YTt nnSnnnSnSSnn2212=,进称为样一一步步,假,假定定就就有有其其中中混混合合本本方方差差.);1n,1n(F/S/SF)1(.),(NY,Y),(NX,X.32122222121222iidn1211iidn121 则且两样本独立若例例1:设总体:设总体XN(10,32),X1,Xn是它的一个样本是它的一个样本 61iiXZ(1)写出写出Z所服从的分布所服从的分布;(2)求求P(Z11).例例2:设:设X1,Xn是取自是取自N(,2)的样本的样本,求样求样本方差本方差S2的期望与方差。的期望与方差。