1、第六章第六章 数理统计的基本概念数理统计的基本概念数数理理统统计计以以概概率率论论为为基基础础,主主要要研研究究如如何何收收集集、整整理理和和分分析析实实际际问问题题的的数数据据(有有限限的的资资源源),以以便便对对所所研研究究的的问问题题作作出出有有效效的的(精精确确而而可可靠靠)结结论论。基础概率论基础概率论 功能处理数据功能处理数据 目的作出科学推断(就概率特征)目的作出科学推断(就概率特征)6.1 总体与样本总体与样本总体总体 作为研究对象的随机变量作为研究对象的随机变量,,记作记作YX样本样本次试验所得到的结果次试验所得到的结果对总体进行对总体进行n),(),(2121nnYYYXX
2、X,记作记作注意:注意:都都是是随随机机变变量量,nnYYYXXX,2121样本容量样本容量样本观测值样本观测值n),(),(2121nnxxxXXX,数值,记作数值,记作的一组具体的一组具体,样本样本简单随机样本简单随机样本独立同分布独立同分布,nXXX,21结论:结论:的一组样本,则的一组样本,则为来自总体为来自总体,设设XXXXn,21的联合概率分布为的联合概率分布为,则则率分布为率分布为是离散型随机变量,概是离散型随机变量,概若总体若总体nXXXxXPX,)1(21 niiinnxXPxXxXxXP12211,,的联合概率密度为的联合概率密度为,则则)(率密度为率密度为是连续型随机变量
3、,概是连续型随机变量,概若总体若总体nXXXxX,)2(21 niinxxxx121*)(),(,的的联联合合分分布布函函数数为为,则则的的分分布布函函数数为为若若总总体体nXXXxFX,),()3(21 niinxFxxxF121*)(),(,6.2 用样本估计总体的分布用样本估计总体的分布数理统计的主要任务之一。数理统计的主要任务之一。,)1(是离散型的是离散型的若总体若总体Xnxxx,样样本本观观测测值值为为,21),()(21nmxxxm )()(:将将观观测测值值从从小小到到大大排排列列的的频频率率来来估估计计。以以用用取取值值可可的的概概率率则则由由大大数数定定理理,取取值值)()
4、()(iiixxXPx,)2(是连续型的是连续型的若总体若总体Xnxxx,样样本本观观测测值值为为,21,2,1,21记记频频率率为为,数数个个小小区区间间内内观观察察值值的的个个观观察察落落在在第第,个个小小区区间间(一一般般等等分分)分分成成其其中中,将将都都包包含含在在,使使取取定定一一适适当当区区间间rknkrbaxxxbakn,kh记记小小区区间间长长度度为为频频率率直直方方图图。矩矩形形,这这样样得得到到为为高高作作上上以以在在区区间间kkkknhnaa,(1 nnaakkk上上矩矩形形的的面面积积为为区区间间,(1 的的频频率率样样本本落落在在区区间间,(1kkaa 的的概概率率
5、总总体体落落在在区区间间,(1kkaa kkaadxx1)(积积。曲曲线线下下的的曲曲边边梯梯形形的的面面上上区区间间)(,(1xaakk )()3(xFn样本的分布函数样本的分布函数将观测值从小到大排列,并写出频率分布表:将观测值从小到大排列,并写出频率分布表:观测值观测值频数频数频率频率)(ix)1(x)2(x)(lxim1m2mlmnmii 1 l 2 其中,其中,,)()2()1(lxxx ,1nmlii 11 lii ,0 当当);1(xx )(xFn,)(xxii 当当);1()(iixxx ,1 当当).(lxx 样本分布函数如下:样本分布函数如下:图图形形特特点点:右右连连续续
6、,台台阶阶形形 )(xFn 1 ikk1 21 1 )1(x 0)2(x )3(x )(ix )1(ix )(lxx样本分布函数样本分布函数Fxn()的性质:的性质:(1)01Fxn()(2)Fxn()是非减函数是非减函数(3)FFnn(),()01(4)Fxn()在每个观测点在每个观测点xi()处是右连续的,点处是右连续的,点xi()是是Fxn()的跳跃间断点,的跳跃间断点,Fxn()在点在点xi()处的跳跃度就处的跳跃度就等于频率等于频率i。样本分布函数样本分布函数Fxn()是事件是事件x的频率;的频率;总体分布函数总体分布函数Fx()是事件是事件x的概率。的概率。由贝努利大数定律:当由贝
7、努利大数定律:当n时,时,Fxn()按按概率收敛于概率收敛于Fx(),即:,即:1)|)()(|lim,0 xFxFPnn!这是我们在数理统计中这是我们在数理统计中用样本推断总体用样本推断总体的理论基础。的理论基础。6.3 统计量统计量样本的函数样本的函数统计量(不含未知参数)统计量(不含未知参数)为了将样本中的信息提取出来,构造为了将样本中的信息提取出来,构造则则的的样样本本为为来来自自总总体体,设设,21Xxxxn统统计计量量。,),(21nxxxf样本是随机变量,所以统计量也是随机变量。样本是随机变量,所以统计量也是随机变量。常用的统计量分布常用的统计量分布 样本均值:样本均值:niix
8、nx11样本方差:样本方差:2121221)(1xxnxxnsniinii 修正样本方差:修正样本方差:2122*1)(11snnxxnsnii 样本标准差:样本标准差:niixxns12)(1修正样本标准差:修正样本标准差:snnxxnsnii1)(1112*样本阶原点矩:样本阶原点矩:nikikxnv11如:样本均值如:样本均值 是一阶原点矩。是一阶原点矩。niixnx11样本样本k k阶中心矩:阶中心矩:nikikxxnu1)(1一阶中心矩总是为零一阶中心矩总是为零.如:样本方差如:样本方差 是二阶中心矩是二阶中心矩 niixxns122)(1 niixxnu110)(1(1)使用计算器
9、计算统计量的值。)使用计算器计算统计量的值。(2)使用)使用EXCEL计算统计量的值。计算统计量的值。样本均值(样本均值(AVERAGE)样本方差(样本方差(VARP)样本标准差(样本标准差(STDEVPSTDEVP)修正样本标准差(修正样本标准差(STDEVSTDEV)修正的样本方差(修正的样本方差(VAR)例例1.1.已知样本观测值为已知样本观测值为15.8,24.2,14.5,17.4,13.2,20.8,17.9,19.1,21.0,18.5,16.4,22.6。计算样本平均值、样本方差及修正样计算样本平均值、样本方差及修正样本方差。本方差。输入观察值输入观察值求样本均值求样本均值B1:B12求样本方差求样本方差B1:B12求样本标准差求样本标准差B1:B12求修正的样本方差求修正的样本方差B1:B12求修正的样本标准差求修正的样本标准差B1:B12