1、数理统计数理统计 对随机现象进行观测、试验, 以取得有代表性的观测值 对已取得的观测值进行整理、 分析,作出推断、决策,从而 找出所研究的对象的规律性数数理理统统计计的的分分类类描述统计学推断统计学第六章第六章 数理统计的基本概念数理统计的基本概念参数估计 (第七章) 假设检验 (第八章) 回归分析 (第十一章) 方差分析 (第九章) 推断 统计学总体总体 研究对象全体元素组成的集合 所研究的对象的某个(或某些)数量指标的全体,它是一个随机变量(或多维随机变量).记为X . X 的分布函数和数字特征称为总体的分布函数和数字特征.总体和样本 6.1 基本概念基本概念样本样本 从总体中抽取的部分个
2、体.称 为总体 X 的一个容量为n的样本观测值,或称样本的一个实现.),(21nxxx),(21nXXX用 表示, n 为样本容量.样本空间样本空间 样本所有可能取值的集合. 个体个体 组成总体的每一个元素 即总体的每个数量指标,可看作随机变量 X 的某个取值.用 表示.iX若总体 X 的样本 满足:),(21nXXX一般,对有限总体,放回抽样所得到的样本为简单随机样本,但使用不方便,常用不放回抽样代替.而代替的条件是nXXX,21(1) 与X 有相同的分布nXXX,21(2) 相互独立),(21nXXX则称 为简单随机样本.简单随机样本简单随机样本N / n 10.总体中个体总数总体中个体总
3、数样本容量样本容量设总体 X 的分布函数为F (x),则样本niinxFxxxF121)(),(总若总体X 的密 d.f.为 f( x),则样本niinxfxxxf121)(),(总的联合 d.f.为),(21nXXX的联合分布函数为设 是取自总体X 的一个样本, ),(21nXXX),(21nrrrg),(21nxxxg为一实值连续函数,且不含有未知参数,),(21nXXXg则称随机变量为统计量统计量.),(21nxxx若是一个样本值,称),(21nXXXg的一个样本值为统计量定义定义统计量统计量例例 是未知参数, 22, ),(NX若 , 已知,则为统计量.是一样本,),(21nXXXni
4、iniiXXnSXnX122111,1是统计量, 其中),(2NXi则但niiX1221不是统计量.常用的统计量常用的统计量niiXnX11) 1 (为样本均值样本均值niiXXnS12211)2(为样本方差样本方差niiXXnS1211为样本标准差样本标准差),(21nXXX设是来自总体 X 的容量为 n 的样本,称统计量nikikXnA11) 3 (为样本的k 阶原点矩原点矩nikikXXnB11) 4(为样本的k 阶中心矩中心矩例如21222111nniiSXXnSnnBXA(5) 顺序统计量与极差顺序统计量与极差设),(21nXXX为样本,),(21nxxx为样本值,且*2*1nxxx
5、当),(21nXXX取值为),(21nxxx时,定义 r.v.nkxXkk, 2 , 1,*)(则称统计量)()2()1(,nXXX为顺序统计量顺序统计量.其中,max,min1)(1)1(knknknkXXXX称)1()(XXDnn为极差极差注注 样本方差样本方差 与样本二阶中心矩与样本二阶中心矩 的不同的不同2nS2SniniiniiXXXX12112222122XnXnXnii212XnXnii)(22XAn故22221)(1nSnnXAnnS222XABniiiniiXXXXXX12212)2()(推导推导关系式关系式221nSnnS1)推导推导 设2)(,)(XDXE则niiXnEX
6、E11 21nXD2)221)(nnSEn22)(SE 222)(XEEASEn XEXDXnEnii212122221n21nn221)(nSnnESE221nESnn例例1 1 从一批机器零件毛坯中随机地抽取10件, 测得其重量为(单位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199求这组样本值的均值、方差、二阶原点矩与二阶中心矩.解解),(1021xxx令)199,200,235,196,228,215,240,185,243,210(43.433)(9110122iixxs101225 .47522101iixA0 .390
7、)(101109101222iixxsB19.217)199200235196228215240185243230(101x则则例例2 2 在总体 中,随机抽取一个容量为36的样本,求样本均值 落在50.8到53.8之间的概率.)3 . 6,52(2NX解解)36/3 . 6,52(2NX故6/ 3 . 6528 .506/ 3 . 6528 .53)8 .538 .50( XP8239. 0)1429. 1()7143. 1 (例例3 3 设总体X 的概率密度函数为101)(xxxxf为总体的样本,求),(5021XXX(1)(1)X的数学期望与方差(2) )(2SE(3) )02. 0(X
8、P解解(1)0d)()(11xxxXEXE1001d2501)(501)(501)(1022xxxXEXDXD8414. 0)01. 0 , 0( NX近似近似(3)由中心极限定理(2). 2/1)()()(22XEXDSE2 . 012 1 . 0002. 012)02. 0(1)02. 0(XPXP 确定统计量的分布确定统计量的分布 是数理统计的基本是数理统计的基本 问题之一问题之一 正态总体是最常见的总体正态总体是最常见的总体, 本节介绍本节介绍的几个抽样分布均对正态总体而言的几个抽样分布均对正态总体而言.(1)(1) 正态分布正态分布则niiiniiiniiiaaNXa12211,特别
9、地,nNXnXnii21,1则统计中常用分布统计中常用分布nXXX,21),(2NXi若i.i.d.若nXXX,21),(2iiN标准正态分布的 分位数正态分布的上 分位数.定义定义正态分布的双侧 分位数.若 , 则称 为标准2zXP2Z若P Xz,则称z为标准标准正态分布的 分位数图形 575. 296. 1645. 1005. 0025. 005. 0zzz-2-1120.10.20.30.4z 常用数字-2-1120.10.20.30.4/2 -z/2=z1-/2/2 z/2-z/2zXP2zXP(2)(2)(2n分布分布 ( n为自由度 )定义定义 设nXXX,21相互独立,且都服从标
10、准正态分布N (0,1),则niinX122)(n = 1 时,其密度函数为0, 00,21)(221xxexxfx2468100.20.40.60.811.2n = 2 时,其密度函数为0, 00,21)(2xxexfx为参数为1/2的指数分布.2468100.10.20.30.4222121,02( )( )0,0 xnnne xxf xx一般其中,01)(dtetxtx在x 0时收敛,称为函数,具有性质)(!) 1()2/1 (, 1) 1 (),() 1(Nnnnxxx)(2n的密度函数为自由度为 n 的5101520250.10.20.30.4n=2n = 3n = 5n = 10n
11、 = 15 nnDnnE2)(,)(122例如例如05. 0307.18)10(307.18)10(2205. 0P)(,),(),(22122121222121nnXXXXnXnX则相互独立,若正态分布时,)(32nn分位数有表可查分布的上)(42n分布的性质分布的性质)(2n20.05(10)51015200.020.040.060.080.1n = 10nXXX,21相互独立,证证 1设niiiniNXXn122, 2 , 1) 1 , 0()(则1)(, 1)(, 0)(2iiiXEXDXEnXEnEnii122)(3d21)(2244xexXExi2)()()(2242iiiXEXE
12、XDnXDnDnii2)(122(3) (3) t t 分布分布 (Student 分布)定义定义则称 T 服从自由度为 n 的T 分布.其密度函数为nYXT tntnnntfn2121221)(),(, ) 1 , 0 (2nYNXX ,Y相互独立,设t 分布的图形(红色的是标准正态分布)n = 1n=20-3-2-11230.10.20.30.4t 分布的性质分布的性质1f n(t)是偶函数,2221)()(,tnettfn2T 分布的上 分位数 t 与双测 分位数 t/2 均 有表可查.-3-2-11230.050.10.150.20.250.30.35n = 101tttTP0.051
13、.81250.05(10) 1.8125P Ttt-t1.81250.05,1.81250.95P TP T8125. 1)10(95. 0t2/2/2)(tTPtTP-3-2-11230.050.10.150.20.250.30.35t/2-t/22281.2)10(05.02281.2025.02281.2025.0tTPTP/2/2(4) F 分布分布则称 F 服从为第一自由度第一自由度为n ,第二自由第二自由度度为 m 的F 分布分布. . 0, 001222), (2122tttmntmnmnmnmntfmnnn其密度函数为定义定义),(),(22mYnXX, Y 相互独立,设mYn
14、XF/令1234560.20.40.60.81234560.20.40.60.8m = 10, n = 4m = 10, n = 10m = 10, n = 15m = 4, n =10m = 10, n = 10m = 15, n = 10F 分布的性质分布的性质1 ( , ),1/ ( , )FF n mFF mn若则1234560.10.20.30.40.50.6例如19. 5)5 , 4(05. 0F),(1),(1nmFmnF事实上,19. 51) 5 , 4 (1) 4 , 5 (05. 095. 0FF故),(:),(),(2mnFFPmnFmnF有表可查分位数的上求?)4 ,
15、5(95. 0FF(n,m),(1mnFFP),(111mnFFP故),(1nmFF由于),(1111mnFFP1),(),(11nmFmnF因而),(111mnFFP例例1 1 证明),(1),(1nmFmnF证证证证2XY221(|( )|)( )P XtnP Xt n有例例2 2), 1()(212nFnt 证明:)()(212222ntYPntXP), 1 ()(212nFnt即设令nnnnG)(1) 1 ()(2222), 1 (nF2( ) ( ) ,(0,1)nXT nXGGNn 抽抽样分布的某些结论样分布的某些结论()() 一个正态总体一个正态总体) 1() 1(22122nX
16、XSnnii22) 1(Sn 与X相互独立设总体1,nXX,样本为( ),),(2nNX) 1 , 0( NnX) 1(nTnSXSnX(1)(2)2( ,)XN ( II ) 两个正态总体两个正态总体相互独立的简单随机样本.niiniiXXnSXnX12211)(111令mjjmjjYYmSYmY12221)(111设nXXX,21与mYYY,21分别是来),(211NX自正态总体),(222NY与的则) 1() 1() 1() 1(2222222121mSmnSn) 1, 1(22222121 mnFSS若21则) 1, 1(2221 mnFSS(3)则),(1),(1221211mNYm
17、YnNXnXmjjnii)1 , 0()()(2221NmnYX),(2221mnNYX相互独立的简单随机样本.设nXXX,21与mYYY,21分别是来21( ,)XN 自正态总体22(,)YN 与的) 1() 1() 1() 1(22222221mSmnSn222221) 1() 1(SmSn) 2(2mnYX 与222221) 1() 1(SmSn相互独立2) 1() 1()()(2222212221mnSmSnmnYX2) 1() 1(11)()(222121mnSmSnmnYX) 2(mnt(4)的概率不小于90%,则样本容量至少取多少?例例3 3设(72 ,100)XN ,为使样本均
18、值大于70解解 设样本容量为 n , 则)100,72(nNX故)70(1)70(XPXPn1072701n2 . 0令9 . 02 . 0n得29. 12 . 0n即6025.41n所以取42n例例4 4 从正态总体),(2NX中,抽取了 n = 20的样本1220(,)X XX(1) 求22012276. 120137. 0iiXXP(2) 求22012276. 120137. 0iiXP解解 (1)19(11922012222iiXXS即) 1() 1(222nSn22012276. 120137. 0iiXXP故2 .3514 . 720122iiXXP2 .3514 . 712012
19、220122iiiiXXPXXP98. 001. 099. 0查表(2) (2) )20(22012iiX22012276. 120137. 0iiXP故2 .354 . 72012iiXP2 .354 . 720122012iiiiXPXP97. 0025. 0995. 0例例5 5 设r.v. X 与Y 相互独立,X N(0,16), Y N(0,9) , X1, X2 , X9 与Y1, Y2 , Y16 分别是取自 X 与 Y 的简单随机样本, 求统计量1292221216XXXZYYY所服从的分布.解解)169, 0(921NXXX)1, 0()(431921NXXX16, 2 ,
20、1,)1 , 0(31iNYi)16(3122161iiY16314311612921iiYXXX)16( t2162221921YYYXXX从而例例6 6 设总体 的样本,26542321)()(XXXXXXY) 1 , 0( NX16,XX为总体 X 试确定常数 c , 使 cY 服从2分布.解解) 3 , 0 (, ) 3 , 0 (654321NXXXNXXX) 1 , 0 (31,31654321NXXXXXX265423213131XXXXXX故因此1/3.c) 2(312Y例例7 7 设12(,)nXXX 是来自N ( , 2 )的简单随机样本, X是样本均值,)(111221n
21、iiXXnS,)(11222niiXXnS,)(111223niiXnS,)(11224niiXnS则服从自由度为n - 1的t 分布的随机变量为1)A(1nSX1)B(2nSXnSX3)C(nSX4)D() 1 , 0(/NnX) 1()(12122nXXnii1)(1/122nXXnXnii) 1(ntniiXXXnn12)()( ) 1(故应选 (B)解解补充作业其样本均值为 niiXnX2121niiniXXXY12)2(求统计量1. 设 为从正态总体 X N ( , 2) 中抽取的简单随机样本 )2(,221nXXXn的数学期望 E (Y ).)0((转后页)YX ,2. 是来自正态 总体 的容量为 n 的两个样本均值, 且两样本相互独立, 试确定 n , 使两样本均值之差的绝对值超过 的概率大约为 0.01.),(2N 问问 题题 某水产养殖场两年前在人工湖中混养了黑、白两种鱼. 现在需要对黑白鱼数目的比例进行估计. 提示:分别用矩法与极大似然估计法解决此问题.如何估计湖中黑、白鱼的比例如何估计湖中黑、白鱼的比例