1、第六章第六章 数理统计的基本概念数理统计的基本概念6.1 总体、样本与统计量总体、样本与统计量6.2 常用统计分布常用统计分布 一、引言一、引言数理统计数理统计以概率论为理论基础以概率论为理论基础,研究研究 2)研究如何合理地研究如何合理地分析随机数据分析随机数据从而作出从而作出科学的科学的推断推断(称为称为统计推断统计推断).).6.1 总体、样本与统计量总体、样本与统计量 1)研究如何以有效的方式研究如何以有效的方式收集和整理收集和整理随随机数据机数据;数理统计的引入数理统计的引入 两类工作有密切联系两类工作有密切联系.将主要介绍统计推断方面的内容将主要介绍统计推断方面的内容.总体总体:研
2、究对象的单位元素所组成的集合:研究对象的单位元素所组成的集合.个体个体:组成总体的每个单位元素:组成总体的每个单位元素.例例1 要考察本校男生的身体情况,则将本校要考察本校男生的身体情况,则将本校的所有男生视为一个总体,而每一位男生就是的所有男生视为一个总体,而每一位男生就是一个个体一个个体.二、总体二、总体 如,关心电子元件的寿命,则寿命如,关心电子元件的寿命,则寿命 X 为其为其一个数量指标,且一个数量指标,且 X 是服从指数分布的随机是服从指数分布的随机变量变量.例例2 考察某厂生产的电子元器件的质量,将全考察某厂生产的电子元器件的质量,将全部产品视为总体,每一个元器件即为一个个体部产品
3、视为总体,每一个元器件即为一个个体.通常需要对总体的一项或几项通常需要对总体的一项或几项数量指标数量指标进进行研究行研究.如仅考虑男生的身高和体重如仅考虑男生的身高和体重(X,Y),不考虑不考虑男生的视力、胸围等男生的视力、胸围等.以后将以后将(实际实际)总体和数量指标总体和数量指标X等同等同起来起来.总总 体体 是是 随随 机机 变变 量量 由于上述数量指标往往是由于上述数量指标往往是随机变量随机变量,具有,具有一定的分布一定的分布.总体分布总体分布是指是指数量指标数量指标 X的分布的分布.三、样本三、样本 一般,从总体中抽取一部分一般,从总体中抽取一部分(取取 n 个个)进进行观测,再依据
4、这行观测,再依据这 n个个体的试验个个体的试验(或观察或观察)的结果去推断总体的性质的结果去推断总体的性质.样本样本:按照按照一定的规则一定的规则从总体中抽取的从总体中抽取的一部分个体一部分个体.抽样抽样:抽取样本的过程:抽取样本的过程.样本容量样本容量:样本中个体的数目:样本中个体的数目 n.将第将第 i 个个体的对应指标记为个个体的对应指标记为 Xi,i=1,2,n,构成的随机向量构成的随机向量(X1,X2,Xn)称为样本称为样本.样本样本是一组随机变量是一组随机变量,其具体试验其具体试验(观察观察)数值记为数值记为:x1,x2,xn,称为称为样本观测值样本观测值,简称简称样本值样本值.为
5、使样本具有代表性,抽样应满足什么条件为使样本具有代表性,抽样应满足什么条件从民意测验看抽样从民意测验看抽样?(1)Xi 与总体同分布与总体同分布;(2)X1,X2,Xn 相互独立相互独立.定义定义6.1.1 设设X1,X2,Xn是来自总体是来自总体X的样本,如果的样本,如果相互独立相互独立且每个分量与总体且每个分量与总体同分布同分布,称其为,称其为简单随机样本简单随机样本,简称样本,简称样本.若总体若总体X的分布函数为的分布函数为 F(x),则样本则样本X1,X2,Xn的联合分布函数为的联合分布函数为,),(221121nnnxXxXxXPxxxF nkkXxFk1)(判断统计量判断统计量是随
6、机变量且不含未知参数,称是随机变量且不含未知参数,称 T为为统计量统计量.对相应的样本值对相应的样本值(x1,x2,xn),称称 t=T(x1,x2,xn)为统计量的为统计量的统计值统计值.四、统计量四、统计量 定义定义6.1.2 设设X1,X2,Xn是总体是总体X的样本,的样本,T为为n元实值函数,若样本的函数元实值函数,若样本的函数T=T(X1,X2,Xn)总总 体体 是是 随随 机机 变变 量量 统计量统计量 是是 随机变量随机变量(或向量)或向量)样样 本本 是是 随随 机机 向向 量量样本均值样本均值:样本方差样本方差:niiXnX11 niiXXnS122)(11常见统计量:常见统
7、计量:样本样本 k 阶原点矩阶原点矩:样本样本k阶中心矩阶中心矩:nikikXnA11 nikikXXnM1)(1统称统称样本矩样本矩XA 12122122211AAXXnSnnMnii 几个重要关系式几个重要关系式:X,S2,Ak,Mkx,s2,ak,mk统计量统计量统计值统计值 思考思考 样本矩与总体矩样本矩与总体矩(即第四章中定义即第四章中定义的矩的矩)的概念有什么区别?的概念有什么区别?样本矩样本矩 是是 随机变量随机变量!总体矩总体矩 是是 数值数值!从民意测验看抽样从民意测验看抽样 1936年,年,Franklin Delano Rosevelt(罗斯福罗斯福)与共和党的候选人与共
8、和党的候选人 Kansas州州长州州长Alfred Landon(兰登兰登)竞选总统竞选总统.绝大多数观测家认为绝大多数观测家认为罗斯福会是获胜者,但文学摘要却预测兰罗斯福会是获胜者,但文学摘要却预测兰登会以登会以 57%:43%的优势获胜的优势获胜.摘要自摘要自1916年以来的历届总统选举中都年以来的历届总统选举中都正确地预测出获胜的一方正确地预测出获胜的一方,但这次罗斯福以但这次罗斯福以 62%:38%的压倒优势取胜!的压倒优势取胜!(不久文学摘不久文学摘要就垮了要就垮了)摘要调查的过程是将问卷寄给一千万摘要调查的过程是将问卷寄给一千万人,人,这些人的名字和地址摘自电话簿或俱这些人的名字和
9、地址摘自电话簿或俱乐部会员名册,这筛掉了不属俱乐部或未装乐部会员名册,这筛掉了不属俱乐部或未装电话的穷人电话的穷人.这在这在1936年前影响不大年前影响不大,因为穷人富翁以类因为穷人富翁以类似的思考投票;但似的思考投票;但1936年经济正在从大萧条年经济正在从大萧条中恢复,故穷人选罗斯福,而富翁们选兰登中恢复,故穷人选罗斯福,而富翁们选兰登.2555121)1(,2 ,max ,XXpXiXXXi 例例 6.1.1 设总体设总体 X B(1,p),其中,其中 p 是未是未知参数,知参数,(X1,X2,X5)是来自是来自 X 的简单的简单随机样本,随机样本,1)指出以下变量哪些是统计量,为什么?指出以下变量哪些是统计量,为什么?2)确定确定(X1,X2,X5)的联合概率分布?的联合概率分布?1(1),0,1xxP Xxppx 2)因因 25pX 解解 1)只有只有 不是统计量不是统计量,因因 p 是未知参数是未知参数.51151)(1ixiiiiipxpxXP).5,2,1(,1,0 ixi 故故(X1,X2,X5)的联合分布律为的联合分布律为 51551)(1ixixiippPX1=x1,X2=x2,X5=x5 某厂生产的一批产品中次品率为某厂生产的一批产品中次品率为 p 。从中。从中抽取抽取1010件产品装箱。件产品装箱。