1、关于总体平均数的推断统计关于总体平均数的推断统计样本平均数的抽样分布样本平均数的抽样分布 需考虑的问题:需考虑的问题:总体方差总体方差2是否已知;是否已知;总体是否正态分布;总体是否正态分布;样本为大样本还是小样本。样本为大样本还是小样本。样本平均数的抽样分布(样本平均数的抽样分布(2已知已知)总体方差总体方差2已知时已知时若(若(X1,X2,Xn)是抽自总体是抽自总体X的一个容量为的一个容量为n的简单随机样本,则依据的简单随机样本,则依据样本的所有可能观察值计算出的样本均样本的所有可能观察值计算出的样本均值的分布,称为样本均值的抽样分布。值的分布,称为样本均值的抽样分布。样本均值的抽样分布(
2、样本均值的抽样分布(2已知已知)正态总体、正态总体、2已知时已知时设(设(X1,X2,Xn)是抽自正态分是抽自正态分布总体布总体XN(,2)的一个容量为的一个容量为n的简单的简单随机样本,则其样本均值也是一个正态随机样本,则其样本均值也是一个正态分布随机变量,且有分布随机变量,且有样本均值的抽样分布样本均值的抽样分布正态总体、正态总体、2已知时已知时XXE)(nXDX22)(),(2nNX)1,0(/2NnXZ样本均值的抽样分布(样本均值的抽样分布(2已知已知)非正态总体、非正态总体、已知时已知时设总体设总体X的均值的均值和和2,当样本容量趋当样本容量趋向无穷大时,样本均值的抽样分布趋于向无穷
3、大时,样本均值的抽样分布趋于正态分布,且样本均值的数学期望和方正态分布,且样本均值的数学期望和方差分别为差分别为XXE)(nXDX22)(样本均值的抽样分布(样本均值的抽样分布(2未知)未知)正态总体、总体方差正态总体、总体方差未知时未知时设(设(X1,X2,Xn)是抽自正态分是抽自正态分布总体布总体XN(,2)的一个容量为的一个容量为n的简单的简单随机样本,则有随机样本,则有 其中1/ntnSXt1)(12nXXSniit 分布分布 t分布分布(t-distribution)是一连续型分布,其密度是一连续型分布,其密度函数为:函数为:t分布的数学期望和方差分别为:分布的数学期望和方差分别为:
4、E(t)=0 和和 D(t)=n/(n-2)2122121)(nntnnntft 分布的特征分布的特征 t 分布与正态分布的相似之处:分布与正态分布的相似之处:t 分布基线上的分布基线上的t值从值从;从平均数等于从平均数等于0处,左侧处,左侧 t 值为负,右侧值为负,右侧 t 值为正;值为正;曲线以平均数处为最高点向两侧逐渐下降,尾部无曲线以平均数处为最高点向两侧逐渐下降,尾部无限延伸,永不与基线相接,呈单峰对称形。限延伸,永不与基线相接,呈单峰对称形。区别之处在于:区别之处在于:t 分布的形态随自由度(分布的形态随自由度(df=n-1)的变化呈一簇分布的变化呈一簇分布形态(即自由度不同的形态
5、(即自由度不同的 t 分布形态也不同。分布形态也不同。自由度逐渐增大时,自由度逐渐增大时,t 分布逐渐接近正态分布。分布逐渐接近正态分布。自由度自由度 自由度自由度(degree of freedom)是指总体参数是指总体参数估计量中变量值独立自由变化的个数。估计量中变量值独立自由变化的个数。例题例题 从一从一零售商店全年的帐目中随机抽取零售商店全年的帐目中随机抽取25天的帐目,计算出这天的帐目,计算出这25天的平均零售额天的平均零售额为为780元,元,S为为100元。若已知该店的日零元。若已知该店的日零售额服从正态分布,全年的平均日零售售额服从正态分布,全年的平均日零售额为额为825元,问:
6、随机抽取元,问:随机抽取25天帐目,其天帐目,其平均零售额不到平均零售额不到780元的概率是多少?元的概率是多少?样本均值的抽样分布(样本均值的抽样分布(2未知)未知)非正态总体、总体方差非正态总体、总体方差2未知时未知时当总体为非正态分布时,若总体方差当总体为非正态分布时,若总体方差未知,样本为未知,样本为大样本大样本,可以利用,可以利用 t 分布分布或或正态分布正态分布近似求解;样本为近似求解;样本为小样本小样本时时无解无解。例题例题 某某总体总体均值为总体总体均值为80,总体分布形式及,总体分布形式及方差未知。从该总体中抽取一容量为方差未知。从该总体中抽取一容量为64的样本,得出的样本,
7、得出 S=2。问当问当 n=64 时,样时,样本均值大于本均值大于80.5的概率是多少?的概率是多少?样本均值的抽样分布(小结)样本均值的抽样分布(小结)示意图示意图总体均值的区间估计总体均值的区间估计待估待估参数参数已知条件已知条件 置信区间置信区间 备注备注 XN(,2),或非或非正态总体、大样本,正态总体、大样本,已知已知XN(,2),或非或非正态总体、大样本,正态总体、大样本,未知未知自由度自由度df=n-1nZX2nStX2例题例题 某种零件的长度服从正态分布。已知总某种零件的长度服从正态分布。已知总体标准差体标准差=1.5厘米。从总体中抽取厘米。从总体中抽取200个零件组成样本,测
8、得它们的平均长度个零件组成样本,测得它们的平均长度为为8.8厘米。试估计在厘米。试估计在95%置信水平下,置信水平下,全部零件平均长度的置信区间。全部零件平均长度的置信区间。例题例题 上例中,若已知该批零件共有上例中,若已知该批零件共有2000件,件,抽样方式采用不放回抽样,求该批零件抽样方式采用不放回抽样,求该批零件平均长度的置信水平为平均长度的置信水平为95%的置信区间。的置信区间。例题例题 为了制订高中生体锻标准,某区教育局为了制订高中生体锻标准,某区教育局在该区高中生中随机抽取在该区高中生中随机抽取36名男生测验名男生测验100米短跑成绩。结果这些男生的平均成米短跑成绩。结果这些男生的
9、平均成绩为绩为13.0秒,秒,S为为1.2秒。试估计在秒。试估计在95%置置信水平下,全区高中生信水平下,全区高中生100米跑的平均成米跑的平均成绩。绩。总体均值的假设检验总体均值的假设检验已知条件已知条件假设假设检验统计量检验统计量H0的拒绝域的拒绝域XN(,2),或非正态或非正态总体、大总体、大样本,样本,已知已知H0:0H1:0|Z|Z/2 H0:0H1:0 ZZ H0:0H1:0 ZZ XN(,2),或非正态或非正态总体、大总体、大样本,样本,未知未知 H0:0H1:0 自由度自由度df=n-1|t|t/2H0:0H1:0 ttH0:0H1:0 ttnXZ/0nSXt/0双侧检验与单侧
10、检验双侧检验与单侧检验 双侧检验(双侧检验(two-tailed test,two-sided test):):零假设为无显著差异的情况;零假设为无显著差异的情况;左侧检验(左侧检验(left-tailed test):):零假设为零假设为大于等于的情况;大于等于的情况;右侧检验(右侧检验(right-tailed test):零假设零假设为小于等于的情况。为小于等于的情况。例题例题某车间生产的铜丝的折断力服从正态某车间生产的铜丝的折断力服从正态分布,其平均折断力为分布,其平均折断力为570公斤,标准差公斤,标准差为为8公斤。公斤。现由于原料更换,虽然认为标准差不现由于原料更换,虽然认为标准差
11、不会有什么变化,但不知道平均折断力是会有什么变化,但不知道平均折断力是否与原先一样。否与原先一样。从新生产的铜丝中抽取从新生产的铜丝中抽取16个样品,测个样品,测得其平均折断力为得其平均折断力为574公斤。公斤。问:能否认为平均折断力无显著变化?问:能否认为平均折断力无显著变化?例题例题 某区某区初三英语测验平均分数为初三英语测验平均分数为65,该区,该区某校某校25份试卷的平均分数和标准差分别份试卷的平均分数和标准差分别为为70和和10。问该校初三英语平均分数与。问该校初三英语平均分数与全区是否一样?全区是否一样?例题例题 某市调查大学生在家期间平均每天用于某市调查大学生在家期间平均每天用于
12、家务劳动的时间。某教授认为不超过家务劳动的时间。某教授认为不超过2小小时。随机抽取时。随机抽取100名学生进行调查的结果名学生进行调查的结果为:平均时间为:平均时间1.8小时,方差小时,方差1.69。问:。问:调查结果是否支持该教授的看法?调查结果是否支持该教授的看法?错误的概率错误的概率 若真实的总体平均数若真实的总体平均数0,拒绝区域拒绝区域在左侧时在左侧时错误的概率错误的概率 错误的概率错误的概率 若真实的总体平均数若真实的总体平均数0,拒绝区域拒绝区域(region for rejection)在双侧时在双侧时错误的错误的概率概率错误的概率错误的概率 若真实的总体平均数若真实的总体平均数0,拒绝区域拒绝区域在右侧时在右侧时错误的概率错误的概率