总体均值的区间估计课件.ppt

上传人(卖家):三亚风情 文档编号:2911230 上传时间:2022-06-10 格式:PPT 页数:32 大小:2.94MB
下载 相关 举报
总体均值的区间估计课件.ppt_第1页
第1页 / 共32页
总体均值的区间估计课件.ppt_第2页
第2页 / 共32页
总体均值的区间估计课件.ppt_第3页
第3页 / 共32页
总体均值的区间估计课件.ppt_第4页
第4页 / 共32页
总体均值的区间估计课件.ppt_第5页
第5页 / 共32页
点击查看更多>>
资源描述

1、统计学统计学-6统计推断:对总体参数的估计统计推断:对总体参数的估计 l 抽样抽样:总体、样本、个体、样本容量 统计量、参数 抽样方法l 抽样分布抽样分布: l 样本均值:中心极限定理;样本均值的标准化l 样本比例: np5和n(1-p)5,pN(, (1-) / n) l 2分布: xi2,2(n)N(n,2n)l t分布: 趋近标准正态分布l F分布: F(m,n), F=(X/m) / (Y/n) 自由度(m,n)上章复习上章复习-内容概要内容概要ni 1l 简单随机抽样简单随机抽样 RND(RV.UNIFORM(a,b) =ROUND(RAND()*(b-a)+a,0)l 系统抽样系统

2、抽样 起点,距离nl 分层抽样分层抽样 先分类,再在每类中简单随机抽样l 整群抽样整群抽样 先分群,再随机抽群进行普查或简单随机抽样l 多级抽样多级抽样 总体-群-子群-子群的子群,再普查或简单随机抽样上章复习上章复习-概率样本上章复习上章复习-抽样误差抽样误差 l 样本统计量和总体参数之间的差异成为样本误差。利用样本,可以估计总体,但不能保证完全准确。l 标准误:标准误:样本统计量的抽样分布的标准差,称为统计量的标准误(standard error),标准误衡量的是统计量的离散程度,它测度了用样本统计量估计总体参数的精确程度。如样本均值的标准误:/n。l 当计算标准误时涉及的总体参数未知时,

3、用样本统计量代替计算的标准误,称为估计的标准误估计的标准误(standard error of estimation)。如样本均值的标准误:s/n。上章复习上章复习-计算机软件的应用l随机数的产生l抽取随机样本l随机生成正态分布样本l样本均值抽样分布作图l样本比例抽样分布随机模拟上章复习上章复习-作业作业l课后练习引言引言 推断统计两个重点:推断统计两个重点:估计、假设检验估计:估计:l点估计l区间估计l样本量l 估计量估计量:统计量是样本的(不含未知总体参数的)函数,用于估计的统计量称为估计量。l 估计值估计值:若得到一组观察值,代入估计量得到具体的数值,成为参数的估计值。l 在不引起混淆的

4、场合可统称为估计。 点估计点估计 l 样本统计量估计总体参数。l 一致的最小方差的无偏的估计量一致的最小方差的无偏的估计量来估计总体参数。l 一致l 无偏l 有效 如样本均值、方差、比例区间估计区间估计 l 例例:民意调查中说“支持率为85%加减5%的误差,其置信度为95%”。l 点估计85%,l 置信区间(80%,90%),l 80%置信下限,90%置信上限,l 置信度为95%,(显著性水平)为0.05。区间估计区间估计l 置信度:重复构造置信区间,这些区间中包含总体参数真值得区间数所占的比率。l 1)每一个置信区间都是随机的,因样本不同而不同,不是所有的区间都包含总体参数的真值。l 2)实

5、际问题中,往往只取一个样本,得到一个置信区间。无法确定这个区间是否包含总体参数真值,只能希望它是大量包含了总体参数真值得区间中的一个。l 例:对某班成绩进行多次抽样,有95%的样本得到的区间包含了全班学生的平均分,有5%的样本得到的区间没有包含平均分。其中一个样本得到的置信区间是60-80,能不能说60-80这个区间以95%的概率包含全班学生的平均分,或全班学生的平均分有95%的概率落在60-80之间?总体均值的区间估计总体均值的区间估计 -正态总体、方差已知正态总体、方差已知样本均值的期望值:,样本均值的标准误:/nZ(样本均值) =(样本均值-)/(/n)=样本均值-Z(样本均值) (/n

6、)总体均值的区间估计总体均值的区间估计 -正态总体、方差已知正态总体、方差已知l例:例:某地区成年人的睡眠时间服从正态分布,总体的标准差为0.3小时。一项随机调查得到16个成年人的平均睡眠时间为7.3625小时。请给出该地区成年人平均睡眠时间的点估计和95%置信区间。?总体均值的区间估计总体均值的区间估计 -大样本、方差未知大样本、方差未知l 正态或非正态总体、方差未知、大样本正态或非正态总体、方差未知、大样本l 当n30时,样本均值抽样分布趋近正态分布,并可以用s代替l 总体均值的置信区间为:l例:为了解某企业员工平均收入,随机抽取80名员工为样本,得样本均值为2024.36元,样本标准差为

7、435.705元,请问1)总体均值是多少?2)总体均值的一个合理范围是什么?3)结果表示什么?总体均值的区间估计总体均值的区间估计 -大样本、方差未知大样本、方差未知?l T分布形态l t分布自由度:n-1。总体均值的区间估计总体均值的区间估计 -正态总体、方差未知、小样本正态总体、方差未知、小样本 严格来说,选择Z值还是t值取决于总体标准差是否已知。一般假定总体服从正态分布。 总体均值的区间估计总体均值的区间估计 -正态总体、方差未知、小样本正态总体、方差未知、小样本 l 例例:某地区成年人的睡眠时间服从正态分布。一项随机调查得到16个成年人的平均睡眠时间为7.3625小时,样本标准差为0.

8、4924小时。请给出该地区成年人平均睡眠时间的点估计和95%置信区间。?样本量、置信度、区间宽样本量、置信度、区间宽l样本量确定,置信度增加,区间加宽;区间变窄,置信度降低。l区间宽度固定,样本量增加,置信度增加l置信度固定,样本量增加,区间变窄。 软件计算:单个正态样本均值的区间估计软件计算:单个正态样本均值的区间估计l正态总体、方差未知正态总体、方差未知 ,按t值而非z值计算lSPSS analyzedescriptiveexplore Ananlyze-compare means-单样本t检验 (和上面得到的结果一致)lExcell 工具-数据分析-描述统计-(按t值计算的结果)两个均值

9、的区间估计两个均值的区间估计 l 两个独立正态总体两个独立正态总体1-2的区间估计的区间估计l 假定样本量为m和n的独立样本x1,xm和y1,yn分别来自两个独立正态分布XN(1,12)和YN(1,12)l 点估计:l 区间估计:两个均值的区间估计两个均值的区间估计l 两个配对两个配对/相依正态总体相依正态总体D=1-2的区间估的区间估计计l 同一个人减肥前后的重量比较l 治疗前后的症状比较l 同样情况下对两种材料的某种性能的比较等l (X,Y)代表配对样本,代表配对样本,Di=Xi-Yi,假定,假定D服从均值为服从均值为D=1-2的正态分布。的正态分布。软件计算:两个正态样本均值差的区间估计

10、软件计算:两个正态样本均值差的区间估计l1)独立)独立:lSPSS:Analyze-compare means-independent sample T Testlsig如大于0.05,则没有证据认为这两个数据总体的方差不等。l2)配对)配对/相依相依lSPSS:analyzecompare meansparied samples T Test总体比例的区间估计总体比例的区间估计l 求比例的置信区间,必须满足两个假定。l 满足二项分布的条件满足二项分布的条件l 样本是计数的结果l 只有两种互斥的可能结果l 每次试验中,成功率保持不变l 每次试验室相互独立的l np5和n(1-p)5。(保证中心

11、极限定理的条件得到满足。)总体比例的区间估计总体比例的区间估计l样本比例标准误 l置信度为(1-a)的置信区间的公式:l此公式仅适用于大总体,大样本。 1)如此公式计算出来的区间包含了0或1,则说明样本量不够大。 2)p 越接近0或1,为了正态近似所需要的样本量就越大。 总体比例的区间估计总体比例的区间估计l 例:某企业调查职工流动原因,随机抽取200人为样本,其中140人表示他们离开企业的原因是因为无法和管理人员融洽相处。试分析基于这一原因离开企业的人员的真正比例,构造95%的置信区间。?解:p =140/200=0.7。总体很大,np=1405,n(1-p)=605,样本量也足够大,p的抽

12、样分布可以用正态分布近似。1-a=0.95,a/2=0.025,Z0.025=1.96l 总体比例之差总体比例之差p1-p2的区间估计的区间估计l 可以证明,当可以证明,当n1和和n2两者都很大,而且两者都很大,而且p1和和p2不太接近不太接近0或者或者1时,时,p 1和和p 2的抽样的抽样分布近似服从正态分布。分布近似服从正态分布。 总体比例的区间估计总体比例的区间估计总体比例的区间估计总体比例的区间估计l 例例:某保险公司想比较在两个城市做广告的效果,从两个城市分别随机地调查了1000成年人,看过广告的比例分别为p 1=0.26和p 2=0.21,试求p1-p2的95%的置信区间。l 解:

13、解:n=1000,大样本。p 1和p 2不太接近0或1。?估计总体均值时样本量的确定估计总体均值时样本量的确定 l在重复抽样或无限总体抽样的条件下,在重复抽样或无限总体抽样的条件下,取不小于结果的最小整数。取不小于结果的最小整数。三影响因素三影响因素:1)希望达到的置信度(常选95%,Z值1.96,99%,Z值2.58);2)最大可容许误差E(如0.01);3)总体的变异程度,即总体的标准差。l通常总体标准差未知:l1)利用其它研究中的相同或类似样本的标准差代替;l2)用极差估计:假定总体为近似正态分布,则越99.7%观测值都位于平均值加减3倍标准差之间,=R/6 (参见第三章)l3)进行预调

14、查。正式调查前先选择一个初始样本,计算出其标准差,再用这一标准差计算出正式样本的容量。 估计总体均值时样本量的确定估计总体均值时样本量的确定 估计总体均值时样本量的确定估计总体均值时样本量的确定l例例:拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪的95%置信区间,希望估计误差为400元,应抽取多大样本?解:已知=2000,E=400,Za/2=1.96n=1.96220002/4002=96.04,取97。估计总体比例时样本量的确定估计总体比例时样本量的确定l在重复抽样或无限总体抽样的条件下,取不小于结果的最小整数。取不小于结果的最小整数。三个影响因素三个影响因素在在值未知的情况下值未知的情况下1)利用其它研究中的相同或类似样本的标准差代替;2)进行预调查。3)通常取使(1-)最大的值,即0.5。 l例例:根据以往的生产统计,某产品的合格率为90%,现要求估计误差为5%,在求95%的置信区间时,应抽取多少产品为样本?估计总体比例时样本量的确定估计总体比例时样本量的确定?解解:已知=0.9,E=0.05,Za/2=1.96。n=1.9620.9(1-0.9)/0.052=138.3,取139。作业l课后练习

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(总体均值的区间估计课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|