1、第五章第五章 抽样估计与假设检验抽样估计与假设检验第一节第一节 抽样调查与抽样估计抽样调查与抽样估计第二节第二节 假设检验假设检验第三节第三节 方差分析方差分析 众所周知,随机性是创造性不可缺少的因众所周知,随机性是创造性不可缺少的因数数随机性是人类思维中内在的特性,不是随机性是人类思维中内在的特性,不是通过赌博、衰减原子核、随机数表和其他你所通过赌博、衰减原子核、随机数表和其他你所知的而人为培植的,如果认为随机性是随心所知的而人为培植的,如果认为随机性是随心所欲的话,则是对人类创造性的侮辱。欲的话,则是对人类创造性的侮辱。19611961年诺贝尔物理学奖得主年诺贝尔物理学奖得主R R霍夫斯塔
2、霍夫斯塔特特学习目标学习目标1 1、理解抽样调查的概念与方法、理解抽样调查的概念与方法2 2、理解并掌握抽样分布、理解并掌握抽样分布3 3、掌握点估计与区间估计的基本方法、掌握点估计与区间估计的基本方法4 4、样本容量的确定、样本容量的确定5 5、理解假设检验的基本原理、理解假设检验的基本原理6 6、掌握假设检验的基本方法、掌握假设检验的基本方法7 7、理解并掌握方差分析的基本原理、理解并掌握方差分析的基本原理8 8、掌握单因素方差分析、掌握单因素方差分析 统计在生活的应用(分布)统计在生活的应用(分布)二战期间,二战期间,德国有德国有一个一个时期物资特别紧缺时期物资特别紧缺,对面包实行配给制
3、对面包实行配给制:政府把面粉发给指定面包房政府把面粉发给指定面包房,面包师傅烤好了面包再发给居民面包师傅烤好了面包再发给居民。有有一个一个统计学家怀疑统计学家怀疑其其所所在在区域区域的的面包师傅私扣面粉面包师傅私扣面粉。于于是,他是,他天天称自己面包天天称自己面包,过了一段时间,统计学家,过了一段时间,统计学家去找面包师傅说:去找面包师傅说:“政府规定配给面包政府规定配给面包为为400400克克,因模具和其因模具和其他他因素因素的影响,你烤的影响,你烤出的出的面包面包可可能能是是398398、399399克克,也也可可能能是是401401、402402克克。按照统计学按照统计学正态分布原理正态
4、分布原理,这么,这么多天多天的的面包重量平均应该等于面包重量平均应该等于400400克克,但你,但你给我给我的的面包平均重量面包平均重量只有只有398398克克,因此,因此我有理由怀疑我有理由怀疑你你使用使用了了较较小模具小模具,私吞了面粉私吞了面粉。”面包师傅承认确实私吞了面粉面包师傅承认确实私吞了面粉,并再三并再三道歉道歉,保证马上更换正常模具保证马上更换正常模具。(一)资金的习性(一)资金的习性u 不变资金是指在一定的产销量范围内,不受产销量变不变资金是指在一定的产销量范围内,不受产销量变动的影响而保持固定不变的那部分资金。动的影响而保持固定不变的那部分资金。p它一般包括厂房、机器设备等
5、固定资产占用的资金、原材它一般包括厂房、机器设备等固定资产占用的资金、原材料、产成品最低必要的储备资金等。料、产成品最低必要的储备资金等。u 变动资金是指随产销量的变动而成同比例变动的那部变动资金是指随产销量的变动而成同比例变动的那部分资金。分资金。p它一般包括直接构成产品实体的原材料、外购半成品等占它一般包括直接构成产品实体的原材料、外购半成品等占用的资金。用的资金。u 半变动资金是指虽然受产销量变化的影响,但不成同半变动资金是指虽然受产销量变化的影响,但不成同比例变动的资金,如一些辅助材料占用的资金。比例变动的资金,如一些辅助材料占用的资金。p半变动资金可采用一定的方法划分为不变资金和变动
6、资金半变动资金可采用一定的方法划分为不变资金和变动资金两部分。两部分。(二)资金需要量的预测方法(二)资金需要量的预测方法 1.因素分析法 2.销售百分比法 3.高低点法 4.回归分析法1.因素分析法因素分析法u 因素分析法又称分析调整法,是以有关项目基期年度因素分析法又称分析调整法,是以有关项目基期年度的平均资金需要量为基础,根据预测年度的生产经营的平均资金需要量为基础,根据预测年度的生产经营任务和资金周转加速的要求,进行分析调整,来预测任务和资金周转加速的要求,进行分析调整,来预测资金需要量的一种方法。资金需要量的一种方法。p这种方法计算简便,容易掌握,但预测结果不太精确。它这种方法计算简
7、便,容易掌握,但预测结果不太精确。它通常用于品种繁多、规格复杂、资金用量小的项目。通常用于品种繁多、规格复杂、资金用量小的项目。p资金需要量资金需要量=(基期资金平均占用额不合理资金占用额)(基期资金平均占用额不合理资金占用额)(1预测期销售增减额)预测期销售增减额)(1预测期资金周转速度预测期资金周转速度变动率)变动率)【例例5-1】因素分析法的应用因素分析法的应用u 西南公司上年度资金平均占用额为西南公司上年度资金平均占用额为3 400万元,经分万元,经分析,其中不合理部分析,其中不合理部分400万元,预计本年度销售增长万元,预计本年度销售增长5%,资金周转加速,资金周转加速2%。请估算本
8、年度资金需要量。请估算本年度资金需要量。u 分析提示分析提示p预测年度资金需要量预测年度资金需要量p=(3 400-400)(1+5%)(1-2%)=3 087(万元)(万元)2.销售百分比法销售百分比法u 销售百分比法,是根据销售增长与资产、负债增长之销售百分比法,是根据销售增长与资产、负债增长之间的关系,预测未来资金需要量的方法。间的关系,预测未来资金需要量的方法。p企业的销售规模扩大时,要相应增加流动资产;如果销售企业的销售规模扩大时,要相应增加流动资产;如果销售规模增加很多,还必须增加长期资产。规模增加很多,还必须增加长期资产。p销售百分比法首先假设某些资产与销售额存在稳定的百分销售百
9、分比法首先假设某些资产与销售额存在稳定的百分比关系,根据销售与资产的比例关系预计未来的资产额,比关系,根据销售与资产的比例关系预计未来的资产额,根据未来的资产额估算相应的负债和所有者权益,进而确根据未来的资产额估算相应的负债和所有者权益,进而确定筹资需要量。定筹资需要量。采用销售百分比法预测资金需要量的步骤:采用销售百分比法预测资金需要量的步骤:u(1)根据历史数据,预计销售收入增长率;)根据历史数据,预计销售收入增长率;u(2)计算资产负债表中敏感项目与销售收入的百分)计算资产负债表中敏感项目与销售收入的百分比。比。p敏感项目是指随着销售的变动同步变动的项目,其与销售敏感项目是指随着销售的变
10、动同步变动的项目,其与销售额之间存在着一个相对稳定的比率关系,如现金、应收账额之间存在着一个相对稳定的比率关系,如现金、应收账款、存货、应付账款等;款、存货、应付账款等;p非敏感项目是指与销售额之间不存在一个紧密的变动关系,非敏感项目是指与销售额之间不存在一个紧密的变动关系,如对外投资、长期负债和实收资本等。其计算公式为:如对外投资、长期负债和实收资本等。其计算公式为:p敏感项目与销售额的百分比敏感项目与销售额的百分比=(基期敏感项目数额(基期敏感项目数额基期销基期销售额)售额)100%u(3)计算需要增加的资金:)计算需要增加的资金:p需增加的资金需求需增加的资金需求=增加的资产增加的资产增
11、加的自发性负债增加的自发性负债u(4)计算内部资金筹资额:)计算内部资金筹资额:p留存收益增加预计销售额留存收益增加预计销售额计划销售净利率计划销售净利率(1股利股利支付率)支付率)u(5)计算外部融资需求:)计算外部融资需求:p外部融资需求(资产销售百分比外部融资需求(资产销售百分比新增销售额)(负新增销售额)(负债销售百分比债销售百分比新增销售额)留存收益增加额新增销售额)留存收益增加额【例例5-2】用销售百分比法预测资金需要量用销售百分比法预测资金需要量u 西北公司西北公司200年销售收入为年销售收入为40 000万元,当年营业万元,当年营业净利率为净利率为8%,股利支付率为,股利支付率
12、为60%。预计下一年度。预计下一年度201年销售收入将增长年销售收入将增长20%,超过现有生产能力,超过现有生产能力,需新增固定资产投资需新增固定资产投资1 000万元。万元。200年年12月月31日日资产负债表如表资产负债表如表5-1所示:所示:u 要求:预计要求:预计201年资金需要量,以及需要外部融资年资金需要量,以及需要外部融资的资金需求。的资金需求。(1)计算敏感项目占销售收入百分比。)计算敏感项目占销售收入百分比。资产期末余额销售百分比负债及所有者权益期末余额销售百分比货币资金3 0007.50%应付账款6 00015.00%应收账款净额2 0005.00%应付票据3 0007.5
13、0%存货7 00017.50%长期借款8 000非敏感项目固定资产净值9 000非敏感项目实收资本4 000非敏感项目无形资产2 000非敏感项目留存收益2 000非敏感项目资产总计23 0003000%负债及所有者权益23 0002250%(2)计算确定需要增加的总资金需求。)计算确定需要增加的总资金需求。u 201年因销售增长需要新增资金年因销售增长需要新增资金p=40 00020%(30%22.50%)=600(万元)(万元)u 201年因固定资产投资需要新增资金年因固定资产投资需要新增资金=1 000(万元)(万元)又过了几又过了几个个月月,这个,这个统计学家又去统计学家又去找面包师傅
14、说:找面包师傅说:“虽然最近虽然最近几几个个月月你卖你卖给我给我的的面包都面包都在在400400克克以以上上,可能你可能你没有私吞面粉没有私吞面粉,但,但也也可可能能是是你你从面包里特意挑大从面包里特意挑大的的给我给我。同样同样,根据正态分布原理根据正态分布原理,这么多,这么多天天的面的面包不可能没有包不可能没有低于低于400400克克的的面包面包。所所以,以,我认我认为你为你只只是是特意给了我比特意给了我比较大较大的的面包面包,而而不是不是更换了正常模更换了正常模具具。我会立刻要求政府检查模具我会立刻要求政府检查模具。”面包师傅只好当众认错道歉面包师傅只好当众认错道歉,接受接受处罚处罚。第一
15、节第一节 抽样调查与抽样估计抽样调查与抽样估计一、概率抽样与非概率抽样一、概率抽样与非概率抽样(一)概率抽样(一)概率抽样 概率抽样又称为随机抽样,就是按随机原则从总体中抽取样本。概率抽样又称为随机抽样,就是按随机原则从总体中抽取样本。随机原则即为总体中的每个单位都有一定的概率被选为样本单随机原则即为总体中的每个单位都有一定的概率被选为样本单位,每个总体单位能否被选为样本单位是随机的。位,每个总体单位能否被选为样本单位是随机的。从理论上讲,概率抽样是最理想、最科学的抽样方法,能保证从理论上讲,概率抽样是最理想、最科学的抽样方法,能保证样本数据对总体参数的代表性,而且能够将调查误差中的抽样样本数
16、据对总体参数的代表性,而且能够将调查误差中的抽样误差限制在一定的范围之内。误差限制在一定的范围之内。相对于非概率抽样来说,概率抽样也是花费较大的抽样方法。相对于非概率抽样来说,概率抽样也是花费较大的抽样方法。1、简单随机抽样、简单随机抽样(Simple random sampling)也称为纯随机抽样,是最基本的抽样形式,它也称为纯随机抽样,是最基本的抽样形式,它是完全随机地选择样本。是完全随机地选择样本。简单随机抽样在社会经济工作和科学研究中被简单随机抽样在社会经济工作和科学研究中被广泛应用。在不可能、不必要进行全面调查时,广泛应用。在不可能、不必要进行全面调查时,一般用简单随机抽样来推断总
17、体。一般用简单随机抽样来推断总体。要求有一个完美的抽样框,或者总体中有一个要求有一个完美的抽样框,或者总体中有一个个体的详尽名单。个体的详尽名单。2 2、分层抽样(、分层抽样(Stratified samplingStratified sampling)也叫分类抽样、类型抽样。也叫分类抽样、类型抽样。根据调查目的,确定某个主要标志,并根据这个标志将根据调查目的,确定某个主要标志,并根据这个标志将总体单位划分为若干层或类型,然后从各层中按随机原总体单位划分为若干层或类型,然后从各层中按随机原则分别抽取一定数目的单位构成样本。各层的抽样数目则分别抽取一定数目的单位构成样本。各层的抽样数目可采用等比
18、例抽样或不等比例抽样来确定。可采用等比例抽样或不等比例抽样来确定。分层抽样是分层抽样是统计分组法和抽样原理统计分组法和抽样原理的结合,可提高样本的结合,可提高样本的代表性,进而提高抽样推断的准确性;可获得总体指的代表性,进而提高抽样推断的准确性;可获得总体指标的估计值,也可由各子样本指标推算相应的子总体指标的估计值,也可由各子样本指标推算相应的子总体指标。标。分层抽样可加深对内部有差异性的现象的认识,可以满分层抽样可加深对内部有差异性的现象的认识,可以满足分层次管理的需要。足分层次管理的需要。如:城市职工收入调查、如:城市职工收入调查、农产品产量抽样调查农产品产量抽样调查 A.A.二阶抽样二阶
19、抽样(Two stage samplingTwo stage sampling)为抽样方便,有时需把总体分成两个级别的抽样单元:为抽样方便,有时需把总体分成两个级别的抽样单元:初级抽样单元和次级抽样单元。每个初级抽样单元由初级抽样单元和次级抽样单元。每个初级抽样单元由若干次级抽样单元组成,先按某种方法在由初级单元若干次级抽样单元组成,先按某种方法在由初级单元构成的一级抽样框中抽样,然后在中选的初级单元中构成的一级抽样框中抽样,然后在中选的初级单元中由次级单元构成的二级抽样框中抽样,抽样过程分为由次级单元构成的二级抽样框中抽样,抽样过程分为两个阶段进行。两个阶段进行。例如在企业职工收入调查中,把
20、企业作为初级抽样单例如在企业职工收入调查中,把企业作为初级抽样单元,职工作为次级抽样单元,先对企业进行抽样,再元,职工作为次级抽样单元,先对企业进行抽样,再在被抽中企业内对职工进行抽样,然后对被抽中的职在被抽中企业内对职工进行抽样,然后对被抽中的职工进行调查。工进行调查。在二阶抽样中,如果对初级单元不再进行随机抽样,在二阶抽样中,如果对初级单元不再进行随机抽样,让所有的初级单元都入样,而在初级单元中对次级单让所有的初级单元都入样,而在初级单元中对次级单元进行随机抽样,这样的二阶抽样就是分层随机抽样。元进行随机抽样,这样的二阶抽样就是分层随机抽样。3 3、二阶抽样与多阶抽样、二阶抽样与多阶抽样B
21、.B.多阶抽样(多阶抽样(Multi-stage samplingMulti-stage sampling)如果总体可以划分成多个级别的抽样单元,每一级如果总体可以划分成多个级别的抽样单元,每一级别的抽样单元由若干下一级别的抽样单元组成,相别的抽样单元由若干下一级别的抽样单元组成,相应地存在多个级别的抽样框,抽样时先在一级抽样应地存在多个级别的抽样框,抽样时先在一级抽样框中对一级单元抽样,再在中选的一级单元中对二框中对一级单元抽样,再在中选的一级单元中对二级单元抽样,依次类推。级单元抽样,依次类推。例如在省抽县、县抽乡、乡抽村、村抽户的农产量例如在省抽县、县抽乡、乡抽村、村抽户的农产量四阶抽样
22、中,凡未被抽中的县、乡、村、户就不必四阶抽样中,凡未被抽中的县、乡、村、户就不必编制关于乡、村、户的抽样框。编制关于乡、村、户的抽样框。多阶抽样的主要缺点是估计量的结构比较复杂,估多阶抽样的主要缺点是估计量的结构比较复杂,估计量方差的估计也很复杂。计量方差的估计也很复杂。4 4、整群抽样(、整群抽样(Cluster samplingCluster sampling)在二阶抽样中如果把初级抽样单元称作由次级抽样单在二阶抽样中如果把初级抽样单元称作由次级抽样单元组成的群,在抽中的群内不再对次级单元进行抽样元组成的群,在抽中的群内不再对次级单元进行抽样而是进行普查,那么这种抽样方法就称为整群抽样。而
23、是进行普查,那么这种抽样方法就称为整群抽样。整群抽样的优点是只需具备群即初级抽样单元的抽样整群抽样的优点是只需具备群即初级抽样单元的抽样框即可,无需具备关于次级单元的抽样框。框即可,无需具备关于次级单元的抽样框。例如,在市场调查的入户调查中,可以对被选作抽样例如,在市场调查的入户调查中,可以对被选作抽样单位的某个居民区的每家每户进行调查。单位的某个居民区的每家每户进行调查。5 5、系统抽样(、系统抽样(Systematic samplingSystematic sampling)又称等距抽样。若总体中的抽样单元都按又称等距抽样。若总体中的抽样单元都按一定顺序排列,在规定的范围内随机抽取一定顺序
24、排列,在规定的范围内随机抽取一个单元作为初始单元,然后按照一套事一个单元作为初始单元,然后按照一套事先定好的规则确定其他样本单元,这种抽先定好的规则确定其他样本单元,这种抽样方法称为系统抽样。样方法称为系统抽样。等距抽样的优点是实施简单,整个样本中等距抽样的优点是实施简单,整个样本中只是初始单元需随机抽取,其余单元皆由只是初始单元需随机抽取,其余单元皆由此决定。其主要缺点是估计量精度的估计此决定。其主要缺点是估计量精度的估计比较困难。比较困难。(二)非概率抽样二)非概率抽样 非概率抽样也称非随机抽样,是指从研究目的出发,根据调非概率抽样也称非随机抽样,是指从研究目的出发,根据调查者的经验或判断
25、,从总体中有意识地、不是完全按随机原查者的经验或判断,从总体中有意识地、不是完全按随机原则抽取若干单位构成样本。非概率抽样有三种形式。则抽取若干单位构成样本。非概率抽样有三种形式。A.A.由调查人员自由选择被调查者的非随机选样。例如在购物由调查人员自由选择被调查者的非随机选样。例如在购物中心采访中心采访100100位妇女,这位妇女,这100100位被调查者可以非随机选择。位被调查者可以非随机选择。B.B.通过某些条件过滤选择某些被调查者参与调查的判断抽样通过某些条件过滤选择某些被调查者参与调查的判断抽样法。在许多情况下,由于研究对象可能仅限于一部分居民,法。在许多情况下,由于研究对象可能仅限于
26、一部分居民,因而有时采用这种方法能节省大量时间和经费。因而有时采用这种方法能节省大量时间和经费。C.C.大多数种类的研究,如产品测试、座谈会等,只要不是属大多数种类的研究,如产品测试、座谈会等,只要不是属于要进行总体推论的调查都可使用非概率抽样法。于要进行总体推论的调查都可使用非概率抽样法。(三)抽样框(三)抽样框 抽样框是指抽样调查所涉及的全部抽样单位的抽样框是指抽样调查所涉及的全部抽样单位的名单框架。编制抽样框是实施抽样的基础。一名单框架。编制抽样框是实施抽样的基础。一般地,抽样框的类型主要有三种:般地,抽样框的类型主要有三种:名单抽样框名单抽样框:列出全部总体单位的名录一栏表,:列出全部
27、总体单位的名录一栏表,如职工名单、企业名单等。如职工名单、企业名单等。区域抽样框区域抽样框:按地理位置把总体范围划分为若:按地理位置把总体范围划分为若干小区域,并以小区域为抽样单位。如农作物干小区域,并以小区域为抽样单位。如农作物产量抽样调查:大地块产量抽样调查:大地块小地块小地块标号。标号。时间表抽样框时间表抽样框:把总体的时间过程分为若干个:把总体的时间过程分为若干个小的时间单位,并按时间顺序对总体单位进行小的时间单位,并按时间顺序对总体单位进行抽样。如流水线产品质量检查。抽样。如流水线产品质量检查。二、抽样误差及其度量二、抽样误差及其度量 一般地说,抽样误差是指样本指标与被它估计未一般地
28、说,抽样误差是指样本指标与被它估计未知的总体参数知的总体参数(总体特征值总体特征值)之差。具体地是指样之差。具体地是指样本平均数本平均数 与总体平均数与总体平均数的差,样本成数的差,样本成数p与总与总体成数体成数的差的差(p-)。例例:2008年我国谷物平均产量为年我国谷物平均产量为5548千克千克/公顷,公顷,假如通过抽样调查得到的平均产量为假如通过抽样调查得到的平均产量为5580千克千克/公顷或公顷或5534千克千克/公顷,则样本平均每公顷产量公顷,则样本平均每公顷产量与实际平均每公顷产量之间的误差分别为与实际平均每公顷产量之间的误差分别为32千克千克或或14千克。千克。x1 1、抽样误差
29、的种类、抽样误差的种类 统计调查误差按产生的原因统计调查误差按产生的原因:1 1)登记性误差)登记性误差:在统计调查和整理、汇总过程中,由于观察、测量、在统计调查和整理、汇总过程中,由于观察、测量、登记、计算等等方面的差错。登记性误差不是抽样调查特有的。登记、计算等等方面的差错。登记性误差不是抽样调查特有的。登记性误差是一种可以避免的误差。登记性误差是一种可以避免的误差。2 2)代表性误差)代表性误差:用样本指标推断总体指标时,由于样本结构与总体用样本指标推断总体指标时,由于样本结构与总体结构不一致、样本不能完全代表总体而产生的误差。这类误差又结构不一致、样本不能完全代表总体而产生的误差。这类
30、误差又可以分为可以分为系统性误差和随机性误差系统性误差和随机性误差两类。两类。系统性误差系统性误差(也叫偏差必然性误差)是由非随机因素引起的样本(也叫偏差必然性误差)是由非随机因素引起的样本代表性不足而产生的误差,或者说是由于在抽样调查时,违反抽代表性不足而产生的误差,或者说是由于在抽样调查时,违反抽样调查的随机原则而产生的误差。如:抽样框与目标总体不一致、样调查的随机原则而产生的误差。如:抽样框与目标总体不一致、有意多选较好或较差的单位等。有意多选较好或较差的单位等。随机性误差随机性误差(也叫偶然性误差):(也叫偶然性误差):抽样调查虽然遵循了随机原则,但由于各种随机因素(偶然性因抽样调查虽
31、然遵循了随机原则,但由于各种随机因素(偶然性因素)引起的代表性误差。这种误差不可避免,但可控制。素)引起的代表性误差。这种误差不可避免,但可控制。登记性误差和系统性误差都是可以避免的。在计算抽样误差时,登记性误差和系统性误差都是可以避免的。在计算抽样误差时,通常假定不存在登记性误差和系统性误差。通常假定不存在登记性误差和系统性误差。影响抽样误差的因素:影响抽样误差的因素:A.总体各单位标志值的差异程度;总体各单位标志值的差异程度;B.样本单位数;样本单位数;C.抽样方法。一般情况下重复抽样误差比不抽样方法。一般情况下重复抽样误差比不重复抽样误差要大一些。重复抽样误差要大一些。D.抽样调查的组织
32、形式。不同的抽样组织形抽样调查的组织形式。不同的抽样组织形式就有不同的抽样误差。式就有不同的抽样误差。2、抽样误差的度量、抽样误差的度量 实际抽样误差实际抽样误差:某一具体样本的样本估计值某一具体样本的样本估计值 与总体与总体参数的真实值参数的真实值 之差(之差(-)。)。抽样平均误差抽样平均误差:样本估计量样本估计量 的标准差。反映抽样指的标准差。反映抽样指标和总体指标间的平均误差程度。计算公式为:标和总体指标间的平均误差程度。计算公式为:式中:式中:n n为可能的样本数为可能的样本数 在抽样平均误差计算时,由于抽样有重复抽样和不重在抽样平均误差计算时,由于抽样有重复抽样和不重复抽样两种情况
33、,因此平均数抽样和成数抽样的平均复抽样两种情况,因此平均数抽样和成数抽样的平均误差的计算也不一样。误差的计算也不一样。抽样极限误差抽样极限误差(允许误差):是指在一定的概率下抽(允许误差):是指在一定的概率下抽样误差的可能范围。即样本指标与总体指标之间误差样误差的可能范围。即样本指标与总体指标之间误差可允许的最大范围。即:可允许的最大范围。即:|-|-|n2)()(|-|标准误标准误n【例例】某企业有某企业有5个工人的日产量分别为个工人的日产量分别为(单位:件):(单位:件):6,8,10,12,14,用重,用重复抽样的方法,从中随机抽取复抽样的方法,从中随机抽取2个工人的日个工人的日产量,用
34、以代表这产量,用以代表这5个工人的总体水平。则个工人的总体水平。则抽样平均误差为多少?抽样平均误差为多少?解:根据题意可得:解:根据题意可得:总体标准差总体标准差 答:抽取答:抽取2个工人的日产量进行调查的抽样平均个工人的日产量进行调查的抽样平均误差为误差为2件。件。(件)10514121086X(件)(85402NXX(件)抽样平均误差228nx【例例】根据历史经验,在正常情况下,某企根据历史经验,在正常情况下,某企业生产某种产品的合格率为业生产某种产品的合格率为90%,现从,现从5000件产品中抽取件产品中抽取50件进行检验,求该产件进行检验,求该产品合格率的抽样平均误差。品合格率的抽样平
35、均误差。解:根据题意,在重复抽样条件下,合格解:根据题意,在重复抽样条件下,合格率的抽样平均误差为:率的抽样平均误差为:24.4501.09.0)1(nPPp在不重复抽样条件下,合格率的抽样平均误差为在不重复抽样条件下,合格率的抽样平均误差为:)()()(22.45000501501.09.011NnnPPp答:抽取答:抽取5050件产品进行检验,该产品合格率的抽样平均误差为件产品进行检验,该产品合格率的抽样平均误差为4.22%4.22%。三、样本统计量三、样本统计量 样本提供的信息是分散的,不便于有效地对总体进行样本提供的信息是分散的,不便于有效地对总体进行推断。为了能有效地推断总体,必须对
36、样本进行推断。为了能有效地推断总体,必须对样本进行“加加工工”,把样本中所包含的有关总体某一特征的信息,把样本中所包含的有关总体某一特征的信息“提取提取”出来并出来并“聚集聚集”在一起,这就需要根据推断在一起,这就需要根据推断问题的需要构造样本的适当函数,不同的样本函数反问题的需要构造样本的适当函数,不同的样本函数反映总体的不同特征,一旦有了样本观察值就可以由此映总体的不同特征,一旦有了样本观察值就可以由此给出总体特征的推断值。因此自然要求这种样本函数给出总体特征的推断值。因此自然要求这种样本函数应不包含任何未知参数。称这种样本函数为统计量。应不包含任何未知参数。称这种样本函数为统计量。如样本
37、均值如样本均值:niiXnX11四、抽样分布四、抽样分布(一)抽样分布的概念(一)抽样分布的概念 从理论上说,某个样本统计量的抽样分布,就是在从理论上说,某个样本统计量的抽样分布,就是在重复选取容量为重复选取容量为n的样本时,由每一个样本算出的该的样本时,由每一个样本算出的该统计量数值的相对数频数分布或概率分布。因此,统计量数值的相对数频数分布或概率分布。因此,抽样分布是指样本统计量的概率分布。抽样分布是指样本统计量的概率分布。抽样分布反映样本指标的分布特征,是抽样推断的抽样分布反映样本指标的分布特征,是抽样推断的重要依据。重要依据。根据抽样分布的规律,可以揭示样本指标与总体指根据抽样分布的规
38、律,可以揭示样本指标与总体指标之间的关系,估计抽样误差,并说明抽样推断的标之间的关系,估计抽样误差,并说明抽样推断的可靠度。可靠度。抽样分布实际上是一种理论分布。在抽样抽样分布实际上是一种理论分布。在抽样推断中,统计量一般都服从正态分布或以推断中,统计量一般都服从正态分布或以正态分布为渐进分布,所以正态分布是最正态分布为渐进分布,所以正态分布是最常用的。当然,还有常用的。当然,还有 2 2分布、分布、t t分布和分布和F F分分布等精确分布。布等精确分布。抽样分布的形成过程抽样分布的形成过程(sampling distribution)总体总体计算样本统计计算样本统计量,如:样本量,如:样本均
39、值、比例、均值、比例、方差等方差等样样本本(二)样本平均数的抽样分布(二)样本平均数的抽样分布 从单位数为从单位数为N的总体中抽取样本容量为的总体中抽取样本容量为n的随机样本,的随机样本,在重复抽样的条件下共有在重复抽样的条件下共有Nn个可能的样本,在不重个可能的样本,在不重复抽样条件下,共有复抽样条件下,共有 个可能样本。对于每个可能样本。对于每一个样本,都可以计算出样本的均值,所有的样本一个样本,都可以计算出样本的均值,所有的样本均值形成的分布就是样本均值的抽样分布。样本均均值形成的分布就是样本均值的抽样分布。样本均值是一个随机变量。值是一个随机变量。同样,可以得到样本比例的抽样分布和样本
40、标准差同样,可以得到样本比例的抽样分布和样本标准差的抽样分布。的抽样分布。)(nNnNCnN)(nNnNCnN)(nNnNCnN)(nNnNCnN!nNNCnNn!()!nNNCn Nn!()!nNNCn Nn样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)0.2样本均值的抽样分布样本均值的抽样分布(例题分析)现从总体中抽取现从总体中抽取n n2 2的简单随机样本,在重复抽样的简单随机样本,在重复抽样条件下,共有条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,3
41、3211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)计算出各样本的均值,如下表。并给出样本均计算出各样本的均值,如下表。并给出样本均值的抽样分布值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.0
42、3211.51.01第二个观察值第二个观察值第一个第一个观察值观察值1616个样本的均值(个样本的均值()xx1.0P(x)样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较(例题分析)=2.5 2=1.25 x 0.2中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n 30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布设从均值为设从均值为,方差为,方差为 2的一个任意总体中抽取容量为的一个任意总体中抽取容量为n的样本,当的样本,当n充分大时,样本均值的抽样分布近似服充分大时,样本均值的抽样分布近似服从均值为从
43、均值为、方差为、方差为2/n的正态分布的正态分布一个任意分一个任意分布的总体布的总体样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理x当总体服从正态分布当总体服从正态分布N(,2)时,来自该总体的所有时,来自该总体的所有容量为容量为n的样本的均值的样本的均值 x也服从正态分布,也服从正态分布,x 的数的数学期望为学期望为,方差为,方差为2/n。即。即 xN(,2/n)中心极限定理中心极限定理(central limit theorem)1.样本均值的数学期望样本均值的数学期望2.样本均值的方差样本均值的方差重复抽样重复抽样不重复抽样不重复抽样样本均值的抽样分布样本均值的抽样分布
44、(数学期望与方差数学期望与方差)(三)样本比例的抽样分布(三)样本比例的抽样分布 比率也称比例,又称成数。比率也称比例,又称成数。总体比例总体比例:某一现象总体中具有某种特征的某一现象总体中具有某种特征的单位占全部单位的比例(比重),用单位占全部单位的比例(比重),用表示。表示。样本比例样本比例:样本中具有相同特征的单位占全样本中具有相同特征的单位占全部样本单位的比例(比重),用部样本单位的比例(比重),用p表示。如表示。如产品合格率、某种商品的市场占有率等。产品合格率、某种商品的市场占有率等。总体比例总体比例 式中:式中:N0为总体中具有某种特征的单位数;为总体中具有某种特征的单位数;N为总
45、体单位数。为总体单位数。设总体中具有另一种特征的单位数为设总体中具有另一种特征的单位数为N1,则有:,则有:N1/N=1-样本比例样本比例 式中:式中:n0为样本中具有某种特征的单位数;为样本中具有某种特征的单位数;n为样本单位数。为样本单位数。设样本中具有另一种特征的单位数为设样本中具有另一种特征的单位数为n1,则有:,则有:n1/n=1-p pNN0NN0NN0NN0nnP0nnp0 当当n n很大时,样本比例很大时,样本比例p p的抽样分布可用正态分布近的抽样分布可用正态分布近似。对于样本比例似。对于样本比例p p,若,若np5np5或或n(1-p)5 n(1-p)5,就可,就可以认为样
46、本容量足够大。以认为样本容量足够大。1.样本比例的数学期望样本比例的数学期望2.样本比例的方差样本比例的方差重复抽样重复抽样不重复抽样不重复抽样样本比例的抽样分布样本比例的抽样分布(数学期望与方差数学期望与方差)五、参数估计的一般问题五、参数估计的一般问题(一)参数估计概念(一)参数估计概念 在许多实际问题中,我们需要了解总体的情况,如总体分布、在许多实际问题中,我们需要了解总体的情况,如总体分布、总体参数等,但总体参数及其概率分布往往是未知的。总体参数等,但总体参数及其概率分布往往是未知的。例如在农民收入调查中,根据实际经验和理论分析如概率论例如在农民收入调查中,根据实际经验和理论分析如概率
47、论中的中心极限定理,我们可以断定农民收入服从正态分布,但分中的中心极限定理,我们可以断定农民收入服从正态分布,但分布中的参数取何值却是未知的,这就导致统计估计问题。布中的参数取何值却是未知的,这就导致统计估计问题。统计估计问题专门研究由样本估计总体的未知分布或分布中统计估计问题专门研究由样本估计总体的未知分布或分布中的未知参数。直接对总体的未知分布进行估计的问题称为非参数的未知参数。直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计的估计;当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。问题称为参数估计。在参数估计中,假定抽样
48、方法为重复简单随机抽样,样本的在参数估计中,假定抽样方法为重复简单随机抽样,样本的每个分量都与总体同分布,它们之间相互独立。每个分量都与总体同分布,它们之间相互独立。估计量与估计值估计量与估计值 总体的特征数在参数估计中被称作总体参数,用总体的特征数在参数估计中被称作总体参数,用 表示。用来估计总体参数的统计量被称为估计量,表示。用来估计总体参数的统计量被称为估计量,如样本均值、样本比例、样本方差等都可以是一如样本均值、样本比例、样本方差等都可以是一个估计量。估计量用个估计量。估计量用 表示。估计量是一个随着表示。估计量是一个随着抽样波动而波动的随机变量。当有了样本数据后,抽样波动而波动的随机
49、变量。当有了样本数据后,可用估计量计算出具体数值,该数值就称为估计可用估计量计算出具体数值,该数值就称为估计值。值。(二)点估计与区间估计(二)点估计与区间估计参数估计方法有点估计与区间估计两种。参数估计方法有点估计与区间估计两种。1.参数估计的点估计法参数估计的点估计法 一般地说,用样本估计量的值直接作为总体参数的一般地说,用样本估计量的值直接作为总体参数的估计值称为点估计。如:用样本均值直接作为总体估计值称为点估计。如:用样本均值直接作为总体均值的估计。均值的估计。例如,对某地区的水稻亩产量进行估计,我们抽取例如,对某地区的水稻亩产量进行估计,我们抽取一个样本后得到的平均亩产量为一个样本后
50、得到的平均亩产量为600600千克,我们就千克,我们就把该产量作为该地区的水稻亩产量,并以此估计出把该产量作为该地区的水稻亩产量,并以此估计出该地区的水稻总产量。该地区的水稻总产量。没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息2.参数估计的区间估计法参数估计的区间估计法 通过点估计,虽然可以给出未知参数的一个估计量(或通过点估计,虽然可以给出未知参数的一个估计量(或估计值),但不知道估计值),但不知道 与与 到底相差多少?这就需要在到底相差多少?这就需要在点估计的基础上,给出总体参数的一个范围。点估计的基础上,给出总体参数的一个范围。人们希望利用样本给出一个范围,要
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。