1、第五抽样与参数估计第五抽样与参数估计总体均值、比例总体均值、比例、方差等、方差等简简单单随随机机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽样样抽抽样样方方式式3 总体均值的区间估计样本统计量的理论分布存在给出总体参数落在这一区间的概率1、t 分布的均值为0随机起点间隔 k=N/n,a1=r,a2=r+k,a3=r+2kan=r+(n1)k解:已知N(,0.无法使用样本的结果推断总体分层抽样的值依赖于层内各元素是同质性(相似的)。估计总体比例时样本
2、容量的确定抽样分布与总体分布的关系估计总体均值时样本容量的确定不同容量样本的抽样分布总体分布(population distribution)结果来自容量相同的所有可能样本中点起点等距抽样:a1=k/2,a2=k/2+k,a3=k/2+2k无法使用样本的结果推断总体层层1 1层层2 2层层N N总体总体iiiNNnnNNn.群群1 1群群2 2群群N N总体总体可根据调查的结果推断总体正态总体、已知,或非正态总体、大样本的估计相应的/2为0.总体分布(population distribution)如职工家计调查按工资水平排队;适用于方差分析、协方差分析和回归分析等。在重复选取容量为n的样本时
3、,由样本均值的所有可能取值形成的相对频数分布设总体的均值是,方差是2,从中抽取容量为n的样本,则在重复抽样和不重复抽样条件下整群抽样(cluster sampling)【例】一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。总体比例在1-置信水平下的置信区间为【例】某企业共有职工1000人。样本是人为确定的,没有依据随机的原则,调查结果不能用于推断总体【例】一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。一致性随着样本容量的增大,估计量的我们可以95的概率保证该批零
4、件平均长度的在21.总体(或样本)中具有某种属性的单位与全部单位总数之比152),n=9,2=(n-1)S2/2样本分布(sample distribution)(优选)第五抽样与参数估计标准正态分布的横轴以Z值为刻度,Z值度量的是一个点距离均值多少倍标准差。给出总体参数落在这一区间的概率大样本不重复抽样时的估计方法样本统计量的理论分布存在置信区间(confidence interval)农产量抽样调查,按平均亩产排序。优点容易实施,调查的成本低总体服从正态分布,方差()未知解:已知 n=200,p75%,z/2=1.样本均值就是总体均值 的一个估计量正态总体、未知,或非正态总体、大样本的估计
5、重复构造出的20个置信区间二阶抽样中群是初级抽样单位,第二阶段抽取的是最终抽样单位。样本均值,样本比例,样本方差等设总体参数为,1和2为由样本确定的统计量,对于给定的(01),若1和2满足样本均值抽样分布的特征值(数学期望)正态总体(已知)学生成绩调查按学号排队;由统计学家费舍()提出的5.21NxNii25.1)(122NxNii3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51
6、.01第二个观察值第二个观察值第一个第一个观察值观察值)(XEnX22122NnNnX11NnN5.2160.45.10.11NxniixnNxnixix222122225.1625.016)5.20.4()5.20.1()(5.2X625.02X5x5.2xX50 xnx x x无法使用样本的结果推断总体总体比例在1-置信水平下的置信区间为估计总体比例时样本容量的确定总体均值在1-置信水平下的置信区间为:提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据操作简单,可以保证样本的结构和总体的结构类似。每个单位被抽中的概率是已知的,或是可以计算出来的适用于方差分析
7、、协方差分析和回归分析等。2.2分布(性质和特点)适用于大规模的抽样调查,如我国的农作物产量调查、职工家计调查等抽样推断中常用的统计量及其分布调查员在街头、公园、商店等公共场所进行拦截调查根据比例区间估计公式可得样本量n为既可以对总体参数进行估计,也可以对各层的目标量进行估计置信区间(confidence interval)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。抽样分布(sampling distribution)设总体参数为,1和2为由样本确
8、定的统计量,对于给定的(01),若1和2满足X正态分布正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布NNNN101或nnPnnP101或)(PEnP)1(21)1(2NnNnP11NnNX)1,0(NnXZXZ12.01052.6XZ3 总体均值的区间估计无法使用样本的结果推断总体优点容易找到那些属于特定群体的被调查者,调查的成本也比较低。试以95%的概率确定赞成改革的人数比例的置信区间适用于大规模的抽样调查,如我国的农作物产量调查、职工家计调查等非正态总体、大样本(已知)置信区间(confidence interval)样本均值的抽样分布(例题分析)总体比例
9、的区间估计(例题分析)使层内差异小,层间差异大重复构造出的20个置信区间总体均值 的置信区间为总体均值 的置信区间为点估计与区间估计的区别总体中各元素的观察值所形成的分布厂家在出售产品柜台前对路过顾客进行的调查大于均值的数据点,其Z值为正,小于均值的数据点,其Z值为负。t 分布与标准正态分布的比较估计总体比例时样本容量的确定非概率抽样(nonprobability sampling)抽取具体样本单位时,不是依据随机原则,属于非概率抽样。nsXt)(),(2NX)1,0(NXZ2ZY)1(2Y),(2NX)1()1()(2222122nsnXXnii 选择容量为选择容量为n 的的简单随机样本简单
10、随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2=(n-1)S2/2计算出所有的计算出所有的 2值值总体总体),(mnFmYnXF 该种灯泡平均使用寿命95%的置信区间为1476.总体均值的区间估计(小样本)重复构造出的20个置信区间抽取具体样本单位时,不是依据随机原则,属于非概率抽样。置信区间(confidence interval)样本均值抽样分布的特征值(数学期望)非正态分布,样本容量足够大时(n 30),用S2n1代替3 总体均值的区间估计估计总体均值时样本量的确定总体均值 在1-置信水平下的置信区间为正态总体(已知)可以假定它服从某种分布设总体参数为,1和2为由样本确定的
11、统计量,对于给定的(01),若1和2满足中心极限定理(central limit theorem)表示为(1 方法矩估计法、顺序量估计法、极大似然估计法等。样本均值,样本比例,样本方差等将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本设若X为服从自由度为n的2分布,即X2(n),Y为服从自由度为m的2分布,即Y2(m),且X和Y相互独立,则F统计量及其分布为估估 计计 方方 法法点点 估估 计计区间估计区间估计nxxzx21)21(PxxX)(E21)1,0(NnxZ1)(1222ZnxZPZ,使得,查表得临界值给定置信度nZx21-2NnNnZx4.21x4
12、.21x某种零件的长某种零件的长度服从正态分布,从度服从正态分布,从某天生产一批零件中某天生产一批零件中按重复抽样方法随机按重复抽样方法随机抽取抽取9个,测得其平个,测得其平均长度为均长度为21.4cm。已知总体标准差为已知总体标准差为=0.15cm。试估计。试估计该批零件平均长度的该批零件平均长度的置信区间,置信水平置信区间,置信水平为为95%。498.21,302.21098.04.21915.096.14.212nzx【例例】一家食品生产企业以生产袋装食品为主,为对食品质一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量进行监测,企业质检
13、部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为态分布,且总体标准差为10g。试估计该批产品平均重量的。试估计该批产品平均重量的置信区间,置信水平为置信区间,置信水平为95%112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.81
14、02.8101.5 98.4 93.336.105nxxi28.109,44.10192.336.105251096.136.1052nzx176.27,824.24100696.126,100696.126,22nZxnZx)1,0(NnsxZ1)(1222ZnsxZPZ,使得,查表得临界值给定置信度nsZx21-2NnNnsZx2335392736443642464331334253455447243428393644403949383448503439454845325.39nxxi77.71)(2nxxsi)63.41,37.37(13.25.393677.7645.15.392nsZ
15、x)1(ntnsxtnstx21510152014801500145014801510152014801490153015101460146014701470小时)(14901623840nxxi小时)(77.2411692001)(21nxxsin2.1503,8.14762.1314901677.24131.214902nstx)1,0()1(NnPPPZnppzp)-1(2)1,0()1(NnPPPZ1)-1(2NnNnppzp%35.74%,65.55%35.9%65100%)651%(6596.1%65)1(2nppzp%37.80%,63.69%37.5%75110002001000200%)751%(7596.1%751)1(2NnNnppzpnZx22222Zn9704.96400200096.12222222Zn2222)1()1(ZnnZp1393.13805.09.019.096.1)1(22222)(Zn
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。