抽样与参数估计优质课件.ppt

上传人(卖家):晟晟文业 文档编号:5110901 上传时间:2023-02-12 格式:PPT 页数:89 大小:2.69MB
下载 相关 举报
抽样与参数估计优质课件.ppt_第1页
第1页 / 共89页
抽样与参数估计优质课件.ppt_第2页
第2页 / 共89页
抽样与参数估计优质课件.ppt_第3页
第3页 / 共89页
抽样与参数估计优质课件.ppt_第4页
第4页 / 共89页
抽样与参数估计优质课件.ppt_第5页
第5页 / 共89页
点击查看更多>>
资源描述

1、统计学统计学(第二版第二版)第章抽样与参数估计统计学统计学(第二版第二版)第第 5 章章 抽样与参数估计抽样与参数估计5.1 参数估计的一般问题参数估计的一般问题 5.2 抽样分布抽样分布5.3 一个总体参数的区间估计一个总体参数的区间估计5.4 样本容量的确定样本容量的确定统计学统计学(第二版第二版)学习目标学习目标估计量与估计值的概念估计量与估计值的概念点估计与区间估计的区别点估计与区间估计的区别评价估计量优良性的标准评价估计量优良性的标准一个总体参数的区间估计方法一个总体参数的区间估计方法样本容量的确定方法样本容量的确定方法统计学统计学(第二版第二版)参数估计在统计方法中的地位参数估计在

2、统计方法中的地位参数估计参数估计假设检验假设检验 统计方法统计方法描述统计描述统计推断统计推断统计统计学统计学(第二版第二版)统计推断的过程统计推断的过程统计学统计学(第二版第二版)5.1 参数估计的一般问题参数估计的一般问题估计量与估计值估计量与估计值抽样方法与样本可能数目抽样方法与样本可能数目点估计与区间估计点估计与区间估计统计学统计学(第二版第二版)估计量与估计值估计量与估计值统计学统计学(第二版第二版)估计量:用于估计总体参数的随机变量估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等例如例如:样本均值就是总体均值样本均值就是总体均值 的

3、一个估计量的一个估计量参数用参数用 表示,估计量表示,估计量用用 表示表示估计值:估计参数时计算出来的统计量的具估计值:估计参数时计算出来的统计量的具体值体值如果样本均值如果样本均值 x=80,则,则80就是就是 的估计值的估计值估计量与估计值估计量与估计值(estimator&estimated value)统计学统计学(第二版第二版)抽样方法与样本可能数目抽样方法与样本可能数目统计学统计学(第二版第二版)重复(置)抽样:重复(置)抽样:从总体中抽取样本时,随机抽取一个样本从总体中抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现以后,把它放单位,记录该单位有关标志表现以后,把它放回到

4、总体中去,再从总体中随机抽取第二个单回到总体中去,再从总体中随机抽取第二个单位,位,照此下去直到抽选,照此下去直到抽选n个样本单位。个样本单位。抽样方法抽样方法统计学统计学(第二版第二版)不重复(置)抽样:不重复(置)抽样:从总体抽取第一个样本单位,记录该单从总体抽取第一个样本单位,记录该单位有关标志表现后,这个样本单位位有关标志表现后,这个样本单位不再放回不再放回总体中参加下一次抽选。然后,从总体总体中参加下一次抽选。然后,从总体N-1个个单位中随机抽选第二个样本单位,单位中随机抽选第二个样本单位,照,照此下去直到抽选出此下去直到抽选出n个样本单位。个样本单位。抽样方法抽样方法统计学统计学(

5、第二版第二版)是指从总体中可能抽取的样本的最多数是指从总体中可能抽取的样本的最多数目,抽样数目大小与抽样方法有关。目,抽样数目大小与抽样方法有关。nnNAN重复抽样时的样本可能数目是一个可重复的排列数:重复抽样时的样本可能数目是一个可重复的排列数:例:从例:从0-9的的10个数中随机重复抽选个数中随机重复抽选6个数字组成电个数字组成电话号码,共能组成多少个电话号码?话号码,共能组成多少个电话号码?610100nnNAN万样本可能数目:样本可能数目:统计学统计学(第二版第二版)考虑顺序时的样本可能数目是不重复的排列数:考虑顺序时的样本可能数目是不重复的排列数:(1)(2).(1)!/()!nNP

6、N NNNNNNn例:从班级例:从班级10位学生中抽选三人担任不同的职务位学生中抽选三人担任不同的职务,问共有几种抽法?,问共有几种抽法?(1)(2).(1)10*9*8720nNPN NNNN种不重复抽样时的样本可能数目可分为考虑顺序和不重复抽样时的样本可能数目可分为考虑顺序和不考虑顺序两种情况。不考虑顺序两种情况。统计学统计学(第二版第二版)不考虑顺序时的样本可能数目是不重复的组合数:不考虑顺序时的样本可能数目是不重复的组合数:(1)(2).(1)/!nnNNN NNNnCPnn例:从小组例:从小组10位学生中不重复随机抽选位学生中不重复随机抽选3个组成个组成样本,考查其平均成绩,可能的样

7、本数目为:样本,考查其平均成绩,可能的样本数目为:31010*9*87201203*2*16C种统计学统计学(第二版第二版)点估计与区间估计点估计与区间估计统计学统计学(第二版第二版)参数估计的方法参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计统计学统计学(第二版第二版)估计总体均值时样本容量的确定当总体服从正态分布 XN(,2)时,来自该总体所有容量为n的样本均值 也服从正态分布,的数学期望为 ,方差为t分布与标准正态分布的比较解:已知N(,102),n=25,1-=95%,z/2=1.1 参数估计的一般问题总体方差未知时,可以用样本标准差作为总体标准差的点估计。无偏性

8、(unbiasedness)应抽取的样本容量为表示为(1-现用重复抽样方法从5人中随机抽取2人组成样本,样本可能数目为52=25个。一、重复抽样时样本平均数的分布根据上表数据,可以整理出样本平均数的分布如右表:解:已知=2000,E=400,1-=95%,z/2=1.总体均值的区间估计(大样本)例:从小组10位学生中不重复随机抽选3个组成样本,考查其平均成绩,可能的样本数目为:从以上计算,也可以得到两个重要结论:其中样本均值,样本比例和样本方差分别是总体均值、总体比例和总体方差的无偏估计量例:从小组10位学生中不重复随机抽选3个组成样本,考查其平均成绩,可能的样本数目为:根据样本日工资平均数分

9、布表,可以计算日工资平均数的数学期望和方差:20个样本的日平均工资计算如下表:点估计点估计(point estimate)用样本的估计量直接作为总体参数的估计用样本的估计量直接作为总体参数的估计值值例如:用样本均值直接例如:用样本均值直接作为作为总体均值的估计总体均值的估计例如:用两个样本均值之差直接例如:用两个样本均值之差直接作为作为总体均总体均值之差的估计值之差的估计2.没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息统计学统计学(第二版第二版)区间估计区间估计(interval estimate)在点估计的基础上,给出总体参数估计的一个区间在点估计的基础上,给出总

10、体参数估计的一个区间范围,该区间由样本统计量加减范围,该区间由样本统计量加减抽样误差抽样误差而得到的而得到的根据样本统计量的抽样分布能够对样本统计量与总根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量体参数的接近程度给出一个概率度量比如,某班级平均分数在比如,某班级平均分数在7585之间,置信水平是之间,置信水平是95%统计学统计学(第二版第二版)区间估计的图示区间估计的图示统计学统计学(第二版第二版)区间估计的图示区间估计的图示XXzX2统计学统计学(第二版第二版)将构造置信区间的步骤重复很多次,置将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占

11、的信区间包含总体参数真值的次数所占的比例称为置信水平比例称为置信水平 表示为表示为(1-为是总体参数未在区间内的比例为是总体参数未在区间内的比例 常用的置信水平值有常用的置信水平值有 99%,95%,90%相应的相应的 为为0.01,0.05,0.10置信水平置信水平 统计学统计学(第二版第二版)由样本统计量所构造的总体参数的估计区间称由样本统计量所构造的总体参数的估计区间称为置信区间为置信区间统计学家在某种程度上确信这个区间会包含真统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的用一个具

12、体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个含参数真值的区间中的一个置信区间置信区间(confidence interval)统计学统计学(第二版第二版)置信区间与置信水平置信区间与置信水平 xxX统计学统计学(第二版第二版)影响区间宽度的因素影响区间宽度的因素1.总体数据的离散程度,总体数据的离散

13、程度,用用 来测度来测度样本容量,样本容量,2.置信水平置信水平(1-),影响,影响 z 的大小的大小nX统计学统计学(第二版第二版)5.2 抽样分布抽样分布n 样本统计量是个随机变量,样本统计量是个随机变量,抽样分布就是样本抽样分布就是样本统计量的概率分布。统计量的概率分布。统计量的取值不但和样本容量有关,还和抽样方法统计量的取值不但和样本容量有关,还和抽样方法有关。下面我们主要讨论简单随机样本的抽样分布。有关。下面我们主要讨论简单随机样本的抽样分布。统计学统计学(第二版第二版)一、重复抽样时一、重复抽样时样本平均数的分布样本平均数的分布二、不重复抽样二、不重复抽样时样本平均数的分布时样本平

14、均数的分布三、样本比例的抽样分布三、样本比例的抽样分布四、关于正态分布的定理四、关于正态分布的定理(一)正态分布再生定理(一)正态分布再生定理(二)中心极限定理(二)中心极限定理5.2 抽样分布抽样分布统计学统计学(第二版第二版)其中称为边际误差,记为,也称为抽样极限误差。总体均值的区间估计(例题分析)统计量的取值不但和样本容量有关,还和抽样方法有关。(2)如果N很大,可以用N代替N-1,不重复抽样的平均误差计算公式就简化为:式中 的称为置信水平(confidence level),是指随机变量 的取值的绝对值小于 的概率。20个样本的日平均工资计算如下表:从以上计算,也可以得到两个重要结论:

15、式中总体比例未知时可以用样本比例p代替。,有更小标准差的估计量更有效考虑顺序的不重复抽样,样本可能数目为:这就是说,由样本均值构造的估计区间会以1-的概率涵盖总体均值,又可写为如下形式:这时,样本均值经过标准化后的随机变量服从t分布,即:与总体均值的区间估计类似,我们定义为样本比例的边际误差,于是,在(1-)置信水平下总体比例的置信区间为:估计量:用于估计总体参数的随机变量 -2 x一个总体参数的区间估计方法区间估计(interval estimate)例:设总体中共有n个总体单位,其中取值为1的单位数为n1个,取值为0的个体有n0个现用重复抽样方法从5人中随机抽取2人组成样本,样本可能数目为

16、52=25个。(1)不重复抽样的平均误差总是小于重复抽样的平均误差,二者的比值就是修正因子。一、一、重复抽样时样本平均数的分布重复抽样时样本平均数的分布由所有可能样本的平均数取值和相应的概率组成。由所有可能样本的平均数取值和相应的概率组成。例:某施工班组例:某施工班组5个工人的日工资分别为:个工人的日工资分别为:34、38、42、46、50元。则总体工人日工资平均数和方差分别为:元。则总体工人日工资平均数和方差分别为:3438424650425XXN元 222222234 4238 4246 4250 42325X XN元5.2 抽样分布抽样分布统计学统计学(第二版第二版)现用重复抽样方法从现

17、用重复抽样方法从5人中随机抽取人中随机抽取2人组成样本,样本可人组成样本,样本可能数目为能数目为52=25个。各样本的日平均工资计算结果如下:个。各样本的日平均工资计算结果如下:样本变量样本变量343842465034343638404238363840424442384042444646404244465050424446485025个样本的日工资平均数计算表个样本的日工资平均数计算表5.2 抽样分布抽样分布统计学统计学(第二版第二版)根据上表根据上表数据,可数据,可以整理出以整理出样本平均样本平均数的分布数的分布如表:如表:样本日平均工资样本日平均工资频数频数频率频率3411/253622

18、/253833/254044/254255/254444/254633/254822/255011/25合计合计2515.2 抽样分布抽样分布统计学统计学(第二版第二版)5/254/253/252/251/25 34 36 38 40 42 44 46 48 50样本日平均工资分布图样本日平均工资分布图5.2 抽样分布抽样分布统计学统计学(第二版第二版)根据样本日工资平均数分布表,可以计算日工资平均数根据样本日工资平均数分布表,可以计算日工资平均数的数学期望和方差:的数学期望和方差:1()(34*1 36*2 38*3.50*1)4225xfE xxf元222222()()1(3442)*1(

19、3642)*2.(5042)*11625xE xfxf元2()()164xx元5.2 抽样分布抽样分布统计学统计学(第二版第二版)(一)重复抽样的样本平均数的数学期望等于总体平均数。(一)重复抽样的样本平均数的数学期望等于总体平均数。22()()E xE xE xX232()42xnn元(二二)抽样平均数的标准差反映样本平均数与总体平均数之间的平抽样平均数的标准差反映样本平均数与总体平均数之间的平均离差程度,因为:均离差程度,因为:E(x)=X=42元元从以上计算,可以得到两个重要结论:从以上计算,可以得到两个重要结论:所以,抽样平均数的标准差又称为所以,抽样平均数的标准差又称为抽样平均误差抽

20、样平均误差或抽样标或抽样标准误差,以准误差,以 表示。表示。重复抽样的抽样平均误差等于总体标准差重复抽样的抽样平均误差等于总体标准差除以样本单位数的平方根。即:除以样本单位数的平方根。即:5.2 抽样分布抽样分布统计学统计学(第二版第二版)样本平均数的分布与总体分布的比较样本平均数的分布与总体分布的比较总体分布总体分布样本平均数的分布样本平均数的分布42X 322 EEx x 42=162(x)X5042383420100%46484646424240403838363634343/253/252/252/251/251/254/254/255/255/25505044445.2 抽样分布抽样

21、分布统计学统计学(第二版第二版)仍用前面仍用前面5个工人日工资的例子个工人日工资的例子。用不重复抽样方法从中抽取。用不重复抽样方法从中抽取2人组人组成样本,并用样本平均工资来推断总成样本,并用样本平均工资来推断总体平均工资水平。考虑顺序的不重复体平均工资水平。考虑顺序的不重复抽样,样本可能数目为:抽样,样本可能数目为:255*420P 个5.2 抽样分布抽样分布二、不二、不重复抽样时样本平均数的分布重复抽样时样本平均数的分布统计学统计学(第二版第二版)20个样本的日平均工资计算如下表:个样本的日平均工资计算如下表:样本变量样本变量343842465034-363840423836-404244

22、423840-444646404244-485042444648-样本日工资平均数计算表样本日工资平均数计算表5.2 抽样分布抽样分布统计学统计学(第二版第二版)样本日平均工资样本日平均工资频数频数频率频率3621/103821/104042/104242/104442/104621/104821/10合计合计201根据上表根据上表数据,可数据,可以整理出以整理出样本平均样本平均数的分布数的分布如右表:如右表:5.2 抽样分布抽样分布统计学统计学(第二版第二版)E(x)=X=42元(一)大样本并且总体方差已知的情形如果不是正态分布,可由正态分布来近似(n 30)样本统计量是个随机变量,抽样分布

23、就是样本统计量的概率分布。是非标志(0-1变量)的平均数和标准差(p90)2置信度为95%的置信区间为05,Z/2=1.估计总体均值时样本容量的确定无偏性(unbiasedness)总体比例的区间估计(例题分析)一个总体参数的区间估计方法3 一个总体参数的区间估计如果样本均值 x=80,则80就是的估计值(一)正态分布再生定理区间估计(interval estimate)就是在点估计的基础上,以一定的概率给出总体参数估计的一个范围。E(x)=X=42元换言之,大样本比小样本更容易产生一个好的点估计。置信区间(confidence interval)比如,某班级平均分数在7585之间,置信水平是

24、95%统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间1()(36*238*2.48*2)4220 xfE xxf元根据样本日工资平均数分布表,可以计算日工资平均数根据样本日工资平均数分布表,可以计算日工资平均数的数学期望和方差:的数学期望和方差:222222()()1(3642)*2(3842)*2.(4842)*21220 xE xfxf元2()()123.464xx元5.2 抽样分布抽样分布统计学统计学(第二版第二版)从以上计算,也可以得到两个重要结论:从以上计算,也可以得到两个重要结论:(一)不重复抽样的样本平均数的数学期望等于总体平均数。(一)不重复抽样的

25、样本平均数的数学期望等于总体平均数。1NnN 3252()123.464251x元(二二)不重复抽样的抽样平均误差等于重复抽样的抽样平均误不重复抽样的抽样平均误差等于重复抽样的抽样平均误差乘以修正因子,即:差乘以修正因子,即:E(x)=X=42元元 2()1NnxnN修正因子修正因子5.2 抽样分布抽样分布统计学统计学(第二版第二版)(1)不重复抽样的平均误差总是小于重复抽样的平均误不重复抽样的平均误差总是小于重复抽样的平均误差,二者的比值就是修正因子。差,二者的比值就是修正因子。(2)如果)如果N很大,可以用很大,可以用N代替代替N-1,不重复抽样的平均不重复抽样的平均误差计算公式就简化为:

26、误差计算公式就简化为:22()(1)NnnxnNnN说明:说明:5.2 抽样分布抽样分布统计学统计学(第二版第二版)三、关于正态分布的定理(一)正态分布再生定理(一)正态分布再生定理(二)中心极限定理(二)中心极限定理统计学统计学(第二版第二版)(一)正态分布再生定理(一)正态分布再生定理X=50=10X总体分布样本均值分布E(x)=50当n=4时,5x当n=16时,2.5x当总体服从正态分布 XN(,2)时,来自该总体所有容量为n的样本均值 也服从正态分布,的数学期望为 ,方差为 xxX2nX统计学统计学(第二版第二版)中心极限定理中心极限定理:设从均值为:设从均值为 ,方差为方差为2 的一

27、个任的一个任意总体中抽取容量为意总体中抽取容量为n的样本,当的样本,当n充分大时,样本均值的充分大时,样本均值的抽样分布近似服从抽样分布近似服从 均值为均值为 ,方差为方差为 正态分布。正态分布。XX2n(二)中心极限定理(二)中心极限定理统计学统计学(第二版第二版)一个任意分布的总体当样本容量当样本容量n足足够大够大(一般认为一般认为n30)时,样本时,样本均值的抽样分均值的抽样分布渐近地服从布渐近地服从正态分布。正态分布。E(x)=X n22x(二)中心极限定理(二)中心极限定理统计学统计学(第二版第二版)评价估计量的标准评价估计量的标准统计学统计学(第二版第二版)无偏性无偏性(unbia

28、sedness)无偏性:估计量抽样分布的数学期望等于被估计无偏性:估计量抽样分布的数学期望等于被估计的总体参数。其中的总体参数。其中样本均值,样本比例和样本方差分别是总体均值、总体比例和总体方差的无偏估计量统计学统计学(第二版第二版)有效性有效性(efficiency)12统计学统计学(第二版第二版)根据样本数据计算得:,总体服从正态分布,且方差()已知总体均值的区间估计(大样本)当样本容量n足够大(一般认为n30)时,样本均值的抽样分布渐近地服从正态分布。样本容量n与总体方差2、边际误差E、可靠性系数Z或t之间的关系为估计总体比例时样本容量的确定(例题分析)统计学家在某种程度上确信这个区间会

29、包含真正的总体参数,所以给它取名为置信区间无偏性:估计量抽样分布的数学期望等于被估计的总体参数。投保人平均年龄的置信区间为37.总体均值在1-置信水平下的置信区间为【例】某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。2置信度为95%的置信区间为总体均值在1-置信水平下的置信区间为一、重复抽样时样本平均数的分布是非标志:反映总体单位的某一种属性,标志的表现二、总体比例的区间估计一个总体参数的区间估计方法例:从小组10位学生中不重复随机抽选3个组成样本,考查其平均成绩,可能的样本数目为:E(x)=X=42元无偏性:估计量抽样分布的数学期望等于被估计的总体

30、参数。一致性一致性(consistency)一致性:随着样本容量的增大,估计量的值越一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。换言之,大样本来越接近被估计的总体参数。换言之,大样本比小样本更容易产生一个好的点估计。比小样本更容易产生一个好的点估计。统计学统计学(第二版第二版)5.3 一个总体参数的一个总体参数的区间估计区间估计总体均值的区间估计总体均值的区间估计总体比例的区间估计总体比例的区间估计总体方差的区间估计总体方差的区间估计统计学统计学(第二版第二版)一个总体参数的区间估计一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例

31、方差方差2xp2s统计学统计学(第二版第二版)一个总体参数的区间估计一个总体参数的区间估计区间估计区间估计(interval estimate)就是在点估计的基础就是在点估计的基础上,以一定的上,以一定的概率概率给出总体参数估计的一个给出总体参数估计的一个范围范围。抽样误差抽样误差(sampling error):一般我们把无偏点:一般我们把无偏点估计值与总体参数之差的绝对值称为抽样误差。估计值与总体参数之差的绝对值称为抽样误差。统计学统计学(第二版第二版)(一)大样本并且总体方差已知的(一)大样本并且总体方差已知的情形情形 一般地,当总体服从一般地,当总体服从正态分布正态分布或总体虽或总体虽

32、不是正态分布不是正态分布但样本量是但样本量是大样本大样本且且 已知时,样本均值的抽样分布已知时,样本均值的抽样分布服从(或近似服从)均值为服从(或近似服从)均值为 、标准差为、标准差为 的正的正态分布。态分布。nx 将经过标准化变换得到的随机变量服从标准将经过标准化变换得到的随机变量服从标准正态分布,即:正态分布,即:(0,1)xxzN统计学统计学(第二版第二版)根据标准正态分布的性质可知,随机变量根据标准正态分布的性质可知,随机变量的取值与一定的概率相对应。即有:的取值与一定的概率相对应。即有:12/zzP/21xxPz等价于:等价于:式中式中 的称为置信水平的称为置信水平(confiden

33、ce level),是指随机变量,是指随机变量 的取值的绝对值小于的取值的绝对值小于 的概率。的概率。z(1)/2z(一)大样本并且总体方差已知(一)大样本并且总体方差已知的情形的情形统计学统计学(第二版第二版)(一)大样本并且总体方差已知的情形(一)大样本并且总体方差已知的情形 对公式左边括号中的不等式进行变换,可得到总对公式左边括号中的不等式进行变换,可得到总体均值的一个估计区间:体均值的一个估计区间:/2/2xxxzxz这就是说,由样本均值构造的估计区间会以这就是说,由样本均值构造的估计区间会以的概率涵盖总体均值,的概率涵盖总体均值,又可写为如下形式:又可写为如下形式:/2xxz这个估计

34、区间又称为置信水平为这个估计区间又称为置信水平为 的置信区间;其中的置信区间;其中称为边际误差,记为,也称为称为边际误差,记为,也称为抽样极限误差抽样极限误差。xz2/nzx2统计学统计学(第二版第二版)(二)大样本并且总体方差未知的情形(二)大样本并且总体方差未知的情形 总体方差未知时,可以用总体方差未知时,可以用样本标准差样本标准差作为作为总体标准差的点估计。总体标准差的点估计。总体均值置信水平为的置信区间总体均值置信水平为的置信区间为:为:(1)/2sxzn统计学统计学(第二版第二版)在小样本的情形下,样本均值的抽样分布在小样本的情形下,样本均值的抽样分布依赖于总体的概率分布。依赖于总体

35、的概率分布。如果总体是正态分布,样本均值的抽样分如果总体是正态分布,样本均值的抽样分布服从正态分布,如果总体标准差已知,布服从正态分布,如果总体标准差已知,可以使用前面介绍的方法进行总体均值的可以使用前面介绍的方法进行总体均值的区间估计。区间估计。(三)小样本的情形(三)小样本的情形统计学统计学(第二版第二版)如果总体是正态分布,总体标准差未知如果总体是正态分布,总体标准差未知,我们需要用样本标准差估计总体标准差。我们需要用样本标准差估计总体标准差。这时,样本均值经过标准化后的随机变量这时,样本均值经过标准化后的随机变量服从服从t分布,即:分布,即:(1)/xtt nsn(三)小样本的情形(三

36、)小样本的情形统计学统计学(第二版第二版)如样本均值,样本比例、样本方差等一、重复抽样时样本平均数的分布考虑顺序的不重复抽样,样本可能数目为:%的区间未包含四、关于正态分布的定理根据样本日工资平均数分布表,可以计算日工资平均数的数学期望和方差:总体均值 在1-置信水平下的置信区间为 -2 x区间估计(interval estimate)就是在点估计的基础上,以一定的概率给出总体参数估计的一个范围。例:某施工班组5个工人的日工资分别为:34、38、42、46、50元。仍用前面5个工人日工资的例子。样本统计量是个随机变量,抽样分布就是样本统计量的概率分布。解:已知n25,1-95%,根据样本数据计

37、算得s2=93.应抽取139个产品作为样本【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。总体均值置信水平为的置信区间为:统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间解:已知n=36,1-=90%,z/2=1.估计总体比例时样本容量的确定(例题分析)现用重复抽样方法从5人中随机抽取2人组成样本,样本可能数目为52=25个。一个总体参数的区间估计(小样本)一个总体参数的区间估计(小样本)t分布与标准正态分布分布与标准正态分布的比较的比较 统计学统计学(第二版第二版)在在 置信水平下,根据置信水平下,根据t分布建立的总

38、体分布建立的总体均值的置信区间为:均值的置信区间为:/2sxtn(1)其中,其中,是自由度为是自由度为 时,时,分布的上侧面积为分布的上侧面积为/2/2时的时的 值。值。2/t(1)ntt(三)小样本的情形(三)小样本的情形统计学统计学(第二版第二版)总体均值的区间估计总体均值的区间估计(大样本大样本)1.假定条件假定条件总体服从正态分布总体服从正态分布,且方差且方差()已知已知如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量使用正态分布统计量)1,0(NnXZ)(22未知或nSzXnzX统计学统计学(第二版第二版)总体均值的区间估计总

39、体均值的区间估计(例题分析例题分析)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3统计学统计学(第二版第二版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)28.109,44.10192.336.105251096.136.1052nzx36.105x统计学统计学(第二版第二版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)36个投保人年龄的数据个投保人

40、年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532统计学统计学(第二版第二版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)63.41,37.3713.25.393677.7645.15.392nszx5.39x77.7s统计学统计学(第二版第二版)总体均值的区间估计总体均值的区间估计(小样本小样本)1.假定条件假定条件总体服从正态分布总体服从正态分布,且方差且方差()未知未知小样本小样本(n 30)2.使用使用 t 分布统计量分布统计量)1(ntnSXtnStX2统计学统计学(

41、第二版第二版)t 分布分布统计学统计学(第二版第二版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470统计学统计学(第二版第二版)总体均值的区间估计总体均值的区间估计(例题分析例题分析)2.1503,8.14762.1314901677.24131.214902ntx1490 x77.24s统计学统计学(第二版第二版)总体比例的区间估计总体比例的区间估计统计学统计学(第二版第二版)总体比例总体比例是指总体中具有某种特征

42、的是指总体中具有某种特征的单位数量占总体全部单位数的比重。单位数量占总体全部单位数的比重。统计学统计学(第二版第二版)是非标志(是非标志(0-1变量)的平均数和标准差变量)的平均数和标准差(p90)是非标志是非标志:反映总体单位的某一种属性,标志的表现:反映总体单位的某一种属性,标志的表现 只有只有两种两种情况,具体体现在各总体单位情况,具体体现在各总体单位 要么具有该种属性,要么不具有该种属性。要么具有该种属性,要么不具有该种属性。统计学统计学(第二版第二版)性性 别别取值取值人数人数男男女女10n1n0合计合计n例:例:设总体中共有设总体中共有n个总体单位,其中取值个总体单位,其中取值为为

43、1的单位数为的单位数为n1个,取值为个,取值为0的个体有的个体有n0个个统计学统计学(第二版第二版)pnnnnnfxfx10101pqppppppnnpnpffxx1)1()1(01)(22021222P是一种特殊是一种特殊的平均数的平均数统计学统计学(第二版第二版)一个总体参数的区间估计一个总体参数的区间估计二、总体比例的区间估计二、总体比例的区间估计 样本比例是总体比例的无偏估计,并且,当样本样本比例是总体比例的无偏估计,并且,当样本量足够大时,量足够大时,样本比例的抽样分布可以用正态分样本比例的抽样分布可以用正态分布近似布近似。样本量足够大是指:。样本量足够大是指:5,(1)5npnp且

44、统计学统计学(第二版第二版)一个总体参数的区间估计一个总体参数的区间估计 与总体均值的区间估计类似,我们定义与总体均值的区间估计类似,我们定义为样本比例的边际误差,于是,在(为样本比例的边际误差,于是,在(1-)置信水)置信水平下总体比例的置信区间为:平下总体比例的置信区间为:pz2/pzp2/nzp)1(2/n式中总体比例式中总体比例未知时未知时可以用样本比例可以用样本比例p代替。代替。统计学统计学(第二版第二版)总体比例的区间估计总体比例的区间估计(例题分析例题分析)%35.74%,65.55%35.9%65100%)651%(6596.1%65)1(2nppzp统计学统计学(第二版第二版

45、)总体方差的区间估计总体方差的区间估计统计学统计学(第二版第二版)二、总体比例的区间估计只有两种情况,具体体现在各总体单位(一)正态分布再生定理当样本容量n足够大(一般认为n30)时,样本均值的抽样分布渐近地服从正态分布。(1)不重复抽样的平均误差总是小于重复抽样的平均误差,二者的比值就是修正因子。二、总体比例的区间估计不重复抽样时的样本可能数目可分为考虑顺序和不考虑顺序两种情况。这就是说,由样本均值构造的估计区间会以1-的概率涵盖总体均值,又可写为如下形式:一个总体参数的区间估计其中样本均值,样本比例和样本方差分别是总体均值、总体比例和总体方差的无偏估计量在 置信水平下,根据t分布建立的总体

46、均值的置信区间为:总体均值置信水平为的置信区间为:(一)正态分布再生定理%的区间未包含(一)正态分布再生定理当总体服从正态分布 XN(,2)时,来自该总体所有容量为n的样本均值 也服从正态分布,的数学期望为 ,方差为例:从0-9的10个数中随机重复抽选6个数字组成电话号码,共能组成多少个电话号码?样本统计量是个随机变量,抽样分布就是样本统计量的概率分布。根据样本数据计算得:,估计量:用于估计总体参数的随机变量总体方差的区间估计总体方差的区间估计1.估计一个总体的方差或标准差估计一个总体的方差或标准差2.假设总体服从正态分布假设总体服从正态分布3.总体方差总体方差 2 的点估计量为的点估计量为S

47、2,且且11222nSn111122122222nSnnSn统计学统计学(第二版第二版)总体方差的区间估计总体方差的区间估计(图示图示)统计学统计学(第二版第二版)总体方差的区间估计总体方差的区间估计(例题分析例题分析)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3统计学统计学(第二版第二版)总体方差的区间估计总体方差的区间估计(例题分析例题分析)401.12)24()1(

48、2975.0212n364.39)24()1(2025.022n39.18083.56401.1221.93125364.3921.9312522统计学统计学(第二版第二版)5.4 样本容量的确定样本容量的确定估计总体均值时样本容量的确定估计总体均值时样本容量的确定估计总体比例时样本容量的确定估计总体比例时样本容量的确定统计学统计学(第二版第二版)估计总体均值时样本容量的确估计总体均值时样本容量的确定定统计学统计学(第二版第二版)估计总体均值时样本容量估计总体均值时样本容量n为为样本容量样本容量n与总体方差与总体方差 2、边际误差、边际误差E、可、可靠性系数靠性系数Z或或t之间的关系为之间的关

49、系为与总体方差成正比与总体方差成正比与边际误差成反比与边际误差成反比与可靠性系数成正比与可靠性系数成正比估计总体均值时样本容量的估计总体均值时样本容量的确定确定 2222)(EznnzE2统计学统计学(第二版第二版)估计总体均值时样本容量的估计总体均值时样本容量的确定确定(例题分析例题分析)统计学统计学(第二版第二版)估计总体均值时样本容量的估计总体均值时样本容量的确定确定 (例题分析例题分析)9704.964002000)96.1()(2222222Ezn统计学统计学(第二版第二版)估计总体比例时样本容量的估计总体比例时样本容量的确定确定统计学统计学(第二版第二版)根据比例区间估计公式可得样本容量根据比例区间估计公式可得样本容量n为为估计总体比例时样本容量的估计总体比例时样本容量的确定确定 222)1()(EznnzE)1(2统计学统计学(第二版第二版)估计总体比例时样本容量的估计总体比例时样本容量的确定确定(例题分析例题分析)1393.13805.0)9.01(9.0)96.1()1()(22222Ezn统计学统计学(第二版第二版)本章小结本章小结参数估计的一般问题参数估计的一般问题一个总体参数的区间估计一个总体参数的区间估计样本容量的确定样本容量的确定

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(抽样与参数估计优质课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|