1、2022-10-4非统计学专业本科3学分1第五章第五章 抽样推断抽样推断第三节第三节 参数估计参数估计2022-10-4非统计学专业本科3学分2统计估计问题的产生统计估计问题的产生u以下情况会导致统计估计问题以下情况会导致统计估计问题:n需要需要估计分布类型估计分布类型的问题的问题在许多实际问题中,总体被理解为我们所研究的某个在许多实际问题中,总体被理解为我们所研究的某个统计指标,它在一定范围内取值,而且以一定的概率统计指标,它在一定范围内取值,而且以一定的概率取各种可能的值,从而形成一个概率分布取各种可能的值,从而形成一个概率分布而这个概率分布往往未知。如,为了制定绿色食品的而这个概率分布往
2、往未知。如,为了制定绿色食品的有关规定,需要研究蔬菜中残留农药的分布状况。对有关规定,需要研究蔬菜中残留农药的分布状况。对这个分布我们知之甚少,甚至不清楚它属于何种类型这个分布我们知之甚少,甚至不清楚它属于何种类型的分布的分布n需要需要估计分布参数估计分布参数的问题的问题有时分布类型已知,如,在农民收入调查中,根据实有时分布类型已知,如,在农民收入调查中,根据实际经验和理论分析,可以断定收入服从正态分布际经验和理论分析,可以断定收入服从正态分布但分布中的参数未知,需要估计但分布中的参数未知,需要估计2022-10-4非统计学专业本科3学分3统计估计的类别统计估计的类别u统计估计问题专门研究由样
3、本估计总体的未知分布统计估计问题专门研究由样本估计总体的未知分布或分布中的未知参数的问题或分布中的未知参数的问题u分为:非参数估计和分为:非参数估计和参数估计参数估计直接对总体的未知分布进行估计的问题为非参数直接对总体的未知分布进行估计的问题为非参数估计估计对分布的未知参数进行估计,称为参数估计对分布的未知参数进行估计,称为参数估计2022-10-4非统计学专业本科3学分4参数估计在统计估计问题中的地位参数估计在统计估计问题中的地位统计估计方法统计估计方法非参数估计非参数估计参数估计参数估计点估计点估计区间估计区间估计2022-10-4非统计学专业本科3学分5参数估计的基本方法参数估计的基本方
4、法2022-10-4非统计学专业本科3学分6一、估计量与估计值一、估计量与估计值2022-10-4非统计学专业本科3学分7l估计量:估计量:用于估计总体参数的样本统计量用于估计总体参数的样本统计量n如样本均值、样本比例如样本均值、样本比例(成数成数)、样本方差等、样本方差等n例如:样本均值就是总体均值例如:样本均值就是总体均值 的一个估计量的一个估计量l估计值:估计值:估计参数时计算出来的统计量的估计参数时计算出来的统计量的具体数值具体数值n如果样本均值如果样本均值 x=80,则,则80就是就是 的估计值的估计值u注:注:有时,对估计量和估计值并不刻意区分,都称有时,对估计量和估计值并不刻意区
5、分,都称为估计,根据上下文很容易明确其指代为估计,根据上下文很容易明确其指代估计量与估计值估计量与估计值(estimator&estimated value)随机随机变量变量2022-10-4非统计学专业本科3学分8一个总体参数的估计一个总体参数的估计P总体参数总体参数样本统计量样本统计量均值均值比例比例方差方差2spxXP22022-10-4非统计学专业本科3学分9二、估计量的优良标准二、估计量的优良标准 评价估计量的标准评价估计量的标准n所谓优良估计量,是从总体上来评价的所谓优良估计量,是从总体上来评价的n对于总体的同一参数,可以有不同的估计量。例如,对于总体的同一参数,可以有不同的估计量
6、。例如,估计总体平均指标,可以用样本平均数,也可以用样估计总体平均指标,可以用样本平均数,也可以用样本中位数,用哪种估计量更好呢?本中位数,用哪种估计量更好呢?n希望选择一个相对优良、估计效果更好的估计量。希望选择一个相对优良、估计效果更好的估计量。n什么样的估计量才算是一个好的估计量呢?什么样的估计量才算是一个好的估计量呢?n这就需要有一定的评价标准。统计学家给出了评价估这就需要有一定的评价标准。统计学家给出了评价估计量的一些标准计量的一些标准n一个优良估计量主要需要符合下面三个标准:无偏性、一个优良估计量主要需要符合下面三个标准:无偏性、有效性、一致性有效性、一致性2022-10-4非统计
7、学专业本科3学分10(一一)无偏性无偏性(unbiasedness)n估计量估计量(随机变量随机变量)的数学期望等于被估计的总体参数的数学期望等于被估计的总体参数n中心极限定理证明了:样本平均数、样本成数都满足无偏中心极限定理证明了:样本平均数、样本成数都满足无偏性性 XxE)(PpE)(无偏无偏有偏有偏212022-10-4非统计学专业本科3学分11(二二)有效性有效性(efficiency)l对同一总体参数的两个无偏点估计量,有更小标对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效准差的估计量更有效 122022-10-4非统计学专业本科3学分12(三三)一致性一致性(cons
8、istency)n随着样本容量的增大,估计量的值越来越接近被估计随着样本容量的增大,估计量的值越来越接近被估计的总体参数的总体参数n大数定律已经证明了:大数定律已经证明了:样本平均数和样本成数都满足样本平均数和样本成数都满足一致性一致性 PpXxNnNnlimlim2022-10-4非统计学专业本科3学分13三、总体参数的点估计和区间估计三、总体参数的点估计和区间估计2022-10-4非统计学专业本科3学分14参数估计的方法参数估计的方法 点估计和区间估计点估计和区间估计估估 计计 方方 法法点估计点估计区间估计区间估计2022-10-4非统计学专业本科3学分15(一一)点估计点估计/定值估计
9、定值估计(point estimate)l做法:做法:用样本估计量的值直接作为总体参数的估计值用样本估计量的值直接作为总体参数的估计值例:例:用样本均值直接用样本均值直接作为作为总体均值的估计总体均值的估计例:例:用样本成数直接作为总体成数的估计用样本成数直接作为总体成数的估计例:用两个样本均值之差直接例:用两个样本均值之差直接作为作为总体均值之差总体均值之差的估计的估计l缺点:缺点:没有考虑抽样误差的大小,没有给出估计值接没有考虑抽样误差的大小,没有给出估计值接近总体参数的程度,即,它没有给出一个用于衡量估近总体参数的程度,即,它没有给出一个用于衡量估计值的可靠程度的度量计值的可靠程度的度量
10、l点估计的方法:点估计的方法:l矩估计法、顺序统计量法、最大似然法、最小二矩估计法、顺序统计量法、最大似然法、最小二乘法等乘法等l点估计方法是区间估计的基础点估计方法是区间估计的基础2022-10-4非统计学专业本科3学分16点估计缺陷的弥补点估计缺陷的弥补区间估计区间估计n虽然点估计可以给出未知参数的一个估计,但不虽然点估计可以给出未知参数的一个估计,但不能给出估计的精度能给出估计的精度n人们希望利用样本给出一个范围,要求该范围以人们希望利用样本给出一个范围,要求该范围以足够大的概率包含待估参数真值足够大的概率包含待估参数真值n这就是区间估计问题这就是区间估计问题2022-10-4非统计学专
11、业本科3学分17(二二)区间估计区间估计(interval estimate)l构造构造置信区间置信区间(confidence interval):由样本统计量加减一个误差范围得到总体参数由样本统计量加减一个误差范围得到总体参数的一个区间范围的一个区间范围n同时指出了总体指标落在这一区间范围内的可能性同时指出了总体指标落在这一区间范围内的可能性大小,即给出了做出这种结论的概率保证程度,大小,即给出了做出这种结论的概率保证程度,F(t)/置信度置信度/置信水平置信水平(1-)(confidence level)xxxXxpppPp抽样极抽样极限误差限误差2022-10-4非统计学专业本科3学分1
12、8置信区间的三要素置信区间的三要素n总体参数的区间估计必须同时具备三个要素:总体参数的区间估计必须同时具备三个要素:n点估计值(区间的中心)点估计值(区间的中心)n抽样极限误差(区间的半径)抽样极限误差(区间的半径)n概率保证程度概率保证程度n统计学家在某种程度上确信这个区间会包含真正的总统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间体参数,所以给它取名为置信区间2022-10-4非统计学专业本科3学分19区间估计的基本原理区间估计的基本原理2022-10-4非统计学专业本科3学分20区间估计的图示区间估计的图示xzxX2XX65.1XX65.1XX3XX3XX9
13、6.1XX96.1xX2022-10-4非统计学专业本科3学分21置信区间与置信水平置信区间与置信水平)(xExx用某一具体的样本用某一具体的样本所构造的区间是一所构造的区间是一个特定的区间,我个特定的区间,我们无法知道这个样们无法知道这个样本所产生的区间是本所产生的区间是否包含总体参数的否包含总体参数的真值真值我们只能希望这个我们只能希望这个区间是大量包含总区间是大量包含总体参数真值的区间体参数真值的区间中的一个,但它也中的一个,但它也可能是少数几个不可能是少数几个不包含参数真值的区包含参数真值的区间中的一个间中的一个XX2022-10-4非统计学专业本科3学分22总体参数区间估计的总体参数
14、区间估计的特点:特点:根据给定的概率保证程度的要求,利用实际抽样资料,指出总根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范体被估计值的上限和下限,即指出总体参数可能存在的区间范围,而不是直接给出总体参数的估计值。围,而不是直接给出总体参数的估计值。121xXxP总体参数的区间估计必须同时具备的三个要素总体参数的区间估计必须同时具备的三个要素:点估计值(区间的中心)点估计值(区间的中心)抽样误差范围抽样误差范围(区间的半径)(区间的半径)置信水平置信水平/概率保证程度(概率保证程度(1-)抽样误差范围决定估计抽样误差范围决定估计的精度
15、而概率保证程度的精度而概率保证程度则决定估计的可靠性则决定估计的可靠性 2022-10-4非统计学专业本科3学分231.实践中对区间估计的基本要求实践中对区间估计的基本要求 置信度和精确度置信度和精确度n置信区间的各要素给出的含义不同:置信区间的各要素给出的含义不同:n说明了区间估计的精确性说明了区间估计的精确性n越小,置信区间越窄,估计的精确性越高,但可靠越小,置信区间越窄,估计的精确性越高,但可靠度会降低度会降低n反之,反之,越大,置信区间越宽,估计的精确性越低,越大,置信区间越宽,估计的精确性越低,但可靠度会提高但可靠度会提高n置信度置信度F(t)则说明了区间估计的可靠程度则说明了区间估
16、计的可靠程度nF(t)越高,置信区间越宽,估计的可靠性越高,但精越高,置信区间越宽,估计的可靠性越高,但精确性却降低了确性却降低了n相反,相反,F(t)越低,置信区间越窄,估计的可靠性越低,越低,置信区间越窄,估计的可靠性越低,但精确性却提高了但精确性却提高了n由此可见,区间估计中精确性与可靠性是互相矛盾的两由此可见,区间估计中精确性与可靠性是互相矛盾的两个方面,二者依照一定的联系而此消彼长个方面,二者依照一定的联系而此消彼长n因此,在实践中,根据对精确性和可靠性的要求不同,因此,在实践中,根据对精确性和可靠性的要求不同,研究者有时先主观确定研究者有时先主观确定,有时先主观确定,有时先主观确定
17、F(t)2022-10-4非统计学专业本科3学分242.区间估计方法区间估计方法围绕置信区间的三要素展开围绕置信区间的三要素展开2022-10-4非统计学专业本科3学分25区间估计做法区间估计做法1l情况情况1:在已经主观确定了抽样误差范围:在已经主观确定了抽样误差范围的情况下进的情况下进行区间估计行区间估计(1)抽取样本,计算抽样指标,如计算样本平均数或样本抽取样本,计算抽样指标,如计算样本平均数或样本成数,作为相应总体指标的点估计值,并计算样本标准成数,作为相应总体指标的点估计值,并计算样本标准差以推算抽样平均误差(抽样标准误)差以推算抽样平均误差(抽样标准误)(2)根据给定的抽样误差范围
18、,给出总体参数估计的上、根据给定的抽样误差范围,给出总体参数估计的上、下限下限(3)将抽样误差范围除以抽样平均误差求出概率度将抽样误差范围除以抽样平均误差求出概率度t值,再值,再根据根据t值查值查“正态分布概率表正态分布概率表”求出相应的置信度求出相应的置信度F(t)2022-10-4非统计学专业本科3学分26区间估计做法区间估计做法2情况情况2:在已经主观确定了置信度:在已经主观确定了置信度F(t)的前提下进行区间估的前提下进行区间估计计(1)抽取样本,计算抽样指标,如计算抽样平均数或抽样成)抽取样本,计算抽样指标,如计算抽样平均数或抽样成数作为相应总体指标的估计值,并计算样本标准差以推算抽
19、数作为相应总体指标的估计值,并计算样本标准差以推算抽样平均误差样平均误差(2)根据给定的)根据给定的置信度置信度F(t)要求,求得概率度要求,求得概率度t值值(3)根据概率度)根据概率度t和抽样平均误差和抽样平均误差来推算来推算的可能范围,再的可能范围,再根据根据求出被估计总体指标的上下限,对总体参数做区间估求出被估计总体指标的上下限,对总体参数做区间估计计2022-10-4非统计学专业本科3学分27每包重量每包重量(克克)包数包数组中值组中值149149以下以下1010148.5148.514851485-1.8-1.832.432.41491501491502020149.5149.529
20、902990-0.8-0.812.812.81501511501515050150.5150.5752575250.20.22 2151151以上以上2020151.5151.5303030301.21.228.828.8合计合计10010015030150307676fxxfxxf)xx(2区间估计综合例题区间估计综合例题l 例例 某外贸公司出口一种茶叶,规定每包规格不低于某外贸公司出口一种茶叶,规定每包规格不低于150150克,现用克,现用不重复不重复抽样方法从中随机抽取抽样方法从中随机抽取1%1%进行检验,进行检验,抽检结果如表所示:抽检结果如表所示:要求:要求:(1)以允许误差范围)以
21、允许误差范围0.2克,估计该批茶克,估计该批茶叶每包平均重量的区间及其概率保证程度。叶每包平均重量的区间及其概率保证程度。(2)茶叶包装合格率的误差范围不超过)茶叶包装合格率的误差范围不超过6%,估计包装合格率的区间及其概率,估计包装合格率的区间及其概率保证程度。保证程度。(3)要求以)要求以95.45%的概率保证程度,的概率保证程度,估计该批茶叶每包平均重量的区间。估计该批茶叶每包平均重量的区间。(4)要求以)要求以95.45%的概率保证程度,的概率保证程度,估计该批茶叶的包装合格率的区间。估计该批茶叶的包装合格率的区间。2022-10-4非统计学专业本科3学分28每包重量每包重量(克克)包
22、数包数组中值组中值149149以下以下1010148.5148.514851485-1.8-1.832.432.41491501491502020149.5149.529902990-0.8-0.812.812.81501511501515050150.5150.5752575250.20.22 2151151以上以上2020151.5151.5303030301.21.228.828.8合计合计10010015030150307676fxxfxxf)xx(2计算表计算表2022-10-4非统计学专业本科3学分29解答解答n要求(要求(1):以允许误差范围):以允许误差范围0.2克,估计该批茶
23、克,估计该批茶叶每包平均重量的区间及其概率保证程度。叶每包平均重量的区间及其概率保证程度。n计算过程为计算过程为315010015030.fxfx87180100762.ff)xx(x上限上限=150.3+0.2=150.5克克下限下限=150.3-0.2=150.1克克n 查概率表:查概率表:n该批茶叶每包平均重量落在区间该批茶叶每包平均重量落在区间150.1,150.5克内,克内,概率保证程度为概率保证程度为97.91%。xxxx086701110087180122.%)(.)Nn(nx3120867020.xtx%91.97)(tFn 要求(要求(2):茶叶包装合格率的误差范围不超过):
24、茶叶包装合格率的误差范围不超过6%,估计包装合格率的区间及其概率保证程度估计包装合格率的区间及其概率保证程度n计算过程为:计算过程为:n上限上限=70%+6%76%n下限下限=70%-6%64%p701005020pppp%.%)(%)Nn(n)p(pp564111003070113215646.%.%ptpn 查概率表:查概率表:t1.32时时 n 该批茶叶的包装合格率落在区间该批茶叶的包装合格率落在区间64%,76%内,概率保证程度为内,概率保证程度为81.32%。%32.81)(tF2022-10-4非统计学专业本科3学分33n要求要求(3):以:以95.45%的概率保证程度,估计该批茶
25、叶的概率保证程度,估计该批茶叶每包平均重量的区间每包平均重量的区间n计算过程为:计算过程为:n上限上限=150.3+0.1734=150.47克克n下限下限=150.3-0.1734=150.13克克n以以95.45%的概率保证程度估计该批茶叶每包的概率保证程度估计该批茶叶每包平均重量在区间平均重量在区间150.13,150.47内。内。3150.x 87180.x%45.95)(tF2t08670.x17340086702.txxxxxx2022-10-4非统计学专业本科3学分34n要求(要求(4):以):以95.45%的概率保证程度,估计该批茶的概率保证程度,估计该批茶叶的包装合格率的区间
26、叶的包装合格率的区间n计算过程为:计算过程为:n上限上限=70%+9.12%79.12%n下限下限=70%-9.12%61.88%n 以以95.45%的概率保证程度估计该批茶叶包的概率保证程度估计该批茶叶包装合格率的区间为装合格率的区间为61.88%,79.12%。%70p%83.45p%45.95)(tF2t08670.x17340086702.txxpppp2022-10-4非统计学专业本科3学分35注意:抽样平均误差注意:抽样平均误差和抽样极限误和抽样极限误差差的关系的关系n抽样平均误差抽样平均误差是是客观存在客观存在的,根据抽样方法、的,根据抽样方法、总体离散度以及总体离散度以及n大小
27、可以计算出来,是抽样大小可以计算出来,是抽样误差的衡量指标之一误差的衡量指标之一n抽样极限误差抽样极限误差是是人为规定人为规定的。现实实践中总的。现实实践中总是通过人为规定是通过人为规定来规定抽样推断的精度大小来规定抽样推断的精度大小n和和通过概率度通过概率度t t连接连接到一起:到一起:=t=tn客观存在,因此人为规定客观存在,因此人为规定和人为规定和人为规定t t或或F(t)F(t)是等价的是等价的2022-10-4非统计学专业本科3学分36区间估计方法区间估计方法详细:分各种具体情况的详细:分各种具体情况的2022-10-4非统计学专业本科3学分37总体均值的区间估计总体均值的区间估计重
28、点:重点:l一个总体均值的区间估计一个总体均值的区间估计l大样本大样本2022-10-4非统计学专业本科3学分38总体均值的区间估计总体均值的区间估计1正态总体、正态总体、已知已知或者,大样本或者,大样本2022-10-4非统计学专业本科3学分39总体均值的区间估计总体均值的区间估计1假定条件假定条件n总体服从正态分布总体服从正态分布,方差方差()已知已知n若非正态分布,但是大样本若非正态分布,但是大样本(n 30),可近似正态,可近似正态总体均值在总体均值在1-置信水平下的置信水平下的置信区间为置信区间为)(未知或nstxntx重复抽样重复抽样不重复抽样不重复抽样)(11未知NnNnstxN
29、nNntx抽样平均误差抽样平均误差ux抽样极限误差抽样极限误差绝对误差绝对误差d2022-10-4非统计学专业本科3学分40总体均值的区间估计总体均值的区间估计1(例题分析例题分析)【例】【例】某种零件的长度服从正态分布,从某天生产的一批零某种零件的长度服从正态分布,从某天生产的一批零件中件中重复重复随机抽取了随机抽取了9个,测得其平均长度为个,测得其平均长度为21.4cm。已知。已知总体标准差为总体标准差为=0.15cm。试估计该批零件平均长度的置信。试估计该批零件平均长度的置信区间,置信水平为区间,置信水平为95%。498.21,302.21098.04.21915.096.14.21nt
30、x该批零件平均长度的置信区间在该批零件平均长度的置信区间在21.302cm21.498cm之间之间 解:已知解:已知N(,0.152),n=9,1-=95%,t/2=1.96 总总体均值在体均值在1-置信水平下的置信区间为置信水平下的置信区间为Xx2022-10-4非统计学专业本科3学分41总体均值的区间估计总体均值的区间估计1(例题分析例题分析)【例】【例】在某天生产的在某天生产的500袋食品中,袋食品中,不重复不重复随机抽取随机抽取25袋进袋进行检查,测得平均每袋的重量为行检查,测得平均每袋的重量为996g。已知该种袋装食品的。已知该种袋装食品的重量服从正态分布,且标准差为重量服从正态分布
31、,且标准差为20g。试估计该种食品平均。试估计该种食品平均重量的置信区间,置信水平为重量的置信区间,置信水平为95%。65.1003,35.99865.7996150025500252096.19961NnNntx该种食品平均重量的置信区间为该种食品平均重量的置信区间为988.35g g1003.65g g之间之间解:已知解:已知N(,202),n=25,1-=95%,t/2=1.96 总体均值总体均值 在在1-置信水平下的置信区间为置信水平下的置信区间为X2022-10-4非统计学专业本科3学分42中心极限定理中心极限定理(central limit theorem)当样本容量足够当样本容量
32、足够大时大时(n 30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布 xn 中心极限定理:设从均值为中心极限定理:设从均值为,方差为,方差为 2的一个任意总的一个任意总体中抽取容量为体中抽取容量为n的样本,当的样本,当n充分大时,样本均值的充分大时,样本均值的抽样分布近似服从均值为抽样分布近似服从均值为、方差为、方差为2/n的正态分布的正态分布一个任意分一个任意分布的总体布的总体 x 2022-10-4非统计学专业本科3学分43总体均值的区间估计总体均值的区间估计2正态总体、正态总体、未知、小样本未知、小样本2022-10-4非统计学专业本科3学分44总体均值的区间估
33、计总体均值的区间估计21.假定条件假定条件n总体服从正态分布总体服从正态分布,且方差且方差()未知未知n小样本小样本(n 30)2.使用使用 t 分布统计量分布统计量)1(ntnSXxtnstx2 总体均值总体均值 在在1-置信水平下的置信水平下的置信区间为置信区间为X2022-10-4非统计学专业本科3学分45t 分布分布t分布是类似正态分布的一种对称分布,它通常要比分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐为自由度的参数。随着自由度的增大,分布也逐渐趋于正态
34、分布趋于正态分布 t 分布与标准正态分布的比较分布与标准正态分布的比较不同自由度的不同自由度的t分布分布2022-10-4非统计学专业本科3学分46总体均值的区间估计总体均值的区间估计2(例题分析例题分析)【例】【例】已知某种灯泡的寿命服从正态分布,现从一已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取批灯泡中随机抽取16只,测得其使用寿命只,测得其使用寿命(小时小时)如如下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命95%的置信区间的置信区间16个个灯泡使用寿命的数据灯泡使用寿命的数据 151015201480150014501480151015201480149015301
35、51014601460147014702022-10-4非统计学专业本科3学分47总体均值的区间估计总体均值的区间估计2(例题分析例题分析)2150381476213149016772413121490s2.,.ntx该种灯泡平均使用寿命的置信区间为该种灯泡平均使用寿命的置信区间为1476.8小时小时1503.2小时小时1490 x77.24s解:已知解:已知N(,2),n=16,1-=95%,t/2=2.131根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-置信水平下的置信区间为置信水平下的置信区间为X2022-10-4非统计学专业本科3学分48总体比例的区间估计总体比例
36、的区间估计重点:重点:l一个总体比例的区间估计一个总体比例的区间估计l大样本大样本2022-10-4非统计学专业本科3学分49总体比例的区间估计总体比例的区间估计1(大样本,重复抽样大样本,重复抽样)1.假定条件假定条件n总体服从二项分布,即考察总体服从二项分布,即考察0-1标志的分布特征标志的分布特征n可以由正态分布来近似可以由正态分布来近似2.使用正态分布统计量使用正态分布统计量t)1,0()1(NnppPpt3.总体比例总体比例P在在1-置信水平下置信水平下的置信区间为的置信区间为npptp)-1(2022-10-4非统计学专业本科3学分50总体比例的区间估计总体比例的区间估计2(大样本
37、,不重复抽样大样本,不重复抽样)1.假定条件假定条件n总体服从二项分布总体服从二项分布n可以由正态分布来近似可以由正态分布来近似2.使用正态分布统计量使用正态分布统计量t)1,0()1(NnppPpt3.总体比例总体比例P在在1-置信水平下置信水平下的置信区间为的置信区间为1)-1(NnNnpptp2022-10-4非统计学专业本科3学分51总体比例的区间估计总体比例的区间估计1(例题分析例题分析)【例】【例】某城市想某城市想要估计下岗职工要估计下岗职工中女性所占的比中女性所占的比例,随机例,随机重复重复抽抽取了取了100个下岗个下岗职工,其中职工,其中65人人为女性职工。试为女性职工。试以以
38、95%的置信水的置信水平估计该城市下平估计该城市下岗职工中女性比岗职工中女性比例的置信区间例的置信区间解:已知解:已知 n=100,p65%,t/2=1.96%35.74%,65.55%35.9%65100%)651%(6596.1%65)1(npptp该城市下岗职工中女性比例的置信该城市下岗职工中女性比例的置信区间为区间为55.65%74.35%2022-10-4非统计学专业本科3学分52总体比例的区间估计总体比例的区间估计2(例题分析例题分析)【例】【例】某企业共有某企业共有职工职工1000人。企业人。企业准备实行一项改革准备实行一项改革,在职工中征求意,在职工中征求意见,采取见,采取不重
39、复不重复抽抽样方法随机抽取样方法随机抽取200人作为样本,调查人作为样本,调查结果显示,有结果显示,有150人人表示赞成该项改革表示赞成该项改革,50人表示反对。人表示反对。试以试以95%的概率确的概率确定赞成改革的人数定赞成改革的人数比例的置信区间比例的置信区间解:已知解:已知 n=100,p75%,t/2=1.96%37.80%,63.69%37.5%75110002001000200%)751%(7596.1%751)1(NnNnpptp该企业职工中赞成改革的人数比例该企业职工中赞成改革的人数比例的置信区间为的置信区间为69.63%80.37%之间之间 2022-10-4非统计学专业本科
40、3学分53四、总体总量指标的推断四、总体总量指标的推断n从抽样调查的任务来看,除了由样本平均数估从抽样调查的任务来看,除了由样本平均数估计总体平均数,由样本成数估计总体成数外,计总体平均数,由样本成数估计总体成数外,有时还要求从样本指标推断总体总量指标,这有时还要求从样本指标推断总体总量指标,这就是总体总量指标的推断问题就是总体总量指标的推断问题n常用的推断方法:常用的推断方法:n直接推断法直接推断法n区间推断法区间推断法n修正系数法修正系数法 2022-10-4非统计学专业本科3学分54(一)直接推断法(一)直接推断法n直接以样本平均数代表总体平均数,与总体单位数直接以样本平均数代表总体平均
41、数,与总体单位数N相乘来推断总体的标志总量;相乘来推断总体的标志总量;n直接以样本成数代表总体成数,与总体单位数直接以样本成数代表总体成数,与总体单位数N相相乘来推断具有某种标志表现的总体单位数乘来推断具有某种标志表现的总体单位数n这是在点估计的前提下进行的总体总量指标的推断,这是在点估计的前提下进行的总体总量指标的推断,没有考虑可能的误差大小没有考虑可能的误差大小xNX NpN 12022-10-4非统计学专业本科3学分55(二)区间推断法(二)区间推断法n以区间估计为依据,在一定的概率保证程度下,推断以区间估计为依据,在一定的概率保证程度下,推断总体总量指标的区间范围总体总量指标的区间范围
42、xxxXxpppPp)()(xxxNXxN)()(1pppNNpN2022-10-4非统计学专业本科3学分56(三)修正系数法(三)修正系数法n全面调查的工作性误差往往比较大,而且无法全面调查的工作性误差往往比较大,而且无法计算计算n为了检查全面调查资料的质量,提高其准确性,为了检查全面调查资料的质量,提高其准确性,必要时,可以应用抽样调查的资料对全面调查必要时,可以应用抽样调查的资料对全面调查的资料进行补充和修正的资料进行补充和修正n一般采用修正系数法一般采用修正系数法n对全面调查的总体进行抽样调查,将抽样结果与相对全面调查的总体进行抽样调查,将抽样结果与相应范围的全面调查资料相对比,求得修正系数,再应范围的全面调查资料相对比,求得修正系数,再用它修正全面调查的资料用它修正全面调查的资料5.3结束结束