1、 第十一章第十一章 非抽样误差非抽样误差 经济与管理类统计学系列教材本章要点本章要点 本章对非抽样误差的构成和各种非本章对非抽样误差的构成和各种非抽样误差的影响进行分析。具体要求:抽样误差的影响进行分析。具体要求:正确理解非抽样误差的涵义、来正确理解非抽样误差的涵义、来源和特点;源和特点;对抽样框误差、无回答误差和计对抽样框误差、无回答误差和计量误差的成因及其对抽样的影响有比较量误差的成因及其对抽样的影响有比较系统的理解;系统的理解;掌握控制非抽样误差的基本思想。掌握控制非抽样误差的基本思想。第一节第一节 非抽样误差构成非抽样误差构成一、非抽样误差的来源一、非抽样误差的来源 非抽样误差就是由抽
2、样误差以外因素引非抽样误差就是由抽样误差以外因素引起的,因样本观察数据非同质、或残缺、或起的,因样本观察数据非同质、或残缺、或不真实而产生的误差。不真实而产生的误差。为了使非抽样误差问题简单化,我们可为了使非抽样误差问题简单化,我们可以按照抽样调查的过程来考察其来源。以按照抽样调查的过程来考察其来源。抽样方案设计阶段抽样方案设计阶段 数据收集阶段数据收集阶段 数据处理阶段数据处理阶段 在抽样方案设计阶段,非抽样误差的来源在抽样方案设计阶段,非抽样误差的来源:(1 1)抽样框的编制与准备不够充分完善;)抽样框的编制与准备不够充分完善;(2)问卷设计不够科学合理。问卷设计不够科学合理。在数据收集阶
3、段,非抽样误差的来源在数据收集阶段,非抽样误差的来源:(1 1)调查数据的残缺;)调查数据的残缺;(2)调查数据的错误。调查数据的错误。在数据处理阶段,非抽样误差存在于对调查资在数据处理阶段,非抽样误差存在于对调查资料料的的整理、分组、计算、编码和计算机录入等整理、分组、计算、编码和计算机录入等过程中过程中,是一种工作上的差错。是一种工作上的差错。抽 样 框 误 差无 回 答 误 差 计 量 误 差非 抽 样 误 差把上述三个阶段的各种非抽样误差加以归纳,可把上述三个阶段的各种非抽样误差加以归纳,可以概括为以概括为抽样框误差、无回答误差和计量误差抽样框误差、无回答误差和计量误差三类。三类。其中
4、计量误差包括抽样方案设计阶段有缺陷的问卷设其中计量误差包括抽样方案设计阶段有缺陷的问卷设计、数据收集阶段有错误的调查数据和数据处理阶段工作计、数据收集阶段有错误的调查数据和数据处理阶段工作上的差错所带来的误差,也就是调查性误差。上的差错所带来的误差,也就是调查性误差。二、非抽样误差的特点二、非抽样误差的特点非特有性非特有性:为非抽样调查所特有;非一致性非一致性:使抽样估计结果产生偏差,并且样本越大产生偏差的可能性越大;难测定性难测定性:难以对其进行描述和测定,具有很强的隐蔽性;难评价性难评价性:非抽样误差的存在使得对抽样效果的评价与衡量复杂化;全过程性全过程性:存在于抽样调查的所有阶段。第二节
5、第二节 抽样框误差分析抽样框误差分析一、抽样框误差的成因一、抽样框误差的成因丢失目标总体中的单位:覆盖不足,丢失单位,丢失目标总体中的单位:覆盖不足,丢失单位,使总体总值的估计值偏低;使总体总值的估计值偏低;包含非目标总体单位:过涵盖,空名单,异质包含非目标总体单位:过涵盖,空名单,异质单位;单位;如果在抽样框中同时出现如果在抽样框中同时出现“丢失单位丢失单位”和和“异异质单位质单位”,那么也许可能会相互抵消一部分,那么也许可能会相互抵消一部分,形成形成“净涵盖误差净涵盖误差”。复合联接复合联接:目标总体中的一个调查单位与抽目标总体中的一个调查单位与抽样框中的多个抽样单位相联接,或抽样框中的样
6、框中的多个抽样单位相联接,或抽样框中的一个抽样单位与目标总体中的多个调查单位相一个抽样单位与目标总体中的多个调查单位相联接;联接;不够准确或不够完善的辅助信息;不够准确或不够完善的辅助信息;抽样框陈旧,即抽样框老化;抽样框陈旧,即抽样框老化;二、抽样框误差的影响二、抽样框误差的影响 (一)丢失单位的影响(一)丢失单位的影响 在假定不存在其他原因的抽样框误差时,在假定不存在其他原因的抽样框误差时,丢失单位对抽样效果的影响主要取决于两个丢失单位对抽样效果的影响主要取决于两个方面:丢失单位的分布特征和丢失单位数所方面:丢失单位的分布特征和丢失单位数所占的比重。其中,对总体均值的估计只与前占的比重。其
7、中,对总体均值的估计只与前者有关,而对总体总值的估计则与两者都有者有关,而对总体总值的估计则与两者都有关。关。(1 1)丢失单位是目标总体中的一个随机样本,具有与)丢失单位是目标总体中的一个随机样本,具有与目标总体相同的期望与方差,则其对总体均值的估计目标总体相同的期望与方差,则其对总体均值的估计影响不大,但对总体总值的估计会低估影响不大,但对总体总值的估计会低估。(2)(2)丢失的单位是特殊群体,不具有与目标总体相同的丢失的单位是特殊群体,不具有与目标总体相同的期望与方差,那么对目标总体总值、均值的估计会产期望与方差,那么对目标总体总值、均值的估计会产生偏差。生偏差。偏差率为:偏差率为:11
8、1 100()N E yNYN YNYNW Y 00000T01W YW YW e-N=-=-YYW e+W目标总体总值估计量的偏差为目标总体总值估计量的偏差为:(二)包含异质单位的影响(二)包含异质单位的影响 如果是目标总体总值的估计,则其估计量偏差如果是目标总体总值的估计,则其估计量偏差和偏差率分别为:和偏差率分别为:001111)(YMYMYMYMyME101100QrQYMYM很显然,这时的偏差或偏差率都是正的,即若很显然,这时的偏差或偏差率都是正的,即若抽样框中包含了异质单位必定会使目标总体总值抽样框中包含了异质单位必定会使目标总体总值的估计偏高。的估计偏高。均值估计量方差会被高估或
9、低估,总值估计量方差均值估计量方差会被高估或低估,总值估计量方差则一定是高估,即:则一定是高估,即:如果在调查中异质单位可以被识别并如果在调查中异质单位可以被识别并被予以剔除的,可以把目标总体看成抽样被予以剔除的,可以把目标总体看成抽样框中的一个子总体或域。异质单位的标志框中的一个子总体或域。异质单位的标志值就取值就取0 0。在调查中剔除异质单位会增加估计在调查中剔除异质单位会增加估计量的方差,原因在于它使实际的样本容量量的方差,原因在于它使实际的样本容量变小了。增加的量为:变小了。增加的量为:(三)复合联接的影响(三)复合联接的影响(四)不正确辅助信息的影响(四)不正确辅助信息的影响重在预防
10、重在预防积极补救积极补救 心理准备心理准备 第三节第三节 无回答误差分析无回答误差分析 一、无回答误差的成因一、无回答误差的成因 (一)无回答的含义(一)无回答的含义 无回答(无回答(Nonresponse)是指未能取得所是指未能取得所要搜集资料的一种现象,它包括两种情况:要搜集资料的一种现象,它包括两种情况:个个体无回答和项目无回答。体无回答和项目无回答。个体无回答个体无回答也称全无回答,是指被调查者也称全无回答,是指被调查者没有接受调查、造成整张问卷出现空白的没有接受调查、造成整张问卷出现空白的 现象;现象;项目无回答项目无回答也称部分无回答,是指被调查也称部分无回答,是指被调查者回答了问
11、卷中的部分调查项目未能回答其它者回答了问卷中的部分调查项目未能回答其它调查项目的现象。调查项目的现象。不论是个体无回答还是项目无回答,都将不论是个体无回答还是项目无回答,都将导致调查数据残缺不全,从而最终影响估计结导致调查数据残缺不全,从而最终影响估计结果,降低估计精度或可靠程度。因无回答而造果,降低估计精度或可靠程度。因无回答而造成的估计误差,就称为无回答误差。成的估计误差,就称为无回答误差。(二)无回答的成因(二)无回答的成因1 1、遗漏了被调查者;、遗漏了被调查者;2 2、被调查者地址不详;被调查者地址不详;3、调查内容未达被调查者;、调查内容未达被调查者;4 4、被调查者拒绝回答;被调
12、查者拒绝回答;5 5、回答不准确或不知如何回答;、回答不准确或不知如何回答;6 6、忘记回答。忘记回答。以上各种原因,有的属于客观性,以上各种原因,有的属于客观性,有的则属于主观性;有的属于有意识,有的则属于主观性;有的属于有意识,有的则属于无意识;有的属于调查人有的则属于无意识;有的属于调查人员方,有的则属于被调查者方。员方,有的则属于被调查者方。二、无回答误差的影响二、无回答误差的影响 为了测定无回答对抽样的影响,先把总体分为两为了测定无回答对抽样的影响,先把总体分为两层:层:回答层与无回答层。回答层与无回答层。就调查项目而言,如果无回答不是故意造成的就调查项目而言,如果无回答不是故意造成
13、的(即与调查内容无直接关系),且无回答现象不集中(即与调查内容无直接关系),且无回答现象不集中于某类特殊单位组成的群体,那么就可以认为这种无于某类特殊单位组成的群体,那么就可以认为这种无回答是由随机因素引起的,这时无回答对抽样的影响回答是由随机因素引起的,这时无回答对抽样的影响是因实际有效的样本容量减少而使估计量方差增大,是因实际有效的样本容量减少而使估计量方差增大,但却不会造成估计量偏差。估计量方差增大的程度取但却不会造成估计量偏差。估计量方差增大的程度取决于无回答率。决于无回答率。如果无回答是故意造成的(即与调查如果无回答是故意造成的(即与调查内容直接有关),或无回答现象集中于某类特殊的群
14、内容直接有关),或无回答现象集中于某类特殊的群体,那么无回答层与回答层之间就存在明显的非随机体,那么无回答层与回答层之间就存在明显的非随机性差异,这时,无回答对抽样效果的影响,除了会增性差异,这时,无回答对抽样效果的影响,除了会增加估计量方差外,还会带来较严重的估计量偏差。加估计量方差外,还会带来较严重的估计量偏差。如果在调查中出现如果在调查中出现 个无回答、个无回答、个有回答个有回答(+=+=),那么当总,那么当总体无回答层与回答层之间无差异时,估体无回答层与回答层之间无差异时,估计量方差就变为:计量方差就变为:=从而估计量方差增大的量为:从而估计量方差增大的量为:=其中其中 =1 为样本无
15、回答率。为样本无回答率。n0n1nn0n1)(YV nS1221SnnS2S2nnnn11S2nnn111nrS102r0nn0nn1 估计量方差增大的程度则为:估计量方差增大的程度则为:1=在这种情况下,为了达到抽样方案所在这种情况下,为了达到抽样方案所规定的抽样估计效果,就需要增加样本规定的抽样估计效果,就需要增加样本容量。如果总体无回答率为容量。如果总体无回答率为 =,那,那么样本容量应该确定为么样本容量应该确定为 =。nn1)1(00rrR0NN0n)1(0Rn 如果令如果令 =为总体回答率,为总体回答率,+=1,总体中回答层与无回答层的均值分,总体中回答层与无回答层的均值分别为别为
16、和和 ,样本中回答层的均值为样本中回答层的均值为 ,那,那么当以么当以 来估计总体均值来估计总体均值 时,就会有偏时,就会有偏差差为:为:E()=(+)=()R1NN1R1R0Y1Y0y1y1Yy1YY1YY1R1Y1R0Y0R0Y1Y0 偏差率为:偏差率为:=其中其中 =为回答层均值与无回答层为回答层均值与无回答层均值之比。均值之比。不难发现,不难发现,越接近于越接近于1(即无回(即无回答率越高),答率越高),越远离于越远离于1(即回答层(即回答层与无回答层之间的均值差异越大),与无回答层之间的均值差异越大),那么估计量的偏差就会越大,偏差率那么估计量的偏差就会越大,偏差率就会越高,估计结果
17、就越不准确、越就会越高,估计结果就越不准确、越不可信。不可信。YYYR)(010RDRDR000)1()1(DYYo1R0D 还要注意的一个问题是,虽然从理论还要注意的一个问题是,虽然从理论上讲无回答会使估计量方差增大(即上讲无回答会使估计量方差增大(即 ),但在实际上却难以得到客观的反映,但在实际上却难以得到客观的反映,因为我们所能计算的只是因为我们所能计算的只是 (此处的(此处的 是是总体中的回答层方差,未知时要以样本方总体中的回答层方差,未知时要以样本方差差 估计)。这样,估计)。这样,与与 相比,当相比,当 时就会高估时就会高估,当当 时估计量方差高时估计量方差高估,当估,当 ,那么当
18、那么当 =1时,必然会有时,必然会有 =,估计量方差低估或高估的现象也就自估计量方差低估或高估的现象也就自然会消除。可见,提高回答率是消除然会消除。可见,提高回答率是消除无回答影响的关键所在。无回答影响的关键所在。S21r1S2S21r1S2r1R1r1S21S2三、无回答误差的控制三、无回答误差的控制 (一)事前准备充分,争取尽量高的首(一)事前准备充分,争取尽量高的首 次回答率;次回答率;(二)搞清无回答的原因,有针对性地(二)搞清无回答的原因,有针对性地 进行复调查;进行复调查;(三)必要时,对无回答者进行替;(三)必要时,对无回答者进行替;(四)对于一些敏感性问题,可以采用随(四)对于
19、一些敏感性问题,可以采用随 机化回答技术(沃纳模型,西蒙斯模型,机化回答技术(沃纳模型,西蒙斯模型,格格林伯格模型等)林伯格模型等);(五)当无回答不可避免时,可采用一些(五)当无回答不可避免时,可采用一些专门技术来调整估计结果,以减少估计偏差。专门技术来调整估计结果,以减少估计偏差。具体的调整方法技术有以下几种:具体的调整方法技术有以下几种:1.汉森与赫维茨(Hansen and Hurwitz,1946)方法。2.复制估算法。3.加权调整法。1.汉森与赫维茨汉森与赫维茨(Hansen and Hurwitz,1946)方法。方法。这种方法是先对抽中的被调查者进行邮这种方法是先对抽中的被调查
20、者进行邮寄(问卷)调查,然后从那些无回答者中抽寄(问卷)调查,然后从那些无回答者中抽选出一个子样本进行访问调查并尽量取得完选出一个子样本进行访问调查并尽量取得完整资料,最后把邮寄调查结果与子样本访问整资料,最后把邮寄调查结果与子样本访问调查结果综合起来得出总体指标的估计值。调查结果综合起来得出总体指标的估计值。这种方法的优点是比多次复调查法节省这种方法的优点是比多次复调查法节省费用,且估计量无偏、估计精度容易掌握和费用,且估计量无偏、估计精度容易掌握和控制,因此当子样本的个体资料能全部取得控制,因此当子样本的个体资料能全部取得时比较适用。但所花的时间较长,且要保证时比较适用。但所花的时间较长,
21、且要保证取得子样本的完整资料也不容易。取得子样本的完整资料也不容易。设设 为首次邮寄调查的样本容量,为首次邮寄调查的样本容量,为回答者数,为回答者数,为无回答者数,为无回答者数,=+。为从为从 中随机抽取的子样本容量。中随机抽取的子样本容量。为与为与 相对应的均值,相对应的均值,为与为与 相对应的相对应的均值,那么当令均值,那么当令 =,=时,总时,总体均值体均值 的无偏估计量为:的无偏估计量为:=+nn1n0nn1n0n0n0y1n1y0n0w1nn1w0nn0YYw1y1w0y0该估计量的方差为:该估计量的方差为:V()=+其中其中 =,=,=,为总体中为总体中无回答者数,无回答者数,为总
22、体方差,为总体方差,为无回答为无回答层方差。层方差。这个估计过程事实上是双重分层抽样这个估计过程事实上是双重分层抽样估计过程,所不同的是回答层作了全面调估计过程,所不同的是回答层作了全面调查。查。Ynf1S2SnkW200)1(fNnknn00NN0N0S2S20 W0 如果设为如果设为 首次邮寄调查的单位平均首次邮寄调查的单位平均费用,费用,为回收问卷进行数据处理的单位为回收问卷进行数据处理的单位平均费用,平均费用,为对子样本进行调查并数据为对子样本进行调查并数据处理的单位平均费用,那么总调查费用处理的单位平均费用,那么总调查费用函数为:函数为:=+C1C2C0CnC1W1nC2kCnW00
23、 Ckn 当当 既定时,使估计量方差达到最小既定时,使估计量方差达到最小的的 和和 为:为:=若若V()V()事先已定,则使总费用事先已定,则使总费用 达到达到最小最小 的可由下式给出:的可由下式给出:=k2021120020)()(SCWCSWSCnCWCWCkkC00211)(YCnn22002)()1(SYNVSWkSN2.复制估算法复制估算法 这种方法是当无回答出现时,用其它已有的数据来顶这种方法是当无回答出现时,用其它已有的数据来顶替无回答的缺失数据,进而对总体作出估计。用来顶替替无回答的缺失数据,进而对总体作出估计。用来顶替的数据可以从同次调查的回答者数据中抽选,也可以从的数据可以
24、从同次调查的回答者数据中抽选,也可以从以前的同类调查数据中选取或推算而得。在实践中最常以前的同类调查数据中选取或推算而得。在实践中最常用的是从同次调查已取得的数据中随机抽取。用的是从同次调查已取得的数据中随机抽取。复制估算法的特点是,当顶替数据与无回答缺失数复制估算法的特点是,当顶替数据与无回答缺失数据充分接近时(这就要求与这两者数据相对应的单位来据充分接近时(这就要求与这两者数据相对应的单位来自于同一类别,具有相似的特征),能有效减少估计偏自于同一类别,具有相似的特征),能有效减少估计偏差,但却会增大估计量方差(均方误差)。因此,如果差,但却会增大估计量方差(均方误差)。因此,如果我们能对总
25、体进行分层且适当增大样本容量,那么复制我们能对总体进行分层且适当增大样本容量,那么复制估算法就能很好地解决无回答偏差问题,且保证有较高估算法就能很好地解决无回答偏差问题,且保证有较高的估计精度。这种方法尤其适用于的估计精度。这种方法尤其适用于“项目无回答项目无回答”。Hansen等人曾给出当顶替数据从回答数等人曾给出当顶替数据从回答数据中随机抽取时的复制估计量及其方差。总据中随机抽取时的复制估计量及其方差。总体均值估计量为(此处表达方式作了改变):体均值估计量为(此处表达方式作了改变):=其中其中 从从 个已知数据中随机抽取。当个已知数据中随机抽取。当 0.5 时,每个已知数据最多被抽取一次,
26、当时,每个已知数据最多被抽取一次,当 0.5 时则可能被抽取两次。时则可能被抽取两次。nnynynii1111yi1n1nn1nnHY 当当 0.5 时,该估计量的方差为:时,该估计量的方差为:V()=1+当当 0或或 0。iuyiiyiueiiyuieiieei 1、如果调查单位的计量误差是随机如果调查单位的计量误差是随机出现的,那么总正差与总负差大致相等,出现的,那么总正差与总负差大致相等,即即E()=E(),),也即也即E()=0。这时,计量误差的存在不会改变估计量这时,计量误差的存在不会改变估计量的偏差性,但会改变估计量方差的大小。的偏差性,但会改变估计量方差的大小。设设 为总体均值,
27、为总体均值,E()=,那么那么有:有:=+=+2()+E =E +E()+2E()yieiuuiuyiuuiuei)(2uyi)(2uuieiuiei2)(2uyi)(2uuiei2eiuiuuui 由于由于E()=0,E()=E =V(),),故故 MSE()=V()+V()+2E ()其中其中E ()为调查单位计量误为调查单位计量误差与真实离差之间的协方差。差与真实离差之间的协方差。eiei2)0(2eieiyiuieieiuiueiuiu 当样本容量为当样本容量为 时,无计量误差的时,无计量误差的总体均值估计量方差为:总体均值估计量方差为:()=有计量误差的估计量方差(均方误有计量误差的
28、估计量方差(均方误差)为:差)为:MSE()=(1 )即:即:MSE()=()+V()+2E ()nV真ynuiVf)()1(yfnyMSEi)(yV真ynf)1(eieiuiu 若若2E ()+V()0,那么那么MSE()V(),MSE()0,那么那么MSE()V(),MSE()(),即估计量方差被高估了。不论是高估即估计量方差被高估了。不论是高估还是低估,估计效果都不能得到真实的还是低估,估计效果都不能得到真实的反映。反映。eiuiueiyiuiyV真yuiueiyiuiyV真yei 2、如果调查单位的计量误差不是随机如果调查单位的计量误差不是随机出现、而是存在一定的系统性,那么就会出现、
29、而是存在一定的系统性,那么就会正差大于负差,这时计量误差就变成为估正差大于负差,这时计量误差就变成为估计量的计量偏差,计量的计量偏差,即即E()E()=,从而计量误差的存在既改变了估计量的偏从而计量误差的存在既改变了估计量的偏差性,也改变了估计量方差的大小。在这差性,也改变了估计量方差的大小。在这种情况下,我们可以得到:种情况下,我们可以得到:=E()+E()-uE =E +MSE()=V()+其中其中V()为有计量误差时的观测值为有计量误差时的观测值的估计量方差。的估计量方差。yiuiuyuyy)(2uy)(2yEy)(2uyEyy)(2uyEyy注意到注意到E()0,E()V(),可可得:
30、得:()=V()+E()+2E ()如果如果 E()+2E (),则则V()(),估估计量方差低估。如果相反,则估计量方差计量方差低估。如果相反,则估计量方差高估。非随机性的计量误差越严重,估计高估。非随机性的计量误差越严重,估计量方差低估或高估的程度就越强。量方差低估或高估的程度就越强。eiei2eiV真yy)(2uyEnf)1(ei2eiuiu)(2uyEnf)1(ei2eiuiuyV真y三、计量误差的控制三、计量误差的控制(一)精心设计;(一)精心设计;(二)对调查员要严格要求,精心挑选,加强培训;(二)对调查员要严格要求,精心挑选,加强培训;(三)在每次调查中,都要对被调查者作耐心的宣
31、传(三)在每次调查中,都要对被调查者作耐心的宣传说服工作;说服工作;(四)加强统计执法,规范统计调查活动;(四)加强统计执法,规范统计调查活动;(五)要合理确定调查时间、调查方式和调查周期;(五)要合理确定调查时间、调查方式和调查周期;(六)必要的检查和调整;(六)必要的检查和调整;(七)控制计量工具或技术设备原因的误差;(七)控制计量工具或技术设备原因的误差;(八)对最后的估计结果要进行必要的质量检查。(八)对最后的估计结果要进行必要的质量检查。必要的检查和调整:必要的检查和调整:对于一些重要的统计调查,要通过必要的方法对于一些重要的统计调查,要通过必要的方法和手段对调查数据进行检查,以发现
32、各种计量误和手段对调查数据进行检查,以发现各种计量误差(尤其是有意识的误差),并通过检查结果来差(尤其是有意识的误差),并通过检查结果来调整对总体的估计,提高估计的精度和可靠度。调整对总体的估计,提高估计的精度和可靠度。检查的方法一般是,从容量为检查的方法一般是,从容量为n的样本中抽取一个的样本中抽取一个容量为容量为 的子样本(的子样本(0 1),对其进行更细致),对其进行更细致、更认真的复查,取得尽量准确的数据。如果发、更认真的复查,取得尽量准确的数据。如果发现子样本的原调查数据存在计量误差,就要对由现子样本的原调查数据存在计量误差,就要对由原样本作出的估计进行调整,并根据双重抽样的原样本作
33、出的估计进行调整,并根据双重抽样的原理计算估计量方差。原理计算估计量方差。knk具体的调整方法有(以纯随机抽样为例):具体的调整方法有(以纯随机抽样为例):1.替换调整法。替换调整法。这种方法先以子样本的复查数据替换原调这种方法先以子样本的复查数据替换原调查数据,然后再计算出新的样本指标值(如查数据,然后再计算出新的样本指标值(如样本均值)来估计总体。这时,总体均值估样本均值)来估计总体。这时,总体均值估计量为:计量为:=其中其中 =当当 1 1时,估计量是有偏的。时,估计量是有偏的。YnZniZi个),其它(有个)有,子样本的复查数据(knnYknuiik 估计量的均方误差为:估计量的均方误
34、差为:MSE()=+(1 )其中其中 为观测值的总体方差(含计为观测值的总体方差(含计量误差),量误差),为真实的总体方差(不含为真实的总体方差(不含计量误差)。计量误差)。为估计量偏差(为估计量偏差()。)。YnSkSkux221)(k2BSx2Su2BYu2.比率估计调整法。比率估计调整法。这种方法以观测值为辅助标志,以这种方法以观测值为辅助标志,以子样本复查均值与原调查均值之比作为子样本复查均值与原调查均值之比作为调整比率。这时总体均值估计量为:调整比率。这时总体均值估计量为:=其中其中 =,=,=。Yyuyuknukniyknykniynyni估计量的均方误差为:估计量的均方误差为:M
35、SE()=+(2 +)其中其中 为总体真实均值与总体观测为总体真实均值与总体观测均值之比,均值之比,为真实值与观测值之间为真实值与观测值之间的相关系数。的相关系数。=,=。Ynf11Su2knf21Su2RxSSuSRx22Rf1Nnf2k3.回归估计调整法。回归估计调整法。这时的总体均值估计量为:这时的总体均值估计量为:=+()其中其中 =。估计量的均方误差为:估计量的均方误差为:MSE()=+(1 )当然,在实际调整时,以上的当然,在实际调整时,以上的 、和和 等都要由子样本的资料来等都要由子样本的资料来估计。估计。YubyybSSxuYnf11Su2knf21Su22SxSuRB编号为奇
36、数的习题答案编号为奇数的习题答案11.111.1判断题判断题(1 1)对;()对;(3 3)对;()对;(5 5)对;()对;(7 7)对;()对;(9 9)对;()对;(1111)错;)错;11.211.2试分析以下几种情况可能包含哪些非抽样误差试分析以下几种情况可能包含哪些非抽样误差 (1 1)抽样框误差;()抽样框误差;(3 3)抽样框误差;()抽样框误差;(5 5)计量误差)计量误差11.311.3选择题选择题 (1 1)b b;(;(3 3)d d;11.411.4(略);略);11.5 11.5(略);(略);11.6 11.6(略)(略)11.711.7(1 1)无回答偏差估计为:)无回答偏差估计为:(2 2)偏差率为:)偏差率为:(3 3)增加最初样本的容量,但如果无回答率和回答者与无回答)增加最初样本的容量,但如果无回答率和回答者与无回答者之间的赞成率没有变化,则无回答引起的偏差不会变化。者之间的赞成率没有变化,则无回答引起的偏差不会变化。;0625.0)45.07.0(25.0)(010 ppr。其中6375.045.025.07.075.0%;8.96375.0/0625.0/)(0010101prprppppr