1、第七章第七章 抽样调查抽样调查第七章第七章 抽样调查抽样调查第一节第一节 抽样调查概述抽样调查概述 一、抽样的概念和特点一、抽样的概念和特点抽样:抽样:特点:特点:二、抽样的作用二、抽样的作用三、抽样推断中常用的几个基本概念三、抽样推断中常用的几个基本概念(二)全极指标和样本指标全及指标:指反映总体数量特征的综合指标。(即参数)参数研究总体中的数量标志总体平均数总体方差X=X NX=XF F(X-X)N2=2(X-X)F F2=2研究总体中的品质标志成数平均数成数方差2=P(1-P)P=N1N8N12=P(1-P)=95%*5%=0.0475=0.22样本指标样本指标:根据样本数据计算的综合指
2、标。(即统计量)根据样本数据计算的综合指标。(即统计量)研究数量标志 样本平均数 样本标准差研究品质标志成数平均数 成数标准差 nxx fxfxppSp1nnp1ffxxS2nxxS2第二节第二节 抽样推断的基本原理抽样推断的基本原理一、抽样推断的方法论基础大数定理大数定理,21nxxxX2 uXxEi22ix11lim1uxnpniin中心极限定理中心极限定理二、抽样误差的基本要求二、抽样误差的基本要求 无偏性无偏性 一致性一致性 有效性有效性评价估计量优良性的三个标准:评价估计量优良性的三个标准:1、无偏性:、无偏性:样本统计量的期望值等于被估计样本统计量的期望值等于被估计的总体参数。的总
3、体参数。E如:如:XxE2、一致性:、一致性:当样本的单位数充分大时,样本当样本的单位数充分大时,样本统计量也充分靠近总体参数。统计量也充分靠近总体参数。Pn的一致估计量是则称若对任意小的正数1lim),0(1lim,0:XxPn根据大数定理如:如:3、有效性:、有效性:作为优良估计量,其方差应比其作为优良估计量,其方差应比其它无偏估计量的方差小。它无偏估计量的方差小。更有效但两个都无偏都可以估计或在总体中任取一单位用样本平均数xXnXxXXEXxEXXx)()()()(,)(222如:如:1212)()(2212Xx Pp 抽样平均误差抽样实际误差抽样误差偶然的代表性误差随机误差偏差系统性误
4、差代表性误差调查误差抽样误差样本可能数目XExx2求抽样平均误差就是求所有可能样本平均数的标准差。用计算器求2、2.5、3、2.5、3、3.5、3、3.5、4的标准差得577.0 x即为抽样平均误差nx为总体标准差,n为样本单位数,在总体标准差未知,且样本单位数较大时,可以用样本标准差代替。13.9381.15nx81.152NXX求抽样平均误差Nnnx12为总体标准差,n为样本单位数,N为总体单位数。27.514343181.1522NnNnx81.152NXX求抽样平均误差练习:1 1、随机重复抽选某校学生、随机重复抽选某校学生100100人,调查他们的体人,调查他们的体重得到平均体重为重
5、得到平均体重为5858公斤,标准差为公斤,标准差为1010公斤。问公斤。问抽样推断的平均误差是多少?抽样推断的平均误差是多少?解解:)(110010公公斤斤 nsx 即当根据样本学生的平均体重估计全部学生的平均即当根据样本学生的平均体重估计全部学生的平均体重时体重时,抽样平均误差为抽样平均误差为1 1公斤。公斤。已知:已知:1058100 sxn则:则:练习:1 1、随机重复抽选某校学生、随机重复抽选某校学生100100人,调查他们的体重得到平人,调查他们的体重得到平均体重为均体重为5858公斤,标准差为公斤,标准差为1010公斤。问抽样推断的平均误公斤。问抽样推断的平均误差是多少?差是多少?
6、2 2、某厂生产一种新型灯泡共、某厂生产一种新型灯泡共2000020000只,随机抽出只,随机抽出400400只作耐用时间试验,测试结果平均使用寿命只作耐用时间试验,测试结果平均使用寿命为为48004800小时,样本标准差为小时,样本标准差为300300小时,求抽样推小时,求抽样推断的平均误差?断的平均误差?解解:)(15400300小小时时 nsx)(85.142000040014003002小小时时 已知:已知:300480040020000 sxnN则:则:)1(2Nnnsx 2 2、某厂生产一种新型灯泡共、某厂生产一种新型灯泡共2000020000只,随机抽出只,随机抽出400400只
7、只作耐用时间试验,测试结果平均使用寿命为作耐用时间试验,测试结果平均使用寿命为48004800小时,小时,样本标准差为样本标准差为300300小时,求抽样推断的平均误差小时,求抽样推断的平均误差?PPP1样本标准差样本标准差1ppps3 3、某校随机抽选、某校随机抽选400400名学生,发现戴眼镜的学生有名学生,发现戴眼镜的学生有8080人。根据样本资料推断全部学生中戴眼镜的学生人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样平均误差为多大?所占比重时,抽样平均误差为多大?解解:已知:已知:400 n801 n则:样本成数则:样本成数%20400801 nnp 02.04008.02
8、.01 nppp 3 3、某校随机抽选、某校随机抽选400400名学生,发现戴眼镜的学生有名学生,发现戴眼镜的学生有8080人。根据样本资料推断全部学生中戴眼镜的学生人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样平均误差为多大?所占比重时,抽样平均误差为多大?求样本平均数和样本成数各自的平均误差。63.532nsxx1057fxfx%5.91200183p小时79.320063.53nx在不重复抽样下抽样平均误差:小时75.311000020010000200163.5322NnNnx在重复抽样下抽样平均误差:%97.1200085.0915.01nppp在不重复抽样下抽样平均误差
9、:%95.111000020010000200085.0915.011NnNnppx在重复抽样下抽样平均误差:练习:练习:某冷库厂从一批冻鸡中抽取样本,测得平均每只某冷库厂从一批冻鸡中抽取样本,测得平均每只重重12001200克,标准差克,标准差7070克,如果重复随机抽取克,如果重复随机抽取100100只和只和200200只,分别计算只,分别计算抽样平均误差。抽样平均误差。本次抽样测得本次抽样测得冻鸡合格率为冻鸡合格率为97%97%,如果重复随机,如果重复随机抽取抽取100100只和只和200200只,分别计算只,分别计算抽样平均误差。抽样平均误差。练习:练习:某冷库厂从一批冻鸡中抽取样本,
10、测得平均每只某冷库厂从一批冻鸡中抽取样本,测得平均每只重重12001200克,标准差克,标准差7070克,如果重复随机抽取克,如果重复随机抽取100100只和只和200200只,分别计算只,分别计算抽样平均误差。抽样平均误差。本次抽样测得本次抽样测得冻鸡合格率为冻鸡合格率为97%97%,如果重复随机,如果重复随机抽取抽取100100只和只和200200只,分别计算只,分别计算抽样平均误差。抽样平均误差。)(710070克克 nsx)95420070(克克 x%71100%)971%(971(nPPp)%21200%)971%(97 p 401.抽样平均数的极限误差:xXxxXXxx41Pppp
11、PPpp42ppppPxxXxxxXxxX同理:43xtxptp 一般地,一般地,在抽样平均误差在抽样平均误差 为一定的条件下,当概率为一定的条件下,当概率度度t t的值越大,则抽样误差范围的值越大,则抽样误差范围越大,估计越大,估计总体平均数或成数包含在相应的区间范围内的总体平均数或成数包含在相应的区间范围内的概率越大,从而抽样估计的可靠程度也就越高概率越大,从而抽样估计的可靠程度也就越高。反之亦然。反之亦然。如果把可靠程度即概率用如果把可靠程度即概率用p p表示,概率度表示,概率度t t的的大小决定大小决定p p的大小,即的大小,即p p是是t t的函数:的函数:)(tFp 为了方便计算,
12、在实际工作中,按不同的为了方便计算,在实际工作中,按不同的t t值和值和相应的概率相应的概率 编成正态分布概率表供查用。编成正态分布概率表供查用。常用的有:常用的有:)(tF置信度置信度F(t):):指总体指标落在某个区间指总体指标落在某个区间 的概率保证程度。的概率保证程度。概率度和置信度的函数关系概率度和置信度的函数关系)(tF置信区间:以一定的概率保证程度确定总体指标置信区间:以一定的概率保证程度确定总体指标 所在的区间。所在的区间。(分为置信下限和置信上限)(分为置信下限和置信上限)xxxXxtt|置信区间为:置信区间为:ppp pPxxXxxxXxxX同同理理:48ntntxtXxx
13、249nPPtptPpp)1(50519545.0)2(20500X20500p210500480t102550nsxxx)(解:F 某灯泡厂某月生产5000000个灯泡,在进行质量检查中,随机抽取500个进行检验,这500个灯泡的耐用时间见下表:试求:该厂全部灯泡平均耐用时间的取值范围(概率保证试求:该厂全部灯泡平均耐用时间的取值范围(概率保证程度程度0.99730.9973)检查检查500500个灯泡中不合格产品占个灯泡中不合格产品占0.4%0.4%,试在,试在0.68270.6827概率保证概率保证下,估计全部产品中不合格率的取值范围。下,估计全部产品中不合格率的取值范围。求解如下:计算
14、抽样平均误差由概率保证程度0.9973,查表得概率度t=3计算抽样极限误差 估计总体指标区间4.747.23xxt8.9334.74.9269194.74.926xxxx2.55,4.926fxfx47.25002.55nx p=0.4%28.01pp%68.0%28.0%4.0%12.0%28.0%4.0pppp%28.0500996.0004.01nppp概率保证程度为概率保证程度为0.68270.6827时,时,t=1t=1第四节第四节 抽样形式抽样形式对总体的要求:对总体的要求:方法:方法:特点:特点:适用的条件:适用的条件:优点:优点:优点:优点:适用条件:适用条件:第五节第五节 抽
15、样单位数目的确定抽样单位数目的确定 必要的样本单位数必要的样本单位数:必要样本单位数的确定:必要样本单位数的确定:1、估计总体平均数时:、估计总体平均数时:222tttnn)1(22Nnntt2222222222tNNtnNtnt2、估计总体成数时:、估计总体成数时:22)1(PPtn)1()1(222PPtNNPPtn注意:注意:)(62512015002)(57620024002222222222222212121户户znzn1 1、一某市常住居民为、一某市常住居民为7070万人,现采用简单随机万人,现采用简单随机方法抽样,对该市常住居民人均年食糖需要量进方法抽样,对该市常住居民人均年食糖
16、需要量进行调查,共抽取行调查,共抽取14001400人进行调查,得知人均年食人进行调查,得知人均年食糖需糖需5.6kg5.6kg,样本方差为,样本方差为40.4640.46。如果允许误差为。如果允许误差为0.34kg0.34kg,请问该市常住居民年食糖需要量的置信,请问该市常住居民年食糖需要量的置信区间和置信概率。区间和置信概率。2 2、某小区有居民家庭、某小区有居民家庭2400024000户,一家汽车销售公户,一家汽车销售公司采用简单随机的方法抽样,对该小区居民的私司采用简单随机的方法抽样,对该小区居民的私家车拥有量进行调查。抽取了家车拥有量进行调查。抽取了12001200户,发现每百户,发
17、现每百户拥有私家车户拥有私家车8 8辆。如果要求把握程度为辆。如果要求把握程度为95%95%,请,请问该小区居民拥有私家车的置信区间是什么?问该小区居民拥有私家车的置信区间是什么?3 3、工商部门对某超市经销的小包装休闲食品经销工商部门对某超市经销的小包装休闲食品经销重量合格抽查,规定每包重量不低于重量合格抽查,规定每包重量不低于3030克,在克,在10001000包食品中抽包食品中抽1%1%进行检验,结果如下:进行检验,结果如下:试以试以95.45%的概率推算的概率推算(1)这批食品的平均每包重量是)这批食品的平均每包重量是否符合规定要求否符合规定要求(2)若每包食品重量低于)若每包食品重量
18、低于30克克为不合格,求合格率的范围为不合格,求合格率的范围4、某高校有、某高校有5000名学生,随机抽取名学生,随机抽取250名学生进行调名学生进行调查。下面是被调查学生收看电视时间调查资料,按不重查。下面是被调查学生收看电视时间调查资料,按不重复抽样方法,以复抽样方法,以95.45%的概率推断该校全部学生每周的概率推断该校全部学生每周平均看电视时间的可能范围。平均看电视时间的可能范围。2)例题)例题5、某类产品根据以往资料的估计,总体方差、某类产品根据以往资料的估计,总体方差5.456千千克,现对一批进行简单随机抽样以推断该批产品的克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求
19、可靠程度达到平均重量,要求可靠程度达到99.73%,误差范围,误差范围不超过不超过0.9千克,需要抽多少样本单位?千克,需要抽多少样本单位?2)例题)例题6、某类产品根据以往资料的估计,总体方差、某类产品根据以往资料的估计,总体方差5.456千千克,现对一批进行简单随机抽样以推断该批产品的克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到平均重量,要求可靠程度达到99.73%,误差范围,误差范围不超过不超过0.9千克,需要抽多少样本单位?千克,需要抽多少样本单位?45652 x90 x61)90(4565322 n解:按题意解:按题意 由由F(t)=99.73 查表可得查表
20、可得 t3因此:因此:(2)根据以往资料的估计,该类产品的一等品率为)根据以往资料的估计,该类产品的一等品率为 90%,可靠程度仍为,可靠程度仍为99.73%,误差范围不超过,误差范围不超过5%,推断该批产品的一等品率,需要抽多少样本,推断该批产品的一等品率,需要抽多少样本单位?单位?(2)根据以往资料的估计,该类产品的一等品率为)根据以往资料的估计,该类产品的一等品率为 90%,可靠程度仍为,可靠程度仍为99.73%,误差范围不超过,误差范围不超过5%,推断该批产品的一等品率,需要抽多少样本,推断该批产品的一等品率,需要抽多少样本单位?单位?解:按题意解:按题意 因此,因此,%90 P%5
21、p324)050(1090322 n1、某种产品重量的均值为、某种产品重量的均值为6克,标准差为克,标准差为2.5克,克,从这种产品中随机抽取容量为从这种产品中随机抽取容量为15的样本,则下的样本,则下列关于样本均值的抽样分布的描述正确的是列关于样本均值的抽样分布的描述正确的是()A.抽样分布的均值为抽样分布的均值为6克克B.抽样分布的标准差为抽样分布的标准差为2.5克克C.抽样分布是正态分布抽样分布是正态分布D.以上叙述都正确以上叙述都正确课堂练习题:1、某地区的电视台委托调查公司估计地区内居、某地区的电视台委托调查公司估计地区内居民平均每日的看电视时间。调查公司随机抽民平均每日的看电视时间。调查公司随机抽取了取了100名居民进行调查,样本数据显示平名居民进行调查,样本数据显示平均每人每天看电视时间是均每人每天看电视时间是4个小时,样本标个小时,样本标准差是准差是1.5小时。试求:小时。试求:(1)该地区内居民每天看电视的平均时间的置信该地区内居民每天看电视的平均时间的置信区间区间(置信度是置信度是95%);(2)如果要求估计的误差不超过如果要求估计的误差不超过27分钟,这时置分钟,这时置信度是多少?信度是多少?练习题: