1、统统 计计 学学 概概 论论中南大学 统统 计计 学学 概概 论论 内内 容容第一章第一章 统计总论统计总论第二章第二章 统计调查统计调查第三章第三章 统计数据的整理与显示统计数据的整理与显示第四章第四章 统计指标统计指标第五章第五章 指数的因素分析指数的因素分析第六章第六章 时间序列分析时间序列分析第七章第七章 抽样推断抽样推断第八章第八章 相关与回归分析相关与回归分析第九章第九章 统计预测统计预测第十章第十章 统计的综合评价统计的综合评价第十一章第十一章 统计分析报告统计分析报告统统 计计 学学 概概 论论中南大学第一节第一节 抽样推断概述抽样推断概述第三节第三节 参数估计参数估计第二节第
2、二节 随机抽样的概率分布随机抽样的概率分布第四节第四节 抽样设计抽样设计第七章第七章 抽样推断抽样推断统统 计计 学学 概概 论论中南大学第一节第一节 抽样推断概述抽样推断概述 统统 计计 学学 概概 论论中南大学统计推断统计推断参数参数(未知量)(未知量)统计量统计量(已知量)(已知量)抽样推断抽样推断统统 计计 学学 概概 论论中南大学随机原则的实现随机原则的实现统统 计计 学学 概概 论论中南大学统统 计计 学学 概概 论论中南大学 与与全面调查全面调查相比,相比,抽样调查抽样调查既节省了人力、物力、既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。财力和时间,又达到了认识
3、总体数量特征的目的。我国在我国在19941994年确立了以周期性普查为基础,以经常年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以性抽样调整为主体,同时辅之以重点调查、科学核重点调查、科学核算等综合运用的统计调查方法体系。算等综合运用的统计调查方法体系。统统 计计 学学 概概 论论中南大学统统 计计 学学 概概 论论中南大学表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性质。大数定律论证了如果独立随机的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则变量总体存在有限的平均数和方差,则对于充分大的样本可以近乎对于充分大的样本可以近乎100%
4、100%的概率,的概率,期望样本平均数与总体平均数的绝对离期望样本平均数与总体平均数的绝对离差为任意小。差为任意小。1)(limXxPn如果变量总体存在有限的平均数和方如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的随着样本容量的增加,样本平均数的分布,便趋近于分布,便趋近于正态分布正态分布。统统 计计 学学 概概 论论中南大学表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性质。大数定律论证了如果独立随机的性质。大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则变量总体存在有限的平
5、均数和方差,则对于充分大的样本可以近乎对于充分大的样本可以近乎100%100%的概率,的概率,期望样本平均数与总体平均数的绝对离期望样本平均数与总体平均数的绝对离差为任意小。差为任意小。1)(limXxPn如果变量总体存在有限的平均数和方如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的随着样本容量的增加,样本平均数的分布,便趋近于分布,便趋近于正态分布正态分布。统统 计计 学学 概概 论论中南大学又称总体或母体,是所要认识研又称总体或母体,是所要认识研究对象的全体,它由具有某种共究对象的全体,它由具有某种共同性质或
6、特征的单位所组成。常同性质或特征的单位所组成。常用用N N表示全及总体的单位数目。表示全及总体的单位数目。又称样本或子样,是指从全及又称样本或子样,是指从全及总体中按照随机原则抽取的那总体中按照随机原则抽取的那部分个体的组合。抽样总体的部分个体的组合。抽样总体的单位数称为单位数称为样本容量样本容量,通常用,通常用n n表示。表示。1 1n nN N 。统统 计计 学学 概概 论论中南大学例如例如:在:在100100万户居民中,随机抽取万户居民中,随机抽取10001000户户居民进行家庭收支情况调查,其中的居民进行家庭收支情况调查,其中的100100万万户居户居 民就是全及总体,而被抽中的民就是
7、全及总体,而被抽中的10001000户户居民则构成抽样总体。居民则构成抽样总体。n30n30称为大样本称为大样本,n n 3030称为小样本称为小样本.n/Nn/N称称为抽样比为抽样比.统统 计计 学学 概概 论论中南大学NNXXX,210N1N统统 计计 学学 概概 论论中南大学miimiiiNiiffXXNXX111或miiimiiNiifXXfXXN1211211或统统 计计 学学 概概 论论中南大学miiimiiNiifXXfXXN121212211或PNNQNNP1,01统统 计计 学学 概概 论论中南大学PQPPP1PQPPP12有最大值时,当PQP5.0统统 计计 学学 概概 论
8、论中南大学nnxxx,210n1n统统 计计 学学 概概 论论中南大学miimiiiniiffxxnxx111或统统 计计 学学 概概 论论中南大学miiimiiniifxxfsxxns121121111或miiimiiniifxxfsxxns12121221111或为自由度为自由度为 的无偏估计2为 的无偏估计统统 计计 学学 概概 论论中南大学pnnqnnp1,01pqnnppnnsp111pqnnppnnsp1112为为 的的无偏估计无偏估计2P为为 的的无偏估计无偏估计P统统 计计 学学 概概 论论中南大学重复抽样重复抽样从总体从总体N N个单位中随机抽取一个个单位中随机抽取一个样本容
9、量为样本容量为n n的样本,每次从总的样本,每次从总体中抽取一个,并把结果登记体中抽取一个,并把结果登记下来,又放回总体中重新参加下来,又放回总体中重新参加下一次的抽选。又称下一次的抽选。又称放回抽样放回抽样总体单位数总体单位数N N不变,同一单位可能多次被抽中。不变,同一单位可能多次被抽中。根据取样方式不同,可分为:根据取样方式不同,可分为:统统 计计 学学 概概 论论中南大学不重复抽样不重复抽样每次从总体中抽选一个单位每次从总体中抽选一个单位后就不再将其放回参加下一后就不再将其放回参加下一次的抽选。又称次的抽选。又称不放回抽不放回抽样样.总体单位数减少总体单位数减少n n,同一单位只可能被
10、抽中一次。,同一单位只可能被抽中一次。统统 计计 学学 概概 论论中南大学根据对样本的要求不同,可分为:根据对样本的要求不同,可分为:考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。考虑各单位的中选顺序。ABCCBAABCCBA不考虑各单位的中选顺序。不考虑各单位的中选顺序。ABCABCCBACBA考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样综合起来共有四综合起来共有四种抽样方法种抽样方法统统 计计 学学 概概 论论中南大学考虑顺序的不重复抽样考虑顺序的
11、不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样)!/(!nNNpnNnNnnNC1把填湖南风采把填湖南风采3535选选7 7福利彩票号码看作一次抽福利彩票号码看作一次抽样,则它属于哪一种抽样?中特等奖的概率是样,则它属于哪一种抽样?中特等奖的概率是多少?(多少?(0909选选6 6呢?)呢?)不考虑顺序的不重复抽样不考虑顺序的不重复抽样nNC8347680/1/1736C统统 计计 学学 概概 论论中南大学把某一抽样方法的全部可能的样本指标与其相应的概把某一抽样方法的全部可能的样本指标与其相应的概率排列起来,就
12、得到样本的概率分布。率排列起来,就得到样本的概率分布。若将样本指标的取值分别记为若将样本指标的取值分别记为 其相应的概率记为其相应的概率记为P P1 1,P P2 2,PPn n,将它们按顺序排列,将它们按顺序排列起来,可得如下概率分布表。起来,可得如下概率分布表。,.,21nxxx x1x2xnxnP)(xPnP1P2P统统 计计 学学 概概 论论中南大学第二节第二节 随机抽样的概率分布随机抽样的概率分布 样本统计样本统计量量总体未知总体未知参数参数样本统计样本统计量量样本统计样本统计量量样本统计样本统计量量样本统计样本统计量量样本统计样本统计量量样本统计样本统计量量样本统计样本统计量量样本
13、统计样本统计量量样本统计样本统计量量样本统计样本统计量量样本统计样本统计量量样本统计样本统计量量主要样本主要样本统计量统计量xp2S分布的形状及接分布的形状及接近总体参数的程近总体参数的程度度统统 计计 学学 概概 论论中南大学学生学生成绩成绩 30 40 50 60 70 80 90按随机原则抽选出名学按随机原则抽选出名学生,并计算平均分数。生,并计算平均分数。平均数的抽样分布平均数的抽样分布样本样本均值均值样本样本 均值均值样本样本均值均值ABCDABCDABCEABCEABCFABCFABCGABCGABDEABDEABDFABDFABDGABDGABEFABEFABEGABEGABFG
14、ABFGACDEACDEACDFACDF454547.547.5505052.552.5505052.552.55555555557.557.5606052.552.55555ACDGACDGACEFACEFACEGACEGACFGACFGADEFADEFADEGADEGADFGADFGAEFGAEFGBCDEBCDEBCDFBCDFBCDGBCDGBCEFBCEF57.557.557.557.5606062.562.5606062.562.5656567.567.5555557.557.560606060BCEGBCEGBCFGBCFGBDEFBDEFBDEGBDEGBDFGBDFGBEFG
15、BEFGCDEFCDEFCDEGCDEGCDFGCDFGCEFGCEFGDEFGDEFG62.562.5656562.562.5656567.567.57070656567.567.5707072.572.57575样本均值样本均值 45 47.5 50 52.5 55 57.5 60出现次数出现次数 1 1 2 3 4 4 5样本均值样本均值 62.5 65 67.5 70 72.5 75出现次数出现次数 4 4 3 2 1 1二者均值相等二者均值相等统统 计计 学学 概概 论论中南大学样本均值样本均值 45 47.5 50 52.5 55 57.5 60出现次数出现次数 1 1 2 3 4
16、 4 5离差离差 -15 -12.5 -10 -7.5 -5 -2.5 0样本均值样本均值 62.5 65 67.5 70 72.5 75出现次数出现次数 4 4 3 2 1 1离差离差 2.5 5 7.5 10 12.5 15学生学生成绩成绩 30 40 50 60 70 80 90离差离差 -30 -20 -10 0 10 20 302007.7100214201747122nNnNx07.7x统统 计计 学学 概概 论论中南大学平均数的抽样分平均数的抽样分布布n1)()(XxXxE),(2nXNx统统 计计 学学 概概 论论中南大学比率的抽样分比率的抽样分布布5)1(,5)1,(pnnp
17、nPPPNp)()(PpPpEn1统统 计计 学学 概概 论论中南大学比率的抽样分布比率的抽样分布教师是否博士教师是否博士 是是 是是 否否 否否 否否 是是 具有博士学位的比率:具有博士学位的比率:0.50.5比率的标准差:比率的标准差:0.50.5从总体中按重复抽样方法随机抽取人,计从总体中按重复抽样方法随机抽取人,计算其比率和标准差算其比率和标准差p统统 计计 学学 概概 论论中南大学比率的抽样分比率的抽样分布布样本样本比率比率离差离差样本样本比率比率离差离差ABCDABCDABCEABCEABCFABCFABDEABDEABDFABDFABEFABEFACDEACDEACDFACDF0
18、.50.50.50.50.750.750.50.50.750.750.750.750.250.250.50.50 00 00.250.250 00.250.250.250.25-0.25-0.250 0ACEFACEFADEFADEFBCDEBCDEBCDFBCDFBCEFBCEFBDEFBDEFCDEFCDEF0.50.50.50.50.250.250.50.50.50.50.50.50.250.250 00 0-0.25-0.250 00 00 0-0.25-0.25Pnpp5.0p5245.05.01)1(1581.015375.0)(2NnNnPPffppp统统 计计 学学 概概 论论
19、中南大学全部可能样本比率的均值等于总体比率,即:全部可能样本比率的均值等于总体比率,即:从非正态总体中抽取的样本比率当从非正态总体中抽取的样本比率当n n足够大时其足够大时其分布接近正态分布。从正态总体中抽取的样本比分布接近正态分布。从正态总体中抽取的样本比率不论容量大小其分布均为正态分布。样本比率率不论容量大小其分布均为正态分布。样本比率的标准差为总体标准差的的标准差为总体标准差的 。n1)()(PpPpE比率的抽样分布比率的抽样分布5)1(5)1(,(pnnpnPPPNp学生学生成绩成绩 60 70 80 90均值均值 75方差方差 125从中按重复抽样方式抽取人,从中按重复抽样方式抽取人
20、,计算样本的均值及方差计算样本的均值及方差S。x方差的抽样分布方差的抽样分布A60B70C80D90A6060 60600060 7065255060 807010020060 9075225450B7070 6065255070 70700070 8075255070 9080100200C8080 607010020080 7075255080 80800080 90852550D9090 607522545090 708010020090 8085255090 909000nxxnxxSn22)(1)(221nxxSn5.62)(22mSSEnn125)(2121mSSEnn1252统统
21、 计计 学学 概概 论论中南大学21nS2nS统统 计计 学学 概概 论论中南大学X510样本抽样分布样本抽样分布原总体分布原总体分布xX统统 计计 学学 概概 论论中南大学抽样误差抽样误差167CM 169CM 172CM 160CM 162CM 167CM 175CM 180CM 165CM 167CM170CM 175CM 178CM 180CM 162CM 173CM 155CM 160CM 170CM 165CM平均身高平均身高=169.8CM=169.8CM平均身高平均身高=174.6CM=174.6CM总平均身高总平均身高=168.6CM=168.6CM统统 计计 学学 概概 论
22、论中南大学第三节第三节 参数估计参数估计 也叫抽样估计,就是根据也叫抽样估计,就是根据样本指标样本指标数数值对值对总体指标总体指标数值作出估计或推断。数值作出估计或推断。参数估计参数估计通常,把用来估计总体特征的样本指标叫通常,把用来估计总体特征的样本指标叫估计量或统估计量或统计量计量,待估计的总体指标叫,待估计的总体指标叫总体参数总体参数。特点特点1 1、它在逻辑上运用归纳推理而不是、它在逻辑上运用归纳推理而不是演绎推理演绎推理。2 2、在方法上运用不确定的概率估计方法,、在方法上运用不确定的概率估计方法,而不是运用确定的数学分析方法。而不是运用确定的数学分析方法。3 3、抽样估计存在、抽样
23、估计存在抽样误差抽样误差。统统 计计 学学 概概 论论中南大学点估计点估计从总体中抽取一个随机样本,计算与从总体中抽取一个随机样本,计算与总体参数相应的样本统计总体参数相应的样本统计量,然后把量,然后把该统计量视为总体参数的估计值,称该统计量视为总体参数的估计值,称为参数的点估计。为参数的点估计。pPsxX,统统 计计 学学 概概 论论中南大学 的抽样分布的抽样分布x点估计的最大好处:给出确定的值点估计的最大点估计的最大好处:给出确定的值点估计的最大问题问题;无法控制误差无法控制误差.统统 计计 学学 概概 论论中南大学问题:问题:第一,我们为什么以这一个而不是那一个统计第一,我们为什么以这一
24、个而不是那一个统计量来估计某个总体参数?量来估计某个总体参数?估计值的优良标准估计值的优良标准第二,如果有两个以上的统计量可以用来估计第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计结果是否一致?是否一个统某个总体参数,其估计结果是否一致?是否一个统计量要优于另一个?计量要优于另一个?oemmx估计值的优良标准:估计值的优良标准:无偏性、有效性、一致性无偏性、有效性、一致性统统 计计 学学 概概 论论中南大学抽样估计量的优良标抽样估计量的优良标准准若,则称若,则称 为为 的无偏估计量的无偏估计量)(E统统 计计 学学 概概 论论中南大学若若 ,则称,则称 为比为比 更有效的估计量更
25、有效的估计量2121若若 越大越大 越小,则称越小,则称 为为 的一致估计量的一致估计量nn抽样估计量的优良标抽样估计量的优良标准准1)(limPn统统 计计 学学 概概 论论中南大学学生学生 成绩成绩 30 40 50 60 70 80 9030 40 50 60 70 80 90有效性有效性按随机原则抽选出名学生,并计算平均按随机原则抽选出名学生,并计算平均分数和中位分数。分数和中位分数。样本均值样本均值 45 47.5 50 52.5 55 57.5 6045 47.5 50 52.5 55 57.5 60出现次数出现次数 1 1 2 3 4 4 51 1 2 3 4 4 5样本均值样本
26、均值 62.5 65 67.5 70 72.5 7562.5 65 67.5 70 72.5 75出现次数出现次数 4 4 3 2 1 14 4 3 2 1 1样本中位数样本中位数 45 50 55 60 65 70 7545 50 55 60 65 70 75出现次数出现次数 4 3 8 5 8 3 44 3 8 5 8 3 4统统 计计 学学 概概 论论中南大学有效性有效性中位数的抽中位数的抽样分布样分布平均数的抽平均数的抽样分布样分布emxemExE)()(统统 计计 学学 概概 论论中南大学无偏性无偏性1252125)(21nSE5.62)(2nSE有有偏偏无无偏偏统统 计计 学学 概
27、概 论论中南大学学生学生成绩成绩 30 40 50 60 70 80 90按随机原则抽选出按随机原则抽选出5名学名学生,并计算平均分数。生,并计算平均分数。样本样本均值均值 样本样本均值均值ABCDEABCDFABCDGABCEFABCEGABCFGABDEFABDEGABDFGABEFGACDEF5052545456585658606258ACDEGACDFGACEFGADEFGBCDEFBCDEGBCDFGBCEFGBDEFGCDEFG60626466606264666870样本均值样本均值 50 52 54 56 58 60出现次数出现次数 1 1 2 2 3 3样本均值样本均值 62
28、64 66 68 70 出现次数出现次数 3 2 2 1 1n=4时时 的的抽样分布抽样分布xn=5时时 的的抽样分布抽样分布x统统 计计 学学 概概 论论中南大学q 为为 的无偏、有效、一致估计量;的无偏、有效、一致估计量;q 为为 的无偏、有效、一致估计量;的无偏、有效、一致估计量;q 为为 的无偏、有效、一致估计量。的无偏、有效、一致估计量。xX1nSpP抽样估计量的优良标抽样估计量的优良标准准统统 计计 学学 概概 论论中南大学区间估计区间估计给出一个区间给出一个区间(置信区间置信区间)并推断真正的参并推断真正的参数以一定的概率存在于这个区间的方法。数以一定的概率存在于这个区间的方法。
29、指每一个可能样本的指标值与总体指每一个可能样本的指标值与总体指标值之间平均离差,即一系列样指标值之间平均离差,即一系列样本指标的标准差本指标的标准差MiixXxM121xiXixM1)(2nxxS注意:不要混淆抽样注意:不要混淆抽样标准差与样本标准差!标准差与样本标准差!统统 计计 学学 概概 论论中南大学抽样平均误差的计抽样平均误差的计算算nnx2NnnNnNnx1122当N500时,有NnNnNNnN11统统 计计 学学 概概 论论中南大学nPPp1NnnPPNnNnPPp1111当N500时,有NnNnNNnN11抽样平均误差的计算公抽样平均误差的计算公式式统统 计计 学学 概概 论论中
30、南大学关于总体方差的估计方法关于总体方差的估计方法spsP1122ffxxnxx或ppnn11抽样平均误差的计算公抽样平均误差的计算公式式统统 计计 学学 概概 论论中南大学影响抽样误差的因素影响抽样误差的因素n统统 计计 学学 概概 论论中南大学抽样极限误差抽样极限误差pxPpXx或ppxxPpPXxX或即上式表明上式表明:样本平均数(成数)是以总体平均数样本平均数(成数)是以总体平均数(成数)为中心,在相应的区间内变动。(成数)为中心,在相应的区间内变动。统统 计计 学学 概概 论论中南大学由于总体成数和总体平均数是未知的,它要求靠实测的抽样由于总体成数和总体平均数是未知的,它要求靠实测的
31、抽样平均数和抽样成数来估计,因而抽样误差的实际意义是希望平均数和抽样成数来估计,因而抽样误差的实际意义是希望总体平均数(成数)落在某个已知的范围内。总体平均数(成数)落在某个已知的范围内。抽样极限误差抽样极限误差所以前面的不等式应变换为所以前面的不等式应变换为:ppxxpPpxXx或即在一个特定的全及总体中,当抽样方法和样本容量固定时,在一个特定的全及总体中,当抽样方法和样本容量固定时,抽样平均误差是一个定值,因此,抽样极限误差通常以抽样抽样平均误差是一个定值,因此,抽样极限误差通常以抽样平均误差为标准单位来衡量。即抽样极限误差通常表示为抽平均误差为标准单位来衡量。即抽样极限误差通常表示为抽样
32、平均误差的样平均误差的多少倍多少倍。ttppxx/或即由于由于t t值与样本估计值落入允许值与样本估计值落入允许误差范围内的概率有关,因此,误差范围内的概率有关,因此,tt 也称为也称为概率度概率度。统统 计计 学学 概概 论论中南大学抽样估计的置信度抽样估计的置信度抽样指标和总体指标的误差不超过一定抽样指标和总体指标的误差不超过一定范围的概率大小,我们将它称之为概率范围的概率大小,我们将它称之为概率保证程度,也叫抽样估计的置信度,一保证程度,也叫抽样估计的置信度,一般用般用F(t)F(t)表示。即:表示。即:置信度置信度)()(tFXxPx1在在大样本大样本下下统统 计计 学学 概概 论论中
33、南大学68.27%95.45%99.73%抽样极限误差抽样极限误差),(2nXNxXxx2x3x2xx3x统统 计计 学学 概概 论论中南大学以以样本统计量样本统计量为中心,以为中心,以抽样平均抽样平均误差误差为距离单位,可以构造一个区间,为距离单位,可以构造一个区间,并可以一定的概率保证待估计的总体参并可以一定的概率保证待估计的总体参数落在这个区间之中。数落在这个区间之中。区间越大,则概区间越大,则概率保证程度越高率保证程度越高。区间估计原理区间估计原理区间估计原理区间估计原理0.6827xxXX样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线区间估计原理区间估计原理0.9545
34、xx2XX样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线区间估计原理区间估计原理 0.9973落在落在范围内的概率范围内的概率为为99.73%Xxx3X统统 计计 学学 概概 论论中南大学总体平均数的区间估计总体平均数的区间估计xxxxxxXxXx,或,表表达达式式其中,其中,为极限误差为极限误差xxZ统统 计计 学学 概概 论论中南大学步骤步骤x1,12222ffxxsnxxs22s总体平均数的区间估计总体平均数的区间估计统统 计计 学学 概概 论论中南大学nsnx或NnnsNnnx1122或总体平均数的区间估计总体平均数的区间估计统统 计计 学学 概概 论论中南大学xxZxx
35、xxxxXxXx,或,总体平均数的区间估计总体平均数的区间估计统统 计计 学学 概概 论论中南大学总体平均数的区间估计总体平均数的区间估计统统 计计 学学 概概 论论中南大学按按 日产量分组(件)日产量分组(件)组中值(件)组中值(件)工人数工人数(人)(人)1101101141141141141181181181181221221221221261261261261301301301301341341341341381381381381421421121121161161201201241241281281321321361361401403 37 718182323212118186 64
36、 43363368128122160216028522852268826882376237681681656056058858870070064864892928484648648600600784784合计合计100100126001260041444144xfxffxx2统统 计计 学学 概概 论论中南大学件件47.69941441126100126002ffxxsfxfx件614.01000100110047.6122Nnnsx统统 计计 学学 概概 论论中南大学件203.1614.096.1xxZXXN203.11261000203.11261000,203.1126203.1126X
37、NX统统 计计 学学 概概 论论中南大学总体成数的区间估计总体成数的区间估计ppppppPpPp,或,表表达达式式其中,其中,为极限误差为极限误差ppZ统统 计计 学学 概概 论论中南大学nnp12p11111nppppnnnnpp或NnnppNnnpp11112或总体成数的区间估计总体成数的区间估计统统 计计 学学 概概 论论中南大学ppZppppppPpPp,或,总体成数的区间估计总体成数的区间估计统统 计计 学学 概概 论论中南大学总体成数的区间估计总体成数的区间估计统统 计计 学学 概概 论论中南大学按按 日产量分组(件)日产量分组(件)组中值(件)组中值(件)工人数(人)工人数(人)
38、110114114118118122122126126130130134134138138142112116120124128132136140371823211864合计合计100 xf统统 计计 学学 概概 论论中南大学0568.0029.096.1029.01000100111001.09.0111,9.010090,96.1,10,90,100,1000101pppZNnnppnnpZnnnN则己知统统 计计 学学 概概 论论中南大学PNP0568.09.010000568.09.01000,0568.09.00568.09.0NPP统统 计计 学学 概概 论论中南大学样本容量的确定样
39、本容量的确定统统 计计 学学 概概 论论中南大学样本容量样本容量找出在规定误差范找出在规定误差范围内的最小样本容围内的最小样本容量量确定样本容量的意义确定样本容量的意义找出在限定费用范围找出在限定费用范围内的最大样本容量内的最大样本容量统统 计计 学学 概概 论论中南大学推断总体平均数所需的样本容量推断总体平均数所需的样本容量,nZZxx22222xxZn通常的做法是先确通常的做法是先确定置信度,然后限定置信度,然后限定抽样极限误差。定抽样极限误差。或或 S S通常未知。通常未知。一般按以下方法确定一般按以下方法确定其估计值:其估计值:过去的过去的经验数据;经验数据;试验调试验调查样本的查样本
40、的S S。计算结果通常向上进位计算结果通常向上进位统统 计计 学学 概概 论论中南大学,12NnnZZxx推断总体平均数所需的样本容量推断总体平均数所需的样本容量22222222xxNNZNNZn统统 计计 学学 概概 论论中南大学统统 计计 学学 概概 论论中南大学袋则在重复抽样条件下:克克己知1005252,2,5,25,10000222222xxZnZN解:解:袋袋10001.99252510000252100002222222222ZNNZnx在不重复抽样下在不重复抽样下:统统 计计 学学 概概 论论中南大学推断总体成数所需的样本容推断总体成数所需的样本容量量,1nPPZZpp2221
41、1PPPPPPZn通常的做法是先确定通常的做法是先确定置信度,然后限定抽置信度,然后限定抽样极限误差。样极限误差。计算结果通常向上进位计算结果通常向上进位 通常未知。一般按以下方通常未知。一般按以下方法确定其估计值:法确定其估计值:过去的经过去的经验数据;验数据;试验调查样本试验调查样本的的 ;取方差的最大值取方差的最大值0.250.25。2P2Ps统统 计计 学学 概概 论论中南大学,11NnnPPZZpp推断总体成数所需的样本容推断总体成数所需的样本容量量PPNPNPPPZNPPNZnpp11112222统统 计计 学学 概概 论论中南大学统统 计计 学学 概概 论论中南大学件件在不重复抽
42、样条件下:件则在重复抽样条件下:己知577004.5760651.0303.050000651.0350001165103.00651.031,0651.01,3,3,500022222222222PPZNPPNZnPPZnPPZNpppp统统 计计 学学 概概 论论中南大学必要样本容量的影响因必要样本容量的影响因素素22222xxZn22222222xxNNZNNZn统统 计计 学学 概概 论论中南大学第四节第四节 抽样设计抽样设计 抽取样本单位时,应确保每个总抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能单位的资
43、料进行搜集和整理时,不能随意遗漏或更换样本单位随意遗漏或更换样本单位在其他条件相同的情况下,选在其他条件相同的情况下,选抽样误差最小的方案抽样误差最小的方案在其他条件相同的情况下,选在其他条件相同的情况下,选费用最少的方案费用最少的方案统统 计计 学学 概概 论论中南大学简单随机抽简单随机抽样样抽样平均误差的计算公式见书:抽样平均误差的计算公式见书:P243P243抽取样本的具体方法:抽取样本的具体方法:统统 计计 学学 概概 论论中南大学简单随机抽样的特简单随机抽样的特点点1 1、直接从总体中抽取所要调查的单位,无须分组、直接从总体中抽取所要调查的单位,无须分组、分类、排队等处理;分类、排队
44、等处理;2 2、必须事先对总体中的所有单位进行编码和编号;、必须事先对总体中的所有单位进行编码和编号;3 3、抽取样本时不借助有关标志的辅助信息、抽取样本时不借助有关标志的辅助信息4 4、当总体各单位村志值之间差异很大时,采用此、当总体各单位村志值之间差异很大时,采用此方法不能保证样本的代表性。方法不能保证样本的代表性。统统 计计 学学 概概 论论中南大学总体总体N N样本样本n n等额抽取等额抽取等比例抽取等比例抽取最优抽取最优抽取类型抽样类型抽样实质上是实质上是分组法分组法与与随机原则随机原则的结合。的结合。例如,在居民生活水平调查中,先按职业分类,例如,在居民生活水平调查中,先按职业分类
45、,然后每种职业分别随机抽取部分居民进行调查。然后每种职业分别随机抽取部分居民进行调查。统统 计计 学学 概概 论论中南大学类型抽样的优点:类型抽样的优点:类型抽样分组的基本原则:类型抽样分组的基本原则:尽量缩小各组内标志值之间的差异,增大组尽量缩小各组内标志值之间的差异,增大组间各标志值之间的差异。间各标志值之间的差异。统统 计计 学学 概概 论论中南大学样本在各组间的分配方法:样本在各组间的分配方法:等额分配法等额分配法:每组抽取的单位数一样。:每组抽取的单位数一样。等比例分配法等比例分配法:按各组单位的比例分配样:按各组单位的比例分配样本单位。本单位。最佳分配法最佳分配法:按各组的方差大小
46、分配样本:按各组的方差大小分配样本单位。方差大的组分配较多的样本单位。单位。方差大的组分配较多的样本单位。经济分配法经济分配法:按各组的方差大小分配样本:按各组的方差大小分配样本单位,同时考虑各组抽样调查的费用。单位,同时考虑各组抽样调查的费用。实际工作中比较常用的是实际工作中比较常用的是等比例分配法等比例分配法。统统 计计 学学 概概 论论中南大学类型抽样的抽样平均误类型抽样的抽样平均误差差一、抽样平均数一、抽样平均数)1(22Nnnnixix不重复抽样情况下重复抽样情况下二、抽样成数二、抽样成数)1()1()1(Nnnppnppiipiip不重复抽样情况下重复抽样情况下统统 计计 学学 概
47、概 论论中南大学分层分层各层各层商店商店数数N Ni i层权层权W Wi i各层各层抽取抽取数数n ni i各层销售额各层销售额样本均值样本均值(万元万元)样本样本方差方差(万元万元)大型商店大型商店中型商店中型商店小型商店小型商店25751500.10.30.65153017008001202800698510850合计合计2501.050 _ _ix2iS以以95.45%95.45%的概率保证程度估计该市所有商的概率保证程度估计该市所有商店的平均销售额。店的平均销售额。统统 计计 学学 概概 论论中南大学根据题意知:根据题意知:N=250N=250,W1=0.1W1=0.1,W2=0.3W
48、2=0.3,W3=0.6W3=0.6,f1=f2=f3=0.2f1=f2=f3=0.2,1-1-=95.45%=95.45%,t=2t=2)(4821206.08003.070011.0万元iixWx总体均值的点估计值为:总体均值的点估计值为:解:解:统统 计计 学学 概概 论论中南大学抽样标准误差为:抽样标准误差为:)(92.11)30108506.01569853.0528001.0(8.0/)1()1(222222万元nSfWNnniiiix总体均值的区间估计为:总体均值的区间估计为:4822*11.9=485.16万元,505.84万元统统 计计 学学 概概 论论中南大学等距抽样等距抽
49、样等距抽样是不重复抽样,适合于对单位数不多且能等距抽样是不重复抽样,适合于对单位数不多且能进行排序的总体抽样。进行排序的总体抽样。总体单位的排列顺序和所研究的标志总体单位的排列顺序和所研究的标志数值大小是无关的。如数值大小是无关的。如调查居民生活调查居民生活水平时,按姓氏笔划排队水平时,按姓氏笔划排队。总体单位的排列顺序和所研究的标志总体单位的排列顺序和所研究的标志数值大小有密切关系。如数值大小有密切关系。如居民收入调居民收入调查,按银行存款高低排序查,按银行存款高低排序。统统 计计 学学 概概 论论中南大学根据样本抽选的方法不同,可分为根据样本抽选的方法不同,可分为:(总体单位按某一标志排序
50、)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)统统 计计 学学 概概 论论中南大学等距抽样的抽样平均误差等距抽样的抽样平均误差统统 计计 学学 概概 论论中南大学hlpdnnnnnABCDEFGHIJKLMNOPIHPD样本容量样本容量整群抽样整群抽样统统 计计 学学 概概 论论中南大学整群抽样的抽样平均误整群抽样的抽样平均误差差1 1、抽样平均数的平均误差、抽样平均数的平均误差2 2、抽样成数的平均误差、抽样成数的平均误差)1(2RrRrpp)1(2RrRrxx统统 计计 学学 概概 论论中南大学例例:对灯