1、二、二、 统统 计计v包括的两类问题:包括的两类问题:如何从总体中抽取样本;如何从总体中抽取样本;如何根据对样本的整理、计算和分析,对总如何根据对样本的整理、计算和分析,对总体的情况做出一种推断体的情况做出一种推断v统计的基本思想:根据样本的信息推断总体的统计的基本思想:根据样本的信息推断总体的情况统计推断的依据是频率的稳定性如,情况统计推断的依据是频率的稳定性如,用频率估计概率,用样本平均数估计总体期望,用频率估计概率,用样本平均数估计总体期望,用样本方差估计总体方差,用样本的分布估计用样本方差估计总体方差,用样本的分布估计总体的分布总体的分布抽抽 样样 方方 法法一、简单随机抽样一、简单随
2、机抽样 定义:定义:设一个总体的个体数为设一个总体的个体数为 如果通过如果通过逐个不放回地抽取的方法从中抽取一个样本,且逐个不放回地抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽取的机会都相等,就称每次抽取时各个个体被抽取的机会都相等,就称这样的抽样为这样的抽样为简单随机抽样简单随机抽样N一、简单随机抽样一、简单随机抽样 定义:定义:设一个设一个总体的个体数为总体的个体数为 如果通过如果通过逐个不放回抽取的方法从中抽取一个样本,且每逐个不放回抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽取的机会相等,就称这样次抽取时各个个体被抽取的机会相等,就称这样的抽样为简单随机抽样的抽样为简单
3、随机抽样N被抽取样本的总体的个数有限,便于对其中各个个体被抽被抽取样本的总体的个数有限,便于对其中各个个体被抽取的概率进行分析取的概率进行分析一、简单随机抽样一、简单随机抽样N便于在抽样实践中进行操作便于在抽样实践中进行操作 定义:定义:设一个总体的个体数为设一个总体的个体数为 如果通过如果通过逐个抽取逐个抽取的方法从中抽取一个样本,且每次抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽取的机会相等,就称这样的抽样时各个个体被抽取的机会相等,就称这样的抽样为简单随机抽样为简单随机抽样一、简单随机抽样一、简单随机抽样N多采用不放回抽样由于所抽取的样本中没多采用不放回抽样由于所抽取的样本中没有
4、被重复抽取的个体,便于进行有关的分析有被重复抽取的个体,便于进行有关的分析和计算和计算 定义:定义:设一个总体的个体数为设一个总体的个体数为 如果通过如果通过逐个抽取的方法从中逐个抽取的方法从中抽取一个样本抽取一个样本,且每次抽取,且每次抽取时各个个体被抽取的机会相等,就称这样的抽样时各个个体被抽取的机会相等,就称这样的抽样为简单随机抽样为简单随机抽样一、简单随机抽样一、简单随机抽样N保证了这种抽样方法的公平性保证了这种抽样方法的公平性 定义:定义:设一个总体的个体数为设一个总体的个体数为 如果通过如果通过逐个抽取的方法从中抽取一个样本,且每次抽取逐个抽取的方法从中抽取一个样本,且每次抽取时各
5、个个体时各个个体被抽取的机会相等被抽取的机会相等,就称这样的抽样,就称这样的抽样为简单随机抽样为简单随机抽样注意以下四点:注意以下四点: (1)它要求被抽取样本的总体的个体数有限;)它要求被抽取样本的总体的个体数有限; (2)它是从总体中逐个进行抽取;)它是从总体中逐个进行抽取; (3)它是一种不放回抽样;)它是一种不放回抽样;(4)它是一种等概率抽样。)它是一种等概率抽样。 简单随机抽样是在特定总体中抽取样本,总体中每一简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。如果用从个
6、体数为被抽取的机会是独立的。如果用从个体数为N的总体中抽的总体中抽取一个容量为取一个容量为n的样本,那么每个个体被抽取的概率等于的样本,那么每个个体被抽取的概率等于 Nn 一般地,设一个总体的个体数为一般地,设一个总体的个体数为N,如果通过逐个,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样。被抽到的机会相等,就称这样的抽样为简单随机抽样。1、简单随机抽样、简单随机抽样(2)将号签放在同一个箱子里,均匀搅拌后)将号签放在同一个箱子里,均匀搅拌后连续抽取连续抽取 次,就得到一个容量为次,就
7、得到一个容量为 的样本的样本简单随机抽样常用方法:简单随机抽样常用方法:抽签法:抽签法:步骤:(步骤:(1)将总体中的所有个体(共将总体中的所有个体(共 个)编号,并写在形状、大小相同的签上;个)编号,并写在形状、大小相同的签上;Nnn简单随机抽样常用方法:简单随机抽样常用方法:2随机数表法:随机数表法:步骤:(步骤:(1)将总体中的个体随机编号;将总体中的个体随机编号;(2)选定开始的数字;)选定开始的数字;(3)获取样本号码)获取样本号码v为了检验某种产品的质量,决定从为了检验某种产品的质量,决定从40件件产品中抽取产品中抽取10件进行检查利用随机数件进行检查利用随机数表法抽取这个样本的步
8、骤:表法抽取这个样本的步骤: 将将40件产品编号,件产品编号,00,01,02,39 在随机数表中任选一个数作为开始在随机数表中任选一个数作为开始16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21
9、 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 2816 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63
10、78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28v为了检验某种产品的质量,决定从为了检验某种产品的质量,决定从40件件产品中抽取产品中抽取10件进行检查利用随机数件进行检查利用随机数表法抽取这个样本的步骤:表法抽取这个样本
11、的步骤: 将将40件产品编号,件产品编号,00,01,02,39 在随机数表中任选一个数作为开始在随机数表中任选一个数作为开始 获取样本号码获取样本号码16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933
12、 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 2816 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01
13、63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28所要抽取的样本号码是所要抽取的样本号码是16 19 10 12 07 39 38 33 21 34二、系统抽样二、系统抽样 定义:定义:当总体中的个体数较多时,可将总体
14、当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取个个体,得到所需要的样则,从每一部分抽取个个体,得到所需要的样本,这种抽样叫做本,这种抽样叫做系统抽样系统抽样从第从第18号起,每号起,每隔隔20个抽取一个号码,这样得到一个容量为个抽取一个号码,这样得到一个容量为50的样的样本本由于由于50:1000 =1:20,所以将总体,所以将总体分成分成50个部分,每一部分包括个部分,每一部分包括20个个体个个体v为了了解参加某种知识竞赛的为了了解参加某种知识竞赛的1000名学生的成绩,名学生的成绩,打算从中抽取一个容量为打
15、算从中抽取一个容量为50的样本的样本 将将这这1000名学生名学生编号,编号,1,2,3,1000 将编号分段:将编号分段: 在第段中用简单随机抽样确定起始的个体编在第段中用简单随机抽样确定起始的个体编号号如如第部分的个体编号为第部分的个体编号为1,2,20在这在这部分随机抽取一个号码,如部分随机抽取一个号码,如18 按照按照预先定出的规则抽取样本预先定出的规则抽取样本18,38,58,978,998二、系统抽样二、系统抽样 采用随机的方式将总体中的个体编号;采用随机的方式将总体中的个体编号; 将编号分段;将编号分段; 在第段中用简单随机抽样确定起始的个体在第段中用简单随机抽样确定起始的个体编
16、号;编号; 按照按照预先定出的规则抽取样本预先定出的规则抽取样本步骤:步骤:系统抽样的步骤为:系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔)将整个的编号均衡地分段,确定分段间隔k。 是整数时,是整数时, ; 不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。nNnNk nN(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;lnk 系统抽样时,将总体中的个体均分后的每一段进系
17、统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的总体中各个个体被抽取的概率也是相等的;如总体的个如总体的个体数不能被样本容量整除时,可以先用简单随机抽样从体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。需要说总体中剔除几个个体,然后再按系统抽样进行。需要说明的是整个抽样过程中每个个体被抽到的概率仍然相等。明的是整个抽样过程中每个个体被抽到的概率仍然相等。系统抽样与简单随机抽样的联系:系统抽样与简单随机抽样的联系:将总体均分后的每一
18、部分进行抽将总体均分后的每一部分进行抽样时,采用的是简单随机抽样样时,采用的是简单随机抽样三、分层抽样三、分层抽样 定义:定义:当已知总体由差异明显的几部分组成当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做抽样,这种抽样叫做分层抽样分层抽样,其中分成的几部,其中分成的几部分叫做分叫做层层3分层抽样分层抽样 当已知总体由差异明显的几部分组成时,为了使样本当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总
19、体分成几部分,然后按照各充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样。其中所分成的各部分叫做层。部分所占的比例进行抽样。其中所分成的各部分叫做层。 由于分层抽样的要求不同,各层的抽样的样本容量也不相同,由于分层抽样的要求不同,各层的抽样的样本容量也不相同,所以,应当按照实际情况,合理地将样本容量分配到各个层,所以,应当按照实际情况,合理地将样本容量分配到各个层,以确保抽样的合理性,研究时可以根据不同的要求来分层以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。抽样。 分层抽样适用于总体由差异明显的几部分组成的情况,分层抽样适用于总体由差异明显的几部分组成的情
20、况,每一部分称为层,在每一层中实行简单随机抽样。这种方法较每一部分称为层,在每一层中实行简单随机抽样。这种方法较充分地利用了总体己有信息,是一种实用、操作性强的方法。充分地利用了总体己有信息,是一种实用、操作性强的方法。 分层抽样的一个重要问题是一个总体如何分层。分层抽样分层抽样的一个重要问题是一个总体如何分层。分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。义。例例2、一个单位的职工有、一个单位的职工有500人
21、,其中不到人,其中不到35岁的有岁的有125人,人,3549岁的有岁的有280人,人,50岁以上的有岁以上的有95人。为了了解该单位人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取职工年龄与身体状况的有关指标,从中抽取100名职工作为名职工作为样本,应该怎样抽取?样本,应该怎样抽取? 分析:这总体具有某些特征,它可以分成几个不同的部分析:这总体具有某些特征,它可以分成几个不同的部分:不到分:不到35岁;岁;3549岁;岁;50岁以上,把每一部分称为一个岁以上,把每一部分称为一个层,因此该总体可以分为层,因此该总体可以分为3个层。由于抽取的样本为个层。由于抽取的样本为100,所,所以必须
22、确定每一层的比例,在每一个层中实行简单随机抽样。以必须确定每一层的比例,在每一个层中实行简单随机抽样。 解:抽取人数与职工总数的比是解:抽取人数与职工总数的比是100:5001:5,则各,则各年龄段(层)的职工人数依次是年龄段(层)的职工人数依次是125:280:9525:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到答:在分层抽样时,不到35岁、岁、3549岁、岁、50岁以上的三个岁以上的三个年龄段分别抽取年龄段分别抽取25人、人、56人和人和19人。人。分层抽样的抽取步骤:分层抽样的抽取步骤:(1)总体
23、与样本容量确定抽取的比例。)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。)对于不能取整的数,求其近似值。由于由于100:500 =1:5,所以在各年龄段抽取的,所以在各年龄段抽取的个体数依次是:个体数依次是:25,56,19v一个单位的职工有一个单位的职工有500人人,其中不到,其中不到35岁的岁的125人,人,35岁岁49岁的有岁的有280人,人,50岁以上的有岁以上的有95人。为了人。为了了解这个单位职工与身体状况有关的某
24、项指标,了解这个单位职工与身体状况有关的某项指标,要要从中抽取一个容量为从中抽取一个容量为100的样本的样本 分层:每个年龄段为一层分层:每个年龄段为一层 按比例确定每层抽取个体的个数:按比例确定每层抽取个体的个数: 各层抽样:可采用前面的两种方法各层抽样:可采用前面的两种方法 汇合成样本汇合成样本.三、分层抽样三、分层抽样步骤:步骤: 分层分层; 按比例确定每层抽取个体的个数按比例确定每层抽取个体的个数; 汇合成样本汇合成样本. 各层抽样各层抽样;三种方法比较:三种方法比较:类类别别适适用用范范围围各各自自特特点点共共同同点点相相互互联联系系简简单单随随机机抽抽样样总总体体中中个个体体数数较较小小从从总总体体中中逐逐个个抽抽取取系系统统抽抽样样总总体体中中个个体体数数较较多多将将总总体体均均分分成成几几部部分分,按按事事先先确确定定的的规规则则在在各各部部分分抽抽取取在在起起始始部部分分抽抽样样时时采采用用简简单单随随机机抽抽样样分分层层抽抽样样总总体体由由 差差异异明明显显的的 几几部部分分组组成成将将总总体体分分成成几几层层,分分层层进进行行抽抽取取抽抽样样过过程程中中每每个个个个体体被被抽抽取取的的概概率率相相等等各各层层抽抽样样时时采采用用简简单单随随机机抽抽样样或或系系统统抽抽样样