1、9.1.2 9.1.2 分层随机抽样分层随机抽样 9.1.3 9.1.3 获取数据的途径获取数据的途径 讲课人:邢启强 2 1 1、简单随机抽样的概念、简单随机抽样的概念: : 2 2、简单随机抽样的特点、简单随机抽样的特点: : 3 3、简单随机抽样的常用方法:、简单随机抽样的常用方法: 机会均等抽样机会均等抽样. . 总体个数有限;总体个数有限; 逐个进行抽取;逐个进行抽取; 抽签法;抽签法; 随机数表法随机数表法. . 设一个总体含有有限个个体,并记其个体数为设一个总体含有有限个个体,并记其个体数为 N如果通过逐个抽取的方法从中抽取一个样本,如果通过逐个抽取的方法从中抽取一个样本, 且每
2、次抽取时各个个体被抽到的机会相等,就称这且每次抽取时各个个体被抽到的机会相等,就称这 样的抽样为样的抽样为简单随机抽样简单随机抽样. . 复习回顾复习回顾 讲课人:邢启强 3 抽样调查最核心的问题是样本的代表性,简单随机 抽样是使总体中每一个个体都有相等的机会被抽中, 但因为抽样的随机性,有可能会出现比较“极端” 的样本, 例如,在对树人中学高一年级学生身高的调查中, 可能出现样本中50个个体大部分来自高个子或矮个 子的情形,这种“极端”样本的平均数会大幅度地偏 离总体平均数,从而使得估计出现较大的误差. 能否利用总体中的一些额外信息对抽样方法进 行改进呢? 新课引入新课引入 讲课人:邢启强
3、4 学习新知学习新知 在对树人中学高一年级学生身高的调查中, 采取简 单随机抽样的方式抽取了50名学生。 1.抽样调查最核心的问题是什么? 2.会不会出现样本中 50 个个体大 部分来自高个子或矮个子的情形? 3.为什么会出现这种“极端样本”? 4.如何避免这种“极端样本”? 样本代表性 会 抽样结果的随机 性个体差异较大 分组抽样,减少组内差距 讲课人:邢启强 5 在树人中学高一年级的 712 名学生中, 男生 有 326 名、女生有 386 名 学习新知学习新知 样本量在男生、女生中应如何分配? 讲课人:邢启强 6 探究?探究? 假设某地区有假设某地区有 高中生高中生2400人,初人,初
4、中生中生10900人,小人,小 学生学生11000人,此人,此 地教育部门为了了地教育部门为了了 解本地区中小学的解本地区中小学的 近视情况及其形成近视情况及其形成 原因,要从本地区原因,要从本地区 的小学生中抽取的小学生中抽取 1%的学生进行调的学生进行调 查,你认为应当怎查,你认为应当怎 样抽取样本?样抽取样本? 80 60 40 20 0 近视率% 小学 初中 高中 你认为哪些因素影响学生视你认为哪些因素影响学生视 力?抽样要考虑哪些因素?力?抽样要考虑哪些因素? 分析:考察对象的特分析:考察对象的特 点是由具有明显差异点是由具有明显差异 的几部分组成。的几部分组成。 当已知总体由差异明
5、显的几部分组成时,为了使样 本更充分地反映总体的情况,常将总体分成几个部 分,然后按照各部分所占的比例进行抽样,这种抽 样叫做“分层抽样”,其中所分成的各部分叫做 “层”。 学习新知学习新知 讲课人:邢启强 7 一、分层抽样的定义。一、分层抽样的定义。 一般地,按一个或多个变量把总体划分成若干个子一般地,按一个或多个变量把总体划分成若干个子 总体,每个个体属于且仅属于一个子总体,在每个总体,每个个体属于且仅属于一个子总体,在每个 子总体中独立地进行简单随机抽样,再把所有子总子总体中独立地进行简单随机抽样,再把所有子总 体中抽取的样本合在一起作为总样本,这样的抽样体中抽取的样本合在一起作为总样本
6、,这样的抽样 方法称为方法称为分层随机抽样分层随机抽样(stratified random sampling),每一个子总体称为层),每一个子总体称为层.在分层随机抽样在分层随机抽样 中,如果每层样本量都与层的大小成比例,那么称中,如果每层样本量都与层的大小成比例,那么称 这种样本量的分配方式为这种样本量的分配方式为比例分配比例分配. 学习新知学习新知 每一层抽取的样本数=总样本量 讲课人:邢启强 8 学习新知学习新知 应用分层抽样应遵循以下要求:应用分层抽样应遵循以下要求: (1 1)分层:将相似的个体归入一类,即为一层,分层要求每层)分层:将相似的个体归入一类,即为一层,分层要求每层 的各
7、个个体互不交叉,即遵循不重复、不遗漏的原则。的各个个体互不交叉,即遵循不重复、不遗漏的原则。 (2 2)分层抽样为保证每个个体等可能入样,需遵循在各层中进)分层抽样为保证每个个体等可能入样,需遵循在各层中进 行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数 量与总体容量的比相等。量与总体容量的比相等。 分层随机抽样的特点 1.从分层随机抽样的定义可看出,分层随机抽样适用 于总体由差异明显的几个部分组成的情况。 2.比例分配的分层随机抽样是等可能抽样 ,如果层数 分为 2层,第 1 层和第 2 层包含的个体数分别为M 和 N,抽
8、取的样本数分别 m 和n。 讲课人:邢启强 9 第一步,计算样本容量与总体的个体数之比第一步,计算样本容量与总体的个体数之比. . 第四步,将各层抽取的个体合在一起,就得第四步,将各层抽取的个体合在一起,就得 到所取样本到所取样本. . 第三步,用简单随机抽样在各层中抽取相应数第三步,用简单随机抽样在各层中抽取相应数 量的个体量的个体. . 第二步,将总体分成互不交叉的层,按比例第二步,将总体分成互不交叉的层,按比例 确定各层要抽取的个体数确定各层要抽取的个体数. . 分层抽样的步骤:分层抽样的步骤: 学习新知学习新知 讲课人:邢启强 10 注意事项:注意事项: 1. 1.分层抽样法适用于总体
9、中个体分层抽样法适用于总体中个体 差异明显的抽样差异明显的抽样; 2.2.分层是按总体中个体的明显差分层是按总体中个体的明显差 异进行分类异进行分类; 3.3.分层抽样是按各层中含个体在分层抽样是按各层中含个体在 总体中所占的比例,确定层抽样的个总体中所占的比例,确定层抽样的个 体个数进行随机抽样体个数进行随机抽样. . 学习新知学习新知 讲课人:邢启强 11 某地区有高中生某地区有高中生24002400人,初中生人,初中生1080010800人,人, 小学生小学生1110011100人人. .当地教育部门为了了解本地区中当地教育部门为了了解本地区中 小学生的近视率及其形成原因,要从本地区的中
10、小学生的近视率及其形成原因,要从本地区的中 小学生中抽取小学生中抽取1%1%的学生进行调查的学生进行调查. . 样本容量与总体个数的比例为样本容量与总体个数的比例为1:1001:100,则,则 高中应抽取人数为高中应抽取人数为24002400* *1/100=241/100=24人人, , 初中应抽取人数为初中应抽取人数为1080010800* *1/100=1081/100=108人,人, 小学应抽取人数为小学应抽取人数为1110011100* *1/100=1111/100=111人人. . 典型例题典型例题 变式变式1:若用分层抽样从该地区抽取若用分层抽样从该地区抽取81名学生调查身名学
11、生调查身 体发育状况,那么高中生、初中生和小学生应分别抽体发育状况,那么高中生、初中生和小学生应分别抽 取多少人?取多少人? 高中生高中生8 8人,初中生人,初中生3636人,小学生人,小学生3737人人. . 讲课人:邢启强 12 某单位有职工某单位有职工500500人,其中人,其中3535岁以下的有岁以下的有125125人,人, 3535岁岁4949岁的有岁的有280280人,人,5050岁以上的有岁以上的有9595人人. .为了为了 调查职工的身体状况,要从中抽取一个容量为调查职工的身体状况,要从中抽取一个容量为100100 的样本的样本. . 思考思考1 1:该项调查应采用哪种抽样方法
12、进行?该项调查应采用哪种抽样方法进行? 典型例题典型例题 思考思考2 2:按比例,三个年龄层次的职工分别抽取多少人?按比例,三个年龄层次的职工分别抽取多少人? 3535岁以下岁以下2525人,人,3535岁岁4949岁岁5656人,人, 5050岁以上岁以上1919人人. . 思考思考3 3:在各年龄段具体如何抽样?怎样获得所需样本?在各年龄段具体如何抽样?怎样获得所需样本? 讲课人:邢启强 13 1 1、某高中共有某高中共有900900人,其中高一人,其中高一 年级年级300300人,高二年级人,高二年级200200人,高人,高 三年级三年级400400人,现采用分层抽样抽人,现采用分层抽样
13、抽 取容量为取容量为4545的样本,那么高一、的样本,那么高一、 高二、高三各年级抽取的人数分高二、高三各年级抽取的人数分 别为(别为( ) A.15,5,25 B.15,15,15A.15,5,25 B.15,15,15 C.10,5,30 D15,10,20C.10,5,30 D15,10,20 D 巩固练习巩固练习 讲课人:邢启强 14 2:2:一个地区共有一个地区共有5 5个乡镇个乡镇, ,人口人口3 3万人万人, ,其中人口其中人口 比例为比例为3:2:5:2:3,3:2:5:2:3,从从3 3万人中抽取一个万人中抽取一个300300人的人的 样本,分析某种疾病的发病率,已知这种疾病
14、样本,分析某种疾病的发病率,已知这种疾病 与不同的地理位置及水土有关,问应采取什么与不同的地理位置及水土有关,问应采取什么 样的方法?并写出具体过程。样的方法?并写出具体过程。 巩固练习巩固练习 解:解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况 差异明显,因而采用分层抽样的方法,具体过程如下:差异明显,因而采用分层抽样的方法,具体过程如下: (1 1)将)将3 3万人分为万人分为5 5层,其中一个乡镇为一层。层,其中一个乡镇为一层。 (2 2)按照样本容量的比例随机抽取各乡镇应抽取的样本。)按照样本容量的比例随机抽取各乡镇
15、应抽取的样本。 3003003/15=603/15=60(人),(人),3003002/15=1002/15=100(人),(人),3003002/15=402/15=40(人),(人), 3003002/15=602/15=60(人)(人), ,因此各乡镇抽取人数分别为因此各乡镇抽取人数分别为6060人、人、4040人、人、100100人、人、4040 人、人、60 60 人。人。 (3 3)将)将300300人组到一起,即得到一个样本。人组到一起,即得到一个样本。 讲课人:邢启强 15 3.3.某公司共有某公司共有10001000名员工,下设若干部门,名员工,下设若干部门, 现用分层抽样法
16、,从全体员工中抽取一个容现用分层抽样法,从全体员工中抽取一个容 量为量为8080的样本,已知策划部被抽取的样本,已知策划部被抽取4 4个员工,个员工, 求策划部的员工人数是多少?求策划部的员工人数是多少? 5050人人. . 巩固练习巩固练习 4. 4. 某中学有某中学有180180名教职员工名教职员工, ,其中教学人员其中教学人员 144144人,管理人员人,管理人员1212人人, ,后勤服务人员后勤服务人员2424人,人, 设计一个抽样方案设计一个抽样方案, ,从中选取从中选取1515人去参观学习人去参观学习. . 用分层抽样,抽取教学人员用分层抽样,抽取教学人员1212人,管人,管 理人
17、员理人员1 1人,后勤服务人员人,后勤服务人员2 2人人. . 讲课人:邢启强 16 5. 5. 某公司在甲、乙、丙、丁四个地区分别有某公司在甲、乙、丙、丁四个地区分别有150150 个、个、120120个、个、180180个、个、150150个销售点,公司为了调查个销售点,公司为了调查 产品的销售情况,需从这产品的销售情况,需从这600600个销售点中抽取一个个销售点中抽取一个 容量为容量为100100的样本,记这项调查为的样本,记这项调查为; 在丙地区中有在丙地区中有2020个特大型销售点,要从中抽取个特大型销售点,要从中抽取7 7个个 调查其销售收入和售后服务等情况,记这项调查调查其销售
18、收入和售后服务等情况,记这项调查 为为, 完成这两项调查宜分别采用什么方法?完成这两项调查宜分别采用什么方法? 用分层抽样,用分层抽样,用简单随机抽样用简单随机抽样. . 巩固练习巩固练习 讲课人:邢启强 17 请根据上述基本数据,设计一个样本容量为总体请根据上述基本数据,设计一个样本容量为总体 中个体数量的千分之一的抽样方案中个体数量的千分之一的抽样方案. . 6.6.某地区中小学生人数的分布情况如下表所示某地区中小学生人数的分布情况如下表所示 (单位:人):(单位:人): 学段学段城市城市县镇县镇农村农村 小学小学357 000357 000 221 600221 600 258 1002
19、58 100 初中初中226 200226 200 134 200134 200 11 29011 290 高中高中112 000112 000 43 30043 300 6 3006 300 巩固练习巩固练习 讲课人:邢启强 18 7、某校有某校有500名学生,其中名学生,其中O型血的有型血的有200人,人, A型血的人有型血的人有125人,人,B型血的有型血的有125人,人,AB型血型血 的有的有50人,为了研究血型与色弱的关系,要从中人,为了研究血型与色弱的关系,要从中 抽取一个抽取一个20人的样本,按分层抽样,人的样本,按分层抽样,O型血应抽型血应抽 取的人数为取的人数为 人,人,A型
20、血应抽取的人数为型血应抽取的人数为 人,人, B型血应抽取的人数为型血应抽取的人数为 人,人,AB型血应抽取的型血应抽取的 人数为人数为 人。人。 8 5 5 2 巩固练习巩固练习 8、某中学高一年级有学生某中学高一年级有学生600人,高二年级有人,高二年级有 学生学生450人,高三年级有学生人,高三年级有学生750人,若该校取一人,若该校取一 个容量为个容量为n的样本,每个学生被抽到的可能性均的样本,每个学生被抽到的可能性均 为为0.2, 则则n= .360 讲课人:邢启强 19 10、某校有老师、某校有老师200人,男学生人,男学生1200人,女人,女 学生学生1000人,现用分层抽样的方
21、法从所有人,现用分层抽样的方法从所有 师生中抽取一个容量为师生中抽取一个容量为n的样本,已知女的样本,已知女 学生中抽取的人数为学生中抽取的人数为80,则,则n= 192192 9、某单位有职工、某单位有职工160人,其中业务员有人,其中业务员有104人,管人,管 理人员理人员32人,后勤人,后勤24人,现用分层抽样从中抽取人,现用分层抽样从中抽取 一容量为一容量为20的样本,则抽取管理人员(的样本,则抽取管理人员( )人)人 A、3 B、4 C、7 D、12 B 巩固练习巩固练习 讲课人:邢启强 20 11、某大学数学系共有本科生、某大学数学系共有本科生5000人,其中一、二、人,其中一、二
22、、 三、四年级的学生比为三、四年级的学生比为4:3:2:1,用分层抽样的,用分层抽样的 方法抽取一个容量为方法抽取一个容量为200人的样本,则应抽取三年级人的样本,则应抽取三年级 的学生为(的学生为( )人。)人。 A、80 B、40 C、60 D、20 B B 巩固练习巩固练习 讲课人:邢启强 21 思考:思考:样本容量与总体的个体数之比是分层抽样的比例样本容量与总体的个体数之比是分层抽样的比例 常数,按这个比例可以确定各层应抽取的个体数,如果常数,按这个比例可以确定各层应抽取的个体数,如果 各层应抽取的个体数不都是整数该如何处理?各层应抽取的个体数不都是整数该如何处理? 调节样本容量,剔除
23、个体调节样本容量,剔除个体. . 学习新知学习新知 某单位有老年人某单位有老年人28人人, ,中年人中年人54人人, ,青年人青年人81人人, ,为了调为了调 查他们的身体情况查他们的身体情况, ,需从他们中抽取一个容量为需从他们中抽取一个容量为36的样本的样本, , 则适合的抽取方法是则适合的抽取方法是 A简单随机抽样简单随机抽样 B系统抽样系统抽样 C. .分层抽样分层抽样 D. .先从老人中剔除先从老人中剔除1人人, ,然后再分层抽样然后再分层抽样 D 讲课人:邢启强 22 学习新知学习新知四、分层随机抽样的平均数 .在简单随机抽样中如何估计总体平均数? .那么在分层随机抽样中如何估计总
24、体平均数呢? 是否也可以直接用样本平均数进行估计? 1 212 1212 212 . ,. 1 ,. 2 Mm Mm MNmnX XXx xx YYYy yy 在分层随机抽样中,如果分 层,第 层和第 层人数 分别为和抽取的样本量分别是 和 我们用, .表示第1层各个个体的变量值,用 表示第 层样本的各个个体的变量值。 用 ,.表示第2层各个个体的变量值,用 表示第 层样本的各个个体的变量值。 讲课人:邢启强 23 学习新知学习新知 第1层的总体平均数和样本平均数为: 12m . = XXX X M 1 1 M i i X M 12 . m xxx x m 1 1 m i i x m 第2层的
25、总体平均数和样本平均数为: 12N . = YYY Y N 1 1 N i i Y N 12 . m yyy y n 1 1 m i i y n 总体平均数和样本平均数为: 11 MN ii ii XY M XNYMN WXY MNMNMNMN 11 mn ii ii xy mxnymn xy mnmnmnmn 讲课人:邢启强 24 学习新知学习新知 由于用第一层的样本平均数 可以估计第层的总体 平均数 ,第二层的样本平均数 可以估计第2层的 总体平均数 ,因此我们可以用 x X y Y MxNyMN xy MNMNMN 估计总体平均数W 对各层样本平均数加权(层权)求和 11 MN ii i
26、i xy w mn mn xy mnmn = mnmn MNMN Mm MNmn Nn MNmn MN xy MNMN 讲课人:邢启强 25 学习新知学习新知 分层随机抽样如何估计总体平均数 MN xy MNMN 在比例分配的分层随机中抽样中 MN xy MNMN mn xy mnmn 11 = MN ii ii xy mn 讲课人:邢启强 26 典型例题典型例题 在树人中学高一年级的 712 名学生,男生有 326 名、女生有 386 名,分别抽取的男生23名男生、 27名女生样本数据如下 173.0 174.0 166.0172.0 170.0 165.0 165.0 168.0 164.
27、0 173.0 172.0 173.0 175.0168.0 170.0 172.0 176.0 175.0 168.0 173.0 167.0 170.0 175.0 163.0164.0161.0157.0162.0165.0168.0155.0164.0162.5 154.0154.0164.0149.0159.0161.0170.0171.0155.0148.0 172.0162.5158.0155.5157.0163.0172.0 样本女生平均身高=160.6,样本男生平均身高=170.6 MN xy MNMN 326386 =170.6+160.6 712712 165.18 讲课
28、人:邢启强 27 巩固练习巩固练习 高一年级有男生490人,女生510人,张华按照男生女生进行分 层,得到男生女生平均身高分别为170.2cm和160.8cm。 (1)如果张华在各层中按比例分配样本,总样本量为100.那 么男生、女生中分别抽取了多少名?在这种情况下,请估计 高一年级全体学生的平均身高。 4951 170.2+160.8165.4 100100 (2)如果张华从男生、女生中抽取的样本量分别 为30和70,那么在这种情况下,如何估计高一全 体学生的平均身高。 讲课人:邢启强 28 深入思考深入思考 小明用比例分配的分层抽样方法,从高一年级的学 生中抽取了十个样本量为50的样本,计
29、算出样本平 均数。与相同样本量的简单随机抽样的结果比较 序号12345678910 简单随 机抽样 165.2162.8164.4164.4165.6164.8165.3164.3165.7165.0 分层随 机抽样 165.8 165.1 164.3 164.3 166.4 164.6 165.2164.9 166.1 165.1 讲课人:邢启强 29 1.分层抽样的样本平均的围绕总体平均数波 动,与简单随机抽样的结果相比分层抽样并 没有明显优于简单随机抽样。 2.相对而言,分层抽样的样本平均数波动幅度 更均匀,简单随机抽样的样本平均数有的偏 离总体平均数的幅度比较大的极端数据。 3.分层随
30、机抽样的结果并不是每一次都优于 简单随机抽样。 发现结论发现结论 讲课人:邢启强 30 课堂小结课堂小结 1 1、分层抽样是当总体由差异明显的几部分组成时采用的抽样分层抽样是当总体由差异明显的几部分组成时采用的抽样 方法,进行分层抽样时应注意以下几点:方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总分层抽样中分多少层、如何分层要视具体情况而定,总 的原则是,层内样本的差异要小,面层之间的样本差异要大,且的原则是,层内样本的差异要小,面层之间的样本差异要大,且 互不重叠。互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样为了保证每个个体
31、等可能入样,所有层应采用同一抽样 比等可能抽样。比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样的方法进行抽样。在每层抽样时,应采用简单随机抽样的方法进行抽样。 2、分层抽样的优点是:使样本具有较强的代表性,并且抽样分层抽样的优点是:使样本具有较强的代表性,并且抽样 过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操 作性强、应用比较广泛的抽样方法。作性强、应用比较广泛的抽样方法。 3.分层随机抽样中如何用样本估计总体平均值。 MN xy MNMN 11 MN ii ii xy mn 讲课人:邢启强 31 方法方法 类别类别
32、共同共同 特点特点 抽样特征抽样特征相互联系相互联系适应范围适应范围 简单随简单随 机抽样机抽样 分层分层 抽样抽样 将总体分将总体分 成几层,成几层, 按比例分按比例分 层抽取层抽取 总体中总体中 的个体的个体 差异较差异较 小小 总体由总体由 差异明差异明 显的几显的几 部分组部分组 成成 从总体中从总体中 逐个抽取逐个抽取 用简单随用简单随 机抽样对机抽样对 各层抽样各层抽样 抽样过程抽样过程 中每个个中每个个 体被抽到体被抽到 的可能性的可能性 相等相等 讲课人:邢启强 32 2.2.分层抽样是按比例分别对各层进行抽样,再将各个子分层抽样是按比例分别对各层进行抽样,再将各个子 样本合并
33、在一起构成所需样本样本合并在一起构成所需样本. .其中正确计算各层应抽取其中正确计算各层应抽取 的个体数,是分层抽样过程中的重要环节的个体数,是分层抽样过程中的重要环节. . 1.1.分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了 保持样本结构与总体结构的一致性,从而使样本更具有代表性,在保持样本结构与总体结构的一致性,从而使样本更具有代表性,在 实际调查中被广泛应用实际调查中被广泛应用. . 3.3.简单随机抽样是基础,分层抽样是发展,二者相辅简单随机抽样是基础,分层抽样是发展,二者相辅 相成,对立统一相成,对立统一. . 课堂小结课堂小结