1、第二章第二章统统计计测试六测试六随机抽样随机抽样(一一)学习目标学习目标1学会用简单随机抽样方法从总体中抽取样本2了解系统抽样方法基础性训练基础性训练一、选择题一、选择题1关于“简单随机抽样”下列叙述中错误的是()(A)抽取出来的个体不再放回(B)常用的方法有抽签法和随机数表法(C)每一个个体被抽到的机会是均等的(D)常用来解决“从容量非常大的总体中抽取样本”2关于“系统抽样”下列叙述中正确的是()(A)当总体容量不能被样本容量整除时,每个个体被抽到的机会是不均等的(B)比简单随机抽样要方便得多(C)将总体分成均衡的若干部分后,用简单随机抽样从每一部分抽取一个个体(D)常用来解决“从容量非常大
2、的总体中抽取样本”3要从已经编号 150 的 50 枚最新研制的某种型号的导弹中随机抽取 5 枚来进行发射试验,用系统抽样方法所选取的 5 枚导弹的编号可能是()(A)5,10,15,20,25(B)3,13,23,33,43(C)1,2,3,4,5(D)2,4,8,16,324 为征求我校高一年级 1200 名学生对学校某项教改试验的意见, 打算从中抽取一个容量为30 的样本,考虑采用系统抽样,则分段的间隔为()(A)40(B)30(C)20(D)12二、填空题二、填空题5一个总体共有 60 个个体,其编号为 00,01,02,59,现从中抽取一个容量为 10 的样本,请从随机数表的第 8
3、行第 6 列的数字开始,向右读,到最后一列后再从下一行的左边开始继续向右读,依次获取样本号码,直到取满样本为止,则获得的样本号码是_附表:(第 8 行第 10 行)63 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 7933 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 5457 60 86 32 4409 47 27 96 5449 17 46 09 6290 52 84 77 2708 02 73 43 286用系统抽样从元
4、素个数为 N 的总体中抽取容量为 n 的样本,如果总体容量不能被样本容量整除,令nN表示不超过nN的最大整数,则需剔除的个体数是_7某个总体中有 100 个个体,随机编号为 0,1,2,3,99,依编号顺序平均分成 10个小组,组号依次为 1,2,3,4,10,现用系统抽样方法抽取一个容量为 10 的样本规定如果在第一组随机抽取的号码为 m,那么在第 k 组抽取的号码个位数字与 mk的个位数字相同若 m6,则在第 7 组中抽取的号码为_三、解答题三、解答题8某大学为了支援我国西部教育事业,决定从 2006 年应届毕业生报名的 18 名志愿者中,选取 6 人组成志愿小组请用抽签法和随机数表法设计
5、抽样方案9阅读下面问题及解答过程,在空白处填上适当内容,补充完整要从 2003 名同学中抽取 20 名同学试选用适当的抽样方法,写出过程并给出结果解:由于总体个数比较多,我们选用系统抽样法第一步:采用随机的方式给个体编号:0000,0001,_第二步:需用随机数表法剔除 3 个同学在下面的随机数表中,约定从第一行第一列的数开始并向右读,到最后一列后再从下一行的左边开始继续向右读,由此可知道被剔除的是编号为_、_、_的三个同学63 01 63 78 5916 95 55 67 1998 10 50 71 0347 86 73 58 0744 39 52 38 7933 21 12 14 1078
6、 64 56 07 8252 42 07 44 3814 57 00 13 4299 66 02 79 5457 60 86 32 4409 47 27 96 5449 17 46 09 6290 52 84 77 2708 02 73 43 28其余的数每 100 个分为一段, 第一段由编号_的同学组成, 余次类推,比如第四段由编号_的同学组成第三步:用随机数表法在第一段中确定起始同学的编号:在上面第二步的随机数表中,约定从第一行第一列的数开始并向后读,到最后一列后再从下一行的左边开始继续向右读,得号码_第四步:通过加上间隔 100,得到以下编号的同学组成的样本:_测试七测试七随机抽样随机抽
7、样(二二)学习目标学习目标1理解随机抽样的必要性和重要性2了解分层抽样方法基础性训练基础性训练一、选择题一、选择题1系统抽样适用的总体应是()(A)容量较少的总体(B)容量较多的总体(C)个体数较多且均衡的总体(D)任何总体2给出 2 个问题,3 种抽样方法:某小区有 800 个家庭, 其中高收入家庭 200 户, 中等收入家庭 480 户, 低收入家庭 120户为了解有关家用轿车购买力的某个指标,现从中抽取一个容量为 100 的样本;从 20 名学生中选出 3 名参加座谈会方法:简单随机抽样法;系统抽样法;分层抽样法其中问题与方法能配对的是()(A),(B),(C),(D),3某学校有职工
8、140 人,其中教师 91 人,行政人员 28 人,后勤人员 21 人为了解职工的某种情况,要从中抽取一个容量为 20 的样本给出以下 3 种抽样方法:方法一:将 140 人从 1140 编号,然后制作出有编号 1140 的 140 个形状、大小相同的号签,并将号签放入同一箱子里进行均匀搅拌,然后从中抽取 20 个号签,编号与号签相同的 20 个人被选出方法二:将 140 人分成 20 组,每组 7 人,并将每组 7 人按 17 编号,在第一组采用抽签法抽出 k 号(1k7),则其余各组 k 号也被抽到,20 个人被选出方法三:按 20:140 的比例,从教师中抽取 13 人,从行政人员中抽取
9、 4 人,从后勤人员中抽取 3 人,从各类人员中抽取所需人员时,均采用随机数表法,可抽到 20 个人则依简单随机抽样、系统抽样、分层抽样顺序的是()(A)方法二,方法一,方法三(B)方法二,方法三,方法一(C)方法一,方法二,方法三(D)方法三,方法一,方法二4某城区有农民、工人、知识分子家庭共计 2004 户,其中农民家庭 1600 户,工人家庭 303户现要从中抽取容量为 40 的样本,则在整个抽样过程中,可以用到下列抽样方法:简单随机抽样;系统抽样;分层抽样中的()(A)(B)(C)(D)5某初级中学有学生 270 人,其中一年级 108 人,二、三年级各 81 人,现要抽取 10 人参
10、加某项调查考虑选用简单随机抽样、分层抽样和系统抽样三种方案使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为 1,2,270;使用系统抽样时,将学生统一随机编号为 1,2,270,并且整个编号依次分为 10 段,如果抽得的号码有下列四种情况:7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,219,246,270关于上述样本的下列结论中,正确的是()(A)都不能为系统
11、抽样(B)都不能为分层抽样(C)都可能为系统抽样(D)都可能为分层抽样二、填空题二、填空题6某工厂生产中,用传送带将产品送至下一个工序,质检人员每隔十分钟在传送带某一位置取一件检验,则这种抽样的方法为_7已知某单位有职工 120 人,其中男职工 90 人,现采用分层抽样(按男、女比例)抽取一个样本,若样本中有 27 名男职工,则样本容量为_8某学校共有教师 490 人,其中不到 40 岁的有 350 人,40 岁及以上的有 140 人为了解普通话在该校教师中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为 70 人的样本进行普通话水平测试则在不到 40 岁的教师中应抽取的人数是_9
12、某公司在甲、乙、丙、丁四个地区分别有 150 个、120 个、180 个、150 个销售点,公司为了调查产品销售的情况,需从这 600 个销售点中抽取一个容量为 100 的样本,记这项调查为; 在丙地区中有 20 个特大型销售点, 要从中抽取 7 个调查其销售收入和售后服务等情况,记这项调查为则完成这两项调查宜采用的抽样方法依次是_10对某单位 1000 名职工进行某项专门调查,调查的项目与职工的任职年限有关,人事部门提供了如下资料:任职年限人数5 年以下300510 年50010 年以上200用分层抽样方法从中抽取 100 名,则从任职 510 年的人员中抽取_名三、解答题三、解答题11在下
13、列问题中,各采用什么抽样方法抽取样本较为合适?(1)从 8 台彩电中抽取 2 台进行质量检验;(2)一个礼堂有 32 排座位, 每排有 40 个座位(座位号为 140) 一次报告会坐满了听众,会后为听取意见留下 32 名听众进行座谈;(3)育才中学有 160 名教师,其中二级教师 116 名,一级教师 24 名,高级教师 20 名从中抽取一个容量为 40 的样本12 中央电视台在互联网上就观众对其某一节目的喜爱程度进行调查, 参加调查的总人数为12000 人,其中持各种态度的人数如下表所示:很喜欢喜欢一般不喜欢2435456739261072电视台为了了解观众的具体想法和意见,打算从中抽选出
14、60 人进行更为详细的调查,请问该如何抽取13一个总体中有 1000 个个体,编号为 0,1,2,3,999,并依次将其分为 10 个小组,组号为 0,1,2,9要用系统抽样的方法抽取一个容量为 10 的样本,规定如果在第 0 组随机抽取的号码为 x,则第 k 组中抽取的号码的后两位数是 x33k 的后两位数(1)当 x24 时,写出所抽取样本的 10 个号码;(2)若所抽取样本的 10 个号码中,有一个的后两位数是 87,求 x 的取值范围测试八测试八用样本估计总体用样本估计总体(一一)学习目标学习目标1学会列频率分布表、画频率分布直方图,体会它们各自的特点2体会用样本估计总体的思想,会用样
15、本的频率分布估计总体分布基础性训练基础性训练一、选择题一、选择题1下列关于“样本数据的频率分布表、频率分布直方图”的叙述中正确的是()(A)从频率分布表可以看出样本数据的平均数(B)频数是指落在各个小组内的数据(C)每小组的频数与样本容量之比是这个小组的频率(D)组数是样本平均数除以组距2频率分布直方图中小长方形的面积等于()(A)组距(B)频率(C)组数(D)频数3一个容量为 80 的样本中,数据的最大值是 140,最小值是 50,组距是 10,则应将样本数据分为()(A)10 组(B)9 组(C)8 组(D)7 组4对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是()(A)频
16、率分布直方图与总体密度曲线无关(B)频率分布直方图就是总体密度曲线(C)样本容量很大的频率分布直方图就是总体密度曲线(D)如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近总体密度曲线5已知样本:10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12那么频率为 0.2 的范围是()(A)5.57.5(B)7.59.5(C)9.511.5(D)11.513.5二、填空题二、填空题6观察新生婴儿的体重,其样本频率分布直方图如图 1:则新生婴儿体重在2700,3000)的频率为_图 17200 辆汽车通过某一路段时的时速频率分布直
17、方图如图 2 所示,则时速在50,60)的汽车大约有_辆图 28某中学举办电脑知识竞赛,满分为 100 分,80 分以上为优秀(含 80 分)现将高一两个班参赛学生的成绩进行整理后分成 5 组,绘制成频率分布直方图(图 3)已知图中从左到右的第一、三、四、五小组的频率分别为 0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数是_,成绩优秀的频率是_图 39一个社会调查机构就某地居民的月收入调查了 10000 人,并根据所得数据画了样本的频率分布直方图(图 4)为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000 人中再用分层抽样方法抽出 100 人作进一
18、步调查,则在2500,3000)(元)月收入段应抽出_人图 4三、解答题三、解答题10如图 5 所示,是某单位职工年龄(取正整数)的频数分布图,根据图形提供的信息,回答下列问题(直接写出答案)注:每组可含最低值,不含最高值(1)该单位职工共有多少人?(2)不小于 38 岁但小于 44 岁的职工人数占职工总人数的百分比是多少?(3)如果 42 岁的职工有 4 人,那么年龄在 42 岁以上的职工有几人?图 511如图 6,从参加环保知识竞赛的学生中抽出 60 名,将其成绩(均为整数)整理后画出的频率分布直方图如图 6 所示:观察图形,回答下列问题:图 6(1)8090 这一组的频数、频率分别是多少
19、?(2)估计这次环保知识竞赛的及格率(60 分及以上为及格)测试九测试九用样本估计总体用样本估计总体(二二)学习目标学习目标1理解样本数据标准差的意义和作用,学会计算数据标准差2会用样本的基本数字特征估计总体的基本数字特征基础性训练基础性训练一、选择题一、选择题1能反映一组数据的离散程度的是()(A)众数(B)平均数(C)标准差(D)极差2下列数字特征一定是数据组中数据的是()(A)众数(B)中位数(C)标准差(D)平均数3两个样本,甲:5,4,3,2,1;乙:4,0,2,1,2那么样本甲和样本乙的波动大小情况是()(A)甲、乙波动大小一样(B)甲的波动比乙的波动大(C)乙的波动比甲的波动大(
20、D)甲、乙的波动大小无法比较4下列说法:一组数据不可能有两个众数;一组数据的方差必须是正数;将一组数据中的每一个数据都加上同一个常数后,方差不变;在频率分布直方图中,每个小矩形的面积等于相应小组的频率其中错误的个数是()(A)0(B)1(C)2(D)35甲、乙两台机床同时生产一种零件,现要检查它们的运行情况,统计 10 天中,两台机床每天出的次品数分别是:甲0102203124乙2311021101两台机床中出次品数较少的是_(A)甲(B)乙(C)一样(D)以上都有可能二、填空题二、填空题6图 1 是某县参加 2007 年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为 A1,
21、A2,A10(如 A2表示身高(单位:cm)(150,155)内的学生人数)图2 是统计图 1 中身高在一定范围内学生人数的一个算法流程图现要统计身高在 160180cm(含 160cm,不含 180cm)的学生人数,那么在流程图中的判断框内应填写的条件是_图 1图 27一组数据的方差为 3,将这组数据中的每一个数据都扩大到原来的 3 倍,所得到的一组数据的方差是_8已知样本 99,100,101,x,y 的平均数是 100,方差是 2,则 xy_9甲、乙两名高一年级男生,在参加投篮比赛时,各做了 5 组投篮,每组 10 次,投中次数如下:甲:7,6,8,6,8乙:6,7,8,7,7则x甲_;
22、2甲s甲_;x乙_;2乙s_他们中_的成绩更稳定三、解答题三、解答题10某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔 30min 抽取一包产品,称其质量,分别记录抽查数据如下:甲:10210199981039899;乙:110115908575115110(1)这种抽样方法是哪一种?(2)估计甲、乙两车间的平均值与方差,并说明哪个车间产品较稳定11在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有 100 个数据,将数据分组如下表:分组频数1.30,1.34)41.34,1.38)251.38,1.42)301.42,1.46)291.46,1.50)101.50,1.54
23、)2合计100(1)完成频率分布表,画出频率分布直方图;(2)求纤度落在1.38,1.50)中的频率及纤度小于 1.40 的频率测试十测试十变量相关性变量相关性学习目标学习目标1会作散点图,并利用散点图直观认识变量间的相关关系2能根据给出的线性回归方程系数公式建立线性回归方程基础性训练基础性训练一、选择题一、选择题1下面哪些变量是不相关关系()(A)出租车费与行驶的里程(B)正方形的边长与面积(C)身高与体重(D)铁球的大小与质量2在研究吸烟与患肺癌的关系中,通过收集数据,整理分析数据得到“吸烟与患肺癌有关”的结论,并且有 99以上的把握认为这个结论是成立的,下列说法中正确的是()(A)100
24、 个吸烟者中至少有 99 人患有肺癌(B)1 个人吸烟,那么这人有 99的概率患有肺癌(C)在 100 个吸烟者中一定有患肺癌的人(D)在 100 个吸烟者中可能一个患肺癌的人也没有3某化工厂为预测某产品的回收率 y,需要研究它和原料有效成分含量之间的相关关系,现取了 8 对观测值,计算得:iix8152,iiy81228,281iix478,iiiyx811849,则y 对 x 的线性回归方程是()(A)y 11.472.62x(B)y 11.472.62x(C)y 2.6211.47x(D)y 11.472.62x4一位母亲记录儿子 39 岁的身高,由此建立了身高与年龄的回归模型为y 7.
25、19x73.93,用这个模型预测这个孩子 10 岁时的身高,则正确的叙述是()(A)身高一定是 145.83cm(B)身高在 145.83cm 以上(C)身高在 145.83cm 以下(D)身高在 145.83cm 左右5三点(3,10),(7,20),(11,24)的回归直线方程是()(A)y 1.75x5.75(B)y 1.75x5.75(C)y 1.75x5.75(D)y 1.75x5.75二、填空题二、填空题6有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)学生与他(她)的学号之间的关系其中,具有
26、相关关系的是_7对一质点的运动过程观测了 3 次,得到如下表所示的数据刻画 y 与 x 关系的线性回归方程为_x123y1358若某地财政收入 x 与支出 y 满足线性回归模型y bxae(单位:亿元),其中 b0.8,a2,|e|0.5,如果今年该地区财政收入 10 亿元,年支出预计不会超过_9通过对有关数据的分析可知,每立方米混凝土的水泥用量 x(单位:kg)与 28 天后混凝土的抗压强度 y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为y 0.30 x9.99根据建设项目的需要,28 天后混凝土的抗压强度不得低于 89.7,则每立方米混凝土的水泥用量最少应为_kg(精确到个
27、位)10某农场粮食产量的统计结果如图 1 所示,从图中我们可以看到前 n 年的粮食总产量 yn与 n 之间的关系则从目前的统计结果来看,前_年的年平均粮食产量最高图 1三、解答题三、解答题11 某种蔬菜单位面积的施肥量 x(单位: kg)与蔬菜增产量 y(单位: kg)之间有如下对应关系:x24568y3040605070(1)画出散点图;(2)求回归直线方程12下表提供了某厂节油降耗技术推广后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对应数据x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出 y 关于 x 的线性回归方程
28、y bxa;(3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤,试根据(2)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)13下面是一周内某地申请领取结婚证的新郎与新娘的年龄,记录(新郎年龄,新娘年龄)如下:(37,30),(30,27),(65,56),(45,40),(32,30),(28,26),(45,31),(29,24),(26,23),(28,25),(42,29),(36,33),(32,29),(24,22),(32,33)(1)对于上面的实际年龄统计数据求出线性回归方程;(2)
29、从这条回归直线上,你对新娘和新郎的年龄模型可得出什么结论?参考答案参考答案第二章第二章统统计计测试六测试六1D2D3B4A537,55,56,05,07,17,51,28,35,436nNnN 7638解:抽签法:第一步:将 18 名志愿者编号,编号为 1,2,3,18;第二步:将 18 个号码分别写在 18 张外形完全相同的纸条上,并揉成团,制成号签;第三步:将 18 个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取 6 个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员随机数表法:第一步:将 18 名志愿者编号,编号为 01,02,03,18;第二步
30、:在随机数表中任选一数作为开始,按任意方向读数;第三步:从任意一个数开始,向右读,每次取两位,凡不在 0118 中的数,或已读过的数,都跳过去不做记录,依次可得到 6 个号码;第四步:找出以上号码对应的志愿者,就是志愿小组的成员92002;0347,1410,1457;0000,0099;03000346 和 03480400;0013;0013,0113,0213,0313,0414,0514,0614,0714,0814,0914,1014,1114,1214,1314,1415,1516,1616,1716,1816,1916测试七测试七1C2B3A4D5D6系统抽样7368509分层抽
31、样,简单随机抽样10解:从任职 510 年的人员中抽取50101500(人)11(1)简单随机抽样;(2)系统抽样;(3)分层抽样12应该进行分层抽样首先确定抽样比 k,然后再根据抽样比 k 和各层人数确定各层要抽取的人数抽样比20011200060k52001072202003926232004567,122002435,故四类人应分别抽取 12,23,20,5 人进行调查13(1)当 x24 时,按规则可知所抽取样本的 10 个号码依次为:24,157,290,323,456,589,622,755,888,921(2)当 k0,1,2,9 时,33k 的值依次为:0,33,66,99,1
32、32,165,198,231,264, 297 又抽取样本的 10 个号码中有一个的后两位数是 87, 从而 x 可以为 87, 54,21,88,55,22,89,56,23,90所以 x 的取值范围是21,22,23,54,55,56,87,88,89,90测试八测试八1.C分析:(A)数据的频率分布表一般不能反映原有数据的全部信息(B)频数是指落在小组内的数据的个数(D)组数是极差除以组距2B3B4D5D60.37608100;0.1592510(1)该单位共有职工 50 人(2)不小于 38 岁且小于 44 岁的职工人数占职工总人数的 60(3)年龄在 42 岁以上的职工有 15 人1
33、1(1)频率:0.025100.25;频数:600.2515(2)0.015100.025100.03100.005100.75测试九测试九1C2A3C4C5B6i8727方差的公式)()()(1222212xxxxxxnsn,如果每一组数据都扩大到原来的 3 倍,则平均数也扩大到原来的 3 倍,则变为22212)33()33(1xxxxns)()()(9)33(222212xxxxxxnxxnn,即方差扩大到原来的 9倍,所以所得到的一组数据的方差是 39278999697,08,7,04,乙10(1)这是运用的系统抽样法(2)分别计算甲、乙两个车间的平均数和方差100)9998103989
34、9101102(71甲x100)110115758590115110(71乙x即甲、乙两车间产品的平均值都是 100下面再考虑它们的方差:43. 3) 114(712甲s57.228)100225100(712乙s即22乙甲ss ,表明甲车间的产品比较稳定11解:(1)分组频数频率1.30,1.34)40.041.34,1.38)250.251.38,1.42)300.301.42,1.46)290.291.46,1.50)100.101.50,1.54)20.02合计1001.00(2)纤度落在1.38,1.50)中的频率约为 0.300.290.100.69,纤度小于 1.40 的频率约为
35、44. 030. 02125. 004. 0测试十测试十1C2D3A4D5B6(1)(3)712xy810.5926610311(1)散点图如图:(2)i12345Xi24568Yi30406050702iX416253664XiYi60160300300560 x5,y50;145252221xxx;x1y1x2y2x5y5138025525242322215544332211xxxxxxyxyxyxyxyxyxb5 . 655145505513802aybx506.5517.5于是所求的回归直线方程是 y6.5x17.512(1)散点图略(2)5 . 3, 5 . 4,866543, 5 .66222412241YXXYXiiiiib0.7,a0.35 所求的回归方程为 y0.7x0.35(3)x100,y1000.70.3570.35 吨,预测生产 100 吨甲产品的生产能耗比技改前降低 9070.3519.65(吨)13(1)线性回归方程为2464. 01513. 1xy;(2)从(1)的回归方程可见,新郎的年龄一般比新娘的大,尤其是在大龄夫妇中