1、大一轮复习讲义 第九章统计与统计案例 9.1随机抽样、用样本估计总体 考试要求 1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体 中抽取样本,了解分层抽样的方法. 2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估 计总体的基本数字特征,理解用样本估计总体的思想. 主干梳理主干梳理 基础落实基础落实 题型突破题型突破 核心核心探究探究 课时精练课时精练 内容 索引 ZHUGANSHULI JICHULUOSHI 主干梳理 基础落实 1 1.随机抽样随机抽样 (1)简单随机抽样:一般地,从个体数为N的总体中逐个不放回地取出n个 个体作为样本(nN),如果每个个体都有相同的机
2、会被取到,那么这样的 抽样方法称为简单随机抽样. (2)分层抽样:一般地,当总体由差异明显的几个部分组成时,为了使样 本更客观地反映总体情况,我们常常将总体中的个体按 分成 层次比较分明的几个部分,然后按各个部分在总体中 实施抽样, 这种抽样方法叫 ,所分成的各个部分称为“层”. 知识梳理 不同的特点 所占的比 分层抽样 2.用样本的频率分布估计总体分布用样本的频率分布估计总体分布 (1)在频率分布直方图中,纵轴表示 ,数据落在各小组内的频 率用各小长方形的面积表示.各小长方形的面积的总和等于 . (2)频率分布折线图和总体密度曲线 频率分布折线图:如果将频率分布直方图中各个相邻的矩形的上底边
3、 的 顺次连结起来,那么就得到频率分布折线图. 总体分布的密度曲线:如果将 取得足够大,分组的组距取得 足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑 曲线为总体分布的密度曲线. (3)茎叶图 茎是指中间的一列数,叶是从茎的旁边生长出来的数. 频率/组距 1 中点 样本容量 3.用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数 的数. (2)中位数:将数据从小到大排列,若有奇数个数,则 的数是中位 数;若有偶数个数,则 是中位数. (3)平均数: ,反映了一组数据的平均水平. (4)把一组数据的最大值与最小值的差称为极差. (
4、5)标准差:是样本数据到平均数的一种平均距离,s . (6)方差:s2 (xn是样本数据,n是样 本容量, 是样本平均数). 最多 最中间 中间两数的平均数 微思考 1.两种抽样方法有什么共同点和联系? 提示(1)抽样过程中每个个体被抽取的机会均等. (2)分层抽样中各层抽样时采用简单随机抽样. 2.平均数、标准差与方差反映了数据的哪些特征? 提示平均数反映了数据取值的平均水平,标准差、方差反映了数据对 平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不 稳定;反之离散程度越小,越稳定. 1.判断下列结论是否正确(请在括号中打“”或“”) (1)简单随机抽样中,每个个体被抽到的机会
5、不一样,与先后有关.() (2)分层抽样中,每个个体被抽到的可能性与层数及分层有关.() (3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论. () (4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变, 方差不变.() 题组一思考题组一思考辨析辨析 基础自测 题组二教材题组二教材改编改编 2.某公司有员工500人,其中不到35岁的有125人,3549岁的有280人, 50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工, 则应在这三个年龄段分别抽取人数为 A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20 同理可得
6、这三个年龄段抽取人数分别为25,56,19. 解析从表中数据可知7环有7人,人数最多,所以众数是7; 中位数是将数据从小到大排列,第10个与第11个数据的平均数,第10个 数是7,第11个数是8, 3.某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则 这组数据的众数和中位数分别是 环数5678910 人数127631 A.7,7 B.8,7.5 C.7,7.5 D.8,6 4.如图是100位居民月均用水量的频率分布直方图,则月均用水量在 2,2.5)范围内的居民有_人.25 解析0.50.510025. 题组三易错自题组三易错自纠纠 5.已知一组数据的频率分布直方图如图,则众数是
7、_,平均数是_. 6567 解析因为最高小长方形中点的横坐标为65,所以众数为65; 平均数 (550.030650.040750.015850.010950.005)1067. 6.若数据x1,x2,x3,xn的平均数 5,方差s22,则数据3x11,3x2 1,3x31,3xn1的平均数和方差分别为_. 16,18 解析x1,x2,x3,xn的平均数为5, x1,x2,x3,xn的方差为2, 3x11,3x21,3x31,3xn1的方差是32218. TIXINGTUPO HEXINTANJIU2题型突破 核心探究 题型一抽样方法 自主演练 1.用简单随机抽样的方法从含有10个个体的总体中
8、,抽取一个容量为3的 样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到” 的可能性分别是 2.(2020吉安模拟)总体由编号为00,01,02,48,49的50个个体组成, 利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列 和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的 编号为 附:第6行至第9行的随机数表如下: 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 162
9、0 7477 0111 1630 2404 2979 7991 9683 5125 A.33 B.16 C.38 D.20 解析按随机数法,从随机数表第6行的第9列和第10列数字开始从左到 右依次选取两个数字,超出49及重复的不选, 则编号依次为33,16,20,38,49,32,则选出的第3个个体的编号为20, 故选D. 3.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型 三组,相应的城市数分别为24,16,8.若用分层抽样的方法抽取12个城市, 则应抽取的中型城市数为 A.3 B.4 C.5 D.6 (1)简单随机抽样是分层抽样的基础,是一种等概率的抽样,由定义应抓
10、住以下特点:它要求总体个数较少; 它是从总体中逐个抽取的; 它是一种不放回的抽样. (2)分层抽样适用于总体中个体差异较大的情况. (3)抽样方法经常交叉使用. 思维升华 题型二统计图表及应用 多维探究 命题点1扇形图 例1(2018全国)某地区经过一年的新农村建设,农村的经济收入增 加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统 计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图: 则下面结论中不正确的是 A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超
11、过了经济收入的一半 解析设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济 收入为2a.新农村建设前后,各项收入的对比如下表: 新农村建设前新农村建设后新农村建设后变化情况结论 种植收入60%a37%2a74%a增加A错 其他收入4%a5%2a10%a增加了一倍以上B对 养殖收入30%a30%2a60%a增加了一倍C对 养殖收入 第三产 业收入 (30%6%)a 36%a (30%28%)2a 116%a 超过经济收入2a的一半D对 故选A. 命题点2折线图 例2下面两个图是2020年6月25日由国家卫健委发布的全国疫情累计趋 势图,每图下面横向标注日期,纵向标注累计数量.现存确诊
12、为存量数据, 计算方法为:累计确诊数累计死亡数累计治愈数. 则下列对新冠肺炎叙述错误的是 A.自1月20日以来一个月内,全国累计确诊病例属于快速增长时期 B.自4月份以来,全国累计确诊病例增速缓慢,疫情扩散势头基本控制 C.自6月16日至24日以来,全国每日现存确诊病例平缓增加 D.自6月16日至24日以来,全国每日现存确诊病例逐步减少 解析由图1可知A,B均正确; 由图2数据计算得16日的现存确诊病例为84 86779 9264 645296, 同理可计算18,20,22,24日现存确诊分别为346,383,441,473. 命题点3茎叶图 例3如图所示的茎叶图记录了甲,乙两组各5名 工人某
13、日的产量数据(单位:件).若这两组数据的中 位数相等,且平均数也相等,则x和y的值分别为 A.3,5 B.5,5 C.3,7 D.5,7 解析甲组数据的中位数为65, 由甲,乙两组数据的中位数相等,得y5. 又甲、乙两组数据的平均数相等, x3.故选A. 命题点4频率分布直方图 例4(2020天津)从一批零件中抽取80个,测量其直径(单位:mm),将 所得数据分为9组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49, 并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间 5.43,5.47内的个数为 A.10 B.18 C.20 D.36 解析因
14、为直径落在区间5.43,5.47内的频率为0.02(6.255.00)0.225, 所以个数为0.2258018. (1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系. (2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因 此非常适用于显示在相等时间间隔下数据的趋势. (3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方 图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据, 没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本 容量较大时,作图较烦琐. 思维升华 (4)准确理解频率分布直方图的数据特点: 频率分布直方图中纵轴上的数据
15、是各组的频率除以组距的结果,不要 误以为纵轴上的数据是各组的频率,不要和条形图混淆. 频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常 利用频率分布直方图估计总体分布. 跟踪训练(1)由于受疫情的影响,学校停课,同学们通过三种方式在家 自主学习,现学校想了解同学们对假期学习方式的满意程度,收集如图1 所示的数据;教务处通过分层抽样的方法抽取4%的同学进行满意度调查, 得到的数据如图2.下列说法错误的是 A.样本容量为240 B.若m50,则本次自主学习学生的满意度不低于四成 C.总体中对方式二满意的学生约为300人 D.样本中对方式一满意的学生为24人 解析选项A,样本容量为 6
16、0004%240,该选项正确; 选项B,根据题意得自主学习的 满意率为 0.3580.5 , 所以中位数在第二组, 设中位数为x, 则0.3(x60)0.040.5,解得x65, 所以中位数为65. 12345678910 11 12 13 14 15 16 (2)求参赛学生的平均成绩. 解依题意, 可得平均成绩为 (550.03650.04750.015850.010950.005)1067, 所以参赛学生的平均成绩为67分. 12345678910 11 12 13 14 15 16 技能提升练 13.某校高二年级共有800名学生参加了数学测验(满分150分),已知这 800名学生的数学成
17、绩均不低于90分,将这800名学生的数学成绩分组为 90,100),100,110),110,120),120,130),130,140),140,150),得到 的频率分布直方图如图所示,则下列说法中正确的序号是_. 12345678910 11 12 13 14 15 16 a0.045;这800名学生中数学成绩在 110分以下的人数为160;这800名学生数 学成绩的中位数约为121.4;这800名学生 数学成绩的平均数为125. 解析由题意得(0.0050.010.010.015 0.025a)101,解得a0.035,错; 110分以下的人数为(0.010.01)10800 160,
18、正确; 120分以下的频率是(0.010.010.025)10 0.45,设中位数为x, 平均分为950.11050.11150.251250.351350.15 1450.05120,错. 12345678910 11 12 13 14 15 16 14.气象意义上从春季进入夏季的标志为:连续5天每天日平均温度不低 于22 .现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据 都是正整数,单位:). 甲地:5个数据的中位数为24,众数为22; 乙地:5个数据的中位数为27,平均数为24; 丙地:5个数据中有一个数据是32,平均数为26,方差为10.2. 则肯定进入夏季的地区有_个.
19、12345678910 11 12 13 14 15 16 2 解析甲地肯定进入夏季,因为众数为22,所以22 至少出现两次,若 有一天低于22 ,则中位数不可能为24; 丙地肯定进入,10.25(3226)2(26x)2,所以15(26x)2,所以 x22不成立; 乙地不一定进入,如13,23,27,28,29,肯定进入夏季的地区有2个. 12345678910 11 12 13 14 15 16 拓展冲刺练 15.汽车的“燃油效率”是指汽车每消耗1升 汽油行驶的里程,右图描述了甲、乙、丙三 辆汽车在不同速度下的燃油效率情况.下列叙 述中正确的是 A.消耗1升汽油,乙车最多可行驶5千米 B.
20、以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多 C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油 D.某城市机动车最高限速80千米/小时.相同条件下,在该市用丙车比用 乙车更省油 12345678910 11 12 13 14 15 16 解析对于A,由图象可知当速度大于 40 km/h时,乙车的燃油效率大于5 km/L, 所以当速度大于40 km/h时,消耗1升汽油, 乙车的行驶距离大于5 km,故A错误; 12345678910 11 12 13 14 15 16 对于B,由图象可知当速度相同时,甲车的 燃油效率最高,即当速度相同时,消耗1升 汽油,甲车的行驶路程最远,所以以相
21、同速度行驶相同路程,三辆车中, 甲车消耗汽油最少,故B错误; 对于C,由图象可知当速度为80 km/h时, 甲车的燃油效率为10 km/L,即甲车行驶 10 km时,耗油1升,故行驶1小时,路程为 80 km,燃油为8升,故C错误; 12345678910 11 12 13 14 15 16 对于D,由图象可知当速度小于80 km/h时, 丙车的燃油效率大于乙车的燃油效率,所以 用丙车比用乙车更省油,故D正确. 16.某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间 参加的若干次测试成绩中随机抽取8次,数据如下(单位:分): 甲9582888193798478 乙837580809
22、0859295 (1)请你计算这两组数据的平均数、中位数; 甲、乙两组数据的中位数分别为83分,84分. 12345678910 11 12 13 14 15 16 (2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为 选派哪名工人参加合适?请说明理由. 12345678910 11 12 13 14 15 16 甲9582888193798478 乙8375808090859295 从平均数看,甲、乙均为85分,平均水平相同; 从中位数看,乙的中位数大于甲的中位数,乙的成绩好于甲; 从数据特点看,获得85分以上(含85分)的次数,甲有3次,而乙有4次, 故乙的成绩好些; 12345678910 11 12 13 14 15 16 从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因 此乙更具潜力. 综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次 数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取 得好成绩. 12345678910 11 12 13 14 15 16 大一轮复习讲义 本课结束 更多精彩内容请登录:
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。