1、第九章统计与统计案例9.1随机抽样、用样本估计总体新高考数学复习考点知识讲义课件考试要求1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体 中抽取样本,了解分层抽样和系统抽样的方法.2.会用样本的频率分布估计总体分布,会用样本的基本数字特征估 计总体的基本数字特征,理解用样本估计总体的思想.1.随机抽样随机抽样(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都 ,就把这种抽样方法叫做简单随机抽样.(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照 ,从各层独立地抽取一定数量的个
2、体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.知识知识梳理梳理相等一定的比例2.用样本的频率分布估计总体分布用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示 ,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积的总和等于 .(2)频率分布折线图和总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的 ,就得到频率分布折线图.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.频率/组距1中点3.用样本的数字
3、特征估计总体的数字特征用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数 的数.(2)中位数:将数据从小到大排列,若有奇数个数,则 的数是中位数;若有偶数个数,则 是中位数.(3)平均数:,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s .最多最中间中间两数的平均数(5)方差:s2 (xn是样本数据,n是样本容量,是样本平均数).微思考1.三种抽样方法有什么共同点和联系?提示(1)抽样过程中每个个体被抽取的机会均等.(2)系统抽样中在起始部分抽样时采用简单随机抽样;分层抽样中各层抽样时采用简单随机抽样或系统抽样.2.平均数、标准差与方差反映了数据的哪
4、些特征?提示平均数反映了数据取值的平均水平,标准差、方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.1.判断下列结论是否正确(请在括号中打“”或“”)(1)简单随机抽样中,每个个体被抽到的机会不一样,与先后有关.()(2)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(3)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.()(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.()题组一思考题组一思考辨析辨析基础自测基础自测题组二教材题组二教材改编改编2.某公司有员工500人,其中不到35
5、岁的有125人,3549岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为A.33,34,33 B.25,56,19C.20,40,30 D.30,50,20同理可得这三个年龄段抽取人数分别为25,56,19.解析从表中数据可知7环有7人,人数最多,所以众数是7;中位数是将数据从小到大排列,第10个与第11个数据的平均数,第10个数是7,第11个数是8,3.某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是环数5678910人数127631A.7,7 B.8,7.5 C.7,7.5 D
6、.8,64.如图是100位居民月均用水量的频率分布直方图,则月均用水量在2,2.5)范围内的居民有_人.25解析0.50.510025.题组三易错自题组三易错自纠纠5.已知一组数据的频率分布直方图如图,则众数是_,平均数是_.6567解析因为最高小长方形中点的横坐标为65,所以众数为65;平均数 (550.030650.040750.015850.010950.005)1067.6.若数据x1,x2,x3,xn的平均数 5,方差s22,则数据3x11,3x21,3x31,3xn1的平均数和方差分别为_.16,18解析x1,x2,x3,xn的平均数为5,x1,x2,x3,xn的方差为2,3x11
7、,3x21,3x31,3xn1的方差是32218.TIXINGTUPO HEXINTANJIU2题型突破 核心探究题型一题型一抽样抽样方法方法自主演练1.(2020吉安模拟)总体由编号为00,01,02,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为附:第6行至第9行的随机数表如下:2635 7900 3370 9160 1620 3882 7757 49503211 4919 7306 4916 7677 8733 9974 67322748 6198 7164 4148 7
8、086 2888 8519 16207477 0111 1630 2404 2979 7991 9683 5125A.33 B.16 C.38 D.20解析按随机数法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出49及重复的不选,则编号依次为33,16,20,38,49,32,则选出的第3个个体的编号为20,故选D.2.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是3.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为24,16,8
9、.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为A.3 B.4 C.5 D.6(1)简单随机抽样是分层抽样的基础,是一种等概率的抽样,由定义应抓住以下特点:它要求总体个数较少;它是从总体中逐个抽取的;它是一种不放回的抽样.(2)分层抽样适用于总体中个体差异较大的情况.思维升华题型二题型二统计图表统计图表及应用及应用多维探究命题点命题点1 1扇形图扇形图例例1 1(2018全国)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是A.新农村建设后,
10、种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建设前新农村建设后新农村建设后变化情况结论种植收入60%a37%2a74%a增加A错其他收入4%a5%2a10%a增加了一倍以上B对养殖收入30%a30%2a60%a增加了一倍C对养殖收入第三产业收入(30%6%)a36%a(30%28%)2a116%a超过经济收入2a的一半D对故选A.命题点命题点2 2折线图折线图例例2
11、 2下面两个图是2020年6月25日由国家卫健委发布的全国疫情累计趋势图,每图下面横向标注日期,纵向标注累计数量.现存确诊为存量数据,计算方法为:累计确诊数累计死亡数累计治愈数.则下列对新冠肺炎叙述错误的是A.自1月20日以来一个月内,全国累计确诊病例属于快速增长时期B.自4月份以来,全国累计确诊病例增速缓慢,疫情扩散势头基本控制C.自6月16日至24日以来,全国每日现存确诊病例平缓增加D.自6月16日至24日以来,全国每日现存确诊病例逐步减少解析由图1可知A,B均正确;由图2数据计算得16日的现存确诊病例为84 86779 9264 645296,同理可计算18,20,22,24日现存确诊分
12、别为346,383,441,473.命题点命题点3 3茎叶图茎叶图例例3 3如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均数也相等,则x和y的值分别为A.3,5 B.5,5 C.3,7 D.5,7解析甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y5.又甲、乙两组数据的平均数相等,x3.故选A.命题点命题点4 4频率分布直方图频率分布直方图例例4 4(2020天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到
13、如下频率分布直方图,则在被抽取的零件中,直径落在区间5.43,5.47内的个数为A.10 B.18 C.20 D.36解析因为直径落在区间5.43,5.47内的频率为0.02(6.255.00)0.225,所以个数为0.2258018.(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样
14、本容量较大时,作图较烦琐.思维升华(4)准确理解频率分布直方图的数据特点:频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.跟踪跟踪训练训练(1)由于受疫情的影响,学校停课,同学们通过三种方式在家自主学习,现学校想了解同学们对假期学习方式的满意程度,收集如图1所示的数据;教务处通过分层抽样的方法抽取4%的同学进行满意度调查,得到的数据如图2.下列说法错误的是A.样本容量为240B.若m50,则本次自主学习学生的满意度不低于四成C.总体中对方式二
15、满意的学生约为300人D.样本中对方式一满意的学生为24人解析选项A,样本容量为6 0004%240,该选项正确;选项B,根据题意得自主学习的满意率为 0.3580.5,所以中位数在第二组,设中位数为x,则0.3(x60)0.040.5,解得x65,所以中位数为65.12345678910 11 12 13 14 15 16(2)求参赛学生的平均成绩.解依题意,可得平均成绩为(550.03650.04750.015850.010950.005)1067,所以参赛学生的平均成绩为67分.12345678910 11 12 13 14 15 16技能提升练13.某校高二年级共有800名学生参加了数
16、学测验(满分150分),已知这800名学生的数学成绩均不低于90分,将这800名学生的数学成绩分组为90,100),100,110),110,120),120,130),130,140),140,150),得到的频率分布直方图如图所示,则下列说法中正确的序号是_.12345678910 11 12 13 14 15 16a0.045;这800名学生中数学成绩在110分以下的人数为160;这800名学生数学成绩的中位数约为121.4;这800名学生数学成绩的平均数为125.解析由题意得(0.0050.010.010.0150.025a)101,解得a0.035,错;110分以下的人数为(0.01
17、0.01)10800160,正确;120分以下的频率是(0.010.010.025)100.45,设中位数为x,平均分为950.11050.11150.251250.351350.151450.05120,错.12345678910 11 12 13 14 15 1614.气象意义上从春季进入夏季的标志为:连续5天每天日平均温度不低于22.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位:).甲地:5个数据的中位数为24,众数为22;乙地:5个数据的中位数为27,平均数为24;丙地:5个数据中有一个数据是32,平均数为26,方差为10.2.则肯定进入夏季的地区有_个.
18、12345678910 11 12 13 14 15 162解析甲地肯定进入夏季,因为众数为22,所以22 至少出现两次,若有一天低于22,则中位数不可能为24;丙地肯定进入,10.25(3226)2(26x)2,所以15(26x)2,所以x22不成立;乙地不一定进入,如13,23,27,28,29,肯定进入夏季的地区有2个.12345678910 11 12 13 14 15 16拓展冲刺练15.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,右图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况.下列叙述中正确的是A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车
19、中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时.相同条件下,在该市用丙车比用 乙车更省油12345678910 11 12 13 14 15 16解析对于A,由图象可知当速度大于40 km/h时,乙车的燃油效率大于5 km/L,所以当速度大于40 km/h时,消耗1升汽油,乙车的行驶距离大于5 km,故A错误;12345678910 11 12 13 14 15 16对于B,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,所以以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B
20、错误;对于C,由图象可知当速度为80 km/h时,甲车的燃油效率为10 km/L,即甲车行驶10 km时,耗油1升,故行驶1小时,路程为80 km,燃油为8升,故C错误;12345678910 11 12 13 14 15 16对于D,由图象可知当速度小于80 km/h时,丙车的燃油效率大于乙车的燃油效率,所以用丙车比用乙车更省油,故D正确.16.某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,数据如下(单位:分):甲9582888193798478乙8375808090859295(1)请你计算这两组数据的平均数、中位数;甲、乙两组数据的中位数
21、分别为83分,84分.12345678910 11 12 13 14 15 16(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合适?请说明理由.12345678910 11 12 13 14 15 16甲9582888193798478乙8375808090859295从平均数看,甲、乙均为85分,平均水平相同;从中位数看,乙的中位数大于甲的中位数,乙的成绩好于甲;从数据特点看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成绩好些;12345678910 11 12 13 14 15 16从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力.综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取得好成绩.12345678910 11 12 13 14 15 16