1、INNOVATIVE DESIGN 第十章 第3节用样本估计总体考纲要求2理解样本数据标准差的意义和作用,会计算数据标准差理解样本数据标准差的意义和作用,会计算数据标准差3能从样本数据中提取基本的数字特征能从样本数据中提取基本的数字特征(如平均数、标准差如平均数、标准差),并作出,并作出合理的解释合理的解释4会用样本的频率分布估计总体的频率分布,会用样本的基本数字会用样本的频率分布估计总体的频率分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想特征估计总体的基本数字特征,理解用样本估计总体的思想5会用随机抽样的基本方法和样本估计总体的思想解决一些简单的会用随机抽样的基
2、本方法和样本估计总体的思想解决一些简单的实际问题实际问题1了解分布的意义和作用,能根据频率分布表画频率分布直方图、了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点频率分布折线图、茎叶图,体会它们各自的特点知识分类落实考点分层突破课后巩固作业内容索引/123/知识分类落实夯实基础回扣知识1/索引知识梳理1.频率分布直方图频率分布直方图第二步第二步:_,通常对组内数值所在区间取左闭右开区间,最后一组取闭通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;区间;第三步:登记频数,计算频率,列出频率分布表第三步:登记频数,计算频率,列出频率分布表.
3、(2)频率分布直方图:反映样本频率分布的直方图频率分布直方图:反映样本频率分布的直方图(如图如图)分组分组索引2.茎叶图茎叶图统计统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数从茎的旁边生长出来的数.3.样本的数字特征样本的数字特征(1)众数:一组数据众数:一组数据中中_的的那个数据,叫做这组数据的众数那个数据,叫做这组数据的众数.(2)中位数:把中位数:把n个数据按大小顺序排列,个数据按大小顺序排列,处于处于_位置位置的一个数据的一个数据(或或最最中间中间两个数据的平均数两个数据的平均数)叫做
4、这组数据的中位数叫做这组数据的中位数.出现次数最多出现次数最多最中间最中间索引索引/索引诊断自测1.判断下列结论正误判断下列结论正误(在括号内打在括号内打“”“”或或“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的方差越大,说明这组数据越集中一组数据的方差越大,说明这组数据越集中.()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大越大.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序
5、写,茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次相同的数据可以只记一次.()索引解析解析(1)正确正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误错误.方差越大,这组数据越离散方差越大,这组数据越离散.(4)错误错误.茎相同的数据,相同的数据叶要重复记录,故茎相同的数据,相同的数据叶要重复记录,故(4)错误错误.索引B2.一个容量为一个容量为32的样本,已知某组样本的频率为的样本,已知某组样本的频率为0.25,则该组样本的频数为,则该组样本的频数为()A.4 B.8 C.1
6、2 D.16索引3.若某校高一年级若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是位数和平均数分别是()AA.91.5和和91.5 B.91.5和和92C.91和和91.5 D.92和和92索引4.(2020全国全国卷卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成完成1 200份订单的配货,由于订单量大幅增加,导致订单积压份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,为解决困难,许多志愿者踊跃报名参加配货工作许多志愿者踊跃
7、报名参加配货工作.已知该超市某日积压已知该超市某日积压500份订单未配货,份订单未配货,预计第二天的新订单超过预计第二天的新订单超过1 600份的概率为份的概率为0.05.志愿者每人每天能完成志愿者每人每天能完成50份订份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者则至少需要志愿者()A.10名名 B.18名名 C.24名名 D.32名名解析解析由题意,第二天完成积压订单及当日订单的配货的概率不小于由题意,第二天完成积压订单及当日订单的配货的概率不小于0.95,即第二天确保完成新订单即第二天
8、确保完成新订单1 600份,减去超市每天能完成的份,减去超市每天能完成的1 200份,再加上积份,再加上积压的压的500份,共有份,共有1 6001 200500900(份份),至少需要志愿者,至少需要志愿者9005018(名名).B索引5.(2020全国全国卷卷)设一组样本数据设一组样本数据x1,x2,xn的方差为的方差为0.01,则数据,则数据10 x1,10 x2,10 xn的方差为的方差为()A.0.01 B.0.1 C.1 D.10解析解析10 x1,10 x2,10 xn的方差为的方差为1020.011.故选故选C.C索引6.(2020新高考海南卷新高考海南卷)某中学的学生积极参加
9、体育锻炼,其中有某中学的学生积极参加体育锻炼,其中有96%的学生喜欢的学生喜欢足球或游泳,足球或游泳,60%的学生喜欢足球,的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是足球又喜欢游泳的学生数占该校学生总数的比例是()A.62%B.56%C.46%D.42%解析解析如图,用如图,用Venn图表示该中学喜欢足球和游泳的学生所占的比例之间的图表示该中学喜欢足球和游泳的学生所占的比例之间的关系,设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为关系,设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为x,则,则(60%
10、x)(82%x)x96%,解得,解得x46%.故选故选C.C考点分层突破题型剖析考点聚焦2/索引考点一频率分布直方图师生共研师生共研【例【例1】某大学艺术专业某大学艺术专业400名学生参加某次测评,名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从根据男女学生人数比例,使用分层抽样的方法从中随机抽取了中随机抽取了100名学生,记录他们的分数,将名学生,记录他们的分数,将数据分成数据分成7组:组:20,30),30,40),80,90.并整理得到如下频率分布直方图:并整理得到如下频率分布直方图:(1)从总体的从总体的400名学生中随机抽取一人,估计其分数小于名学生中随机抽取一人,估计
11、其分数小于70的概率;的概率;解解根据频率分布直方图可知,样本中分数不小于根据频率分布直方图可知,样本中分数不小于70的频率为的频率为(0.020.04)100.6,所以样本中分数小于,所以样本中分数小于70的频率为的频率为10.60.4.所以从总体的所以从总体的400名学生中随机抽取一人,其分数小于名学生中随机抽取一人,其分数小于70的概率估计值为的概率估计值为0.4.索引(2)已知样本中分数小于已知样本中分数小于40的学生有的学生有5人,试估计人,试估计总体中分数在区间总体中分数在区间40,50)内的人数;内的人数;【例【例1】某大学艺术专业某大学艺术专业400名学生参加某次测评,名学生参
12、加某次测评,根据男女学生人数比例,使用分层抽样的方法从根据男女学生人数比例,使用分层抽样的方法从中随机抽取了中随机抽取了100名学生,记录他们的分数,将名学生,记录他们的分数,将数据分成数据分成7组:组:20,30),30,40),80,90.并整理得到如下频率分布直方图:并整理得到如下频率分布直方图:解解根据题意,样本中分数不小于根据题意,样本中分数不小于50的频率的频率为为(0.010.020.040.02)100.9,故样本中分数小于故样本中分数小于50的频率为的频率为0.1,故分数在区间故分数在区间40,50)内的人数为内的人数为1000.155.索引(3)已知样本中有一半男生的分数不
13、小于已知样本中有一半男生的分数不小于70,且样本中分数不小于,且样本中分数不小于70的男女生人的男女生人数相等数相等.试估计总体中男生和女生人数的比例试估计总体中男生和女生人数的比例.【例【例1】某大学艺术专业某大学艺术专业400名学生参加某次测评,名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从根据男女学生人数比例,使用分层抽样的方法从中随机抽取了中随机抽取了100名学生,记录他们的分数,将名学生,记录他们的分数,将数据分成数据分成7组:组:20,30),30,40),80,90.并整理得到如下频率分布直方图:并整理得到如下频率分布直方图:索引解解由题意可知,样本中分数不小于由
14、题意可知,样本中分数不小于70的学生人数为的学生人数为(0.020.04)1010060.所以样本中的男生人数为所以样本中的男生人数为30260,女生人数为女生人数为1006040,男生和女生人数的比例为男生和女生人数的比例为604032.所以根据分层抽样原理,总体中男生和女生人数的比例估计为所以根据分层抽样原理,总体中男生和女生人数的比例估计为32.索引感悟升华索引【训练【训练1】某公司为了解用户对其产品的满意度,从某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查两地区分别随机调查了了40个用户,根据用户对产品的满意评分,得到个用户,根据用户对产品的满意评分,得到A地区用户满意度
15、评分的频率地区用户满意度评分的频率分布直方图和分布直方图和B地区用户满意度评分的频率分布表地区用户满意度评分的频率分布表.A地区用户满意度评分的频率分布直方图地区用户满意度评分的频率分布直方图图图索引B地区用户满意度评分的频率分布表地区用户满意度评分的频率分布表满意度评分分组满意度评分分组50,60)60,70)70,80)80,90)90,100频数频数2814106(1)在图在图中作出中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结
16、论即可不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图地区用户满意度评分的频率分布直方图图图索引解解作出作出频率分布直方图如图:频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分地区用户满意度评分的平均值高于的平均值高于A地区用户满意度评分的平均值;地区用户满意度评分的平均值;B地区用户满意度评分比较集中,地区用户满意度评分比较集中,而而A地区用户满意度评分比较分散地区用户满意度评分比较分散.索引(2)根据用户满意度评分,将用户和满意度分为三个等级:根据用户满意度评分,将用户和满意
17、度分为三个等级:满意度评分满意度评分低于低于70分分70分到分到89分分不低于不低于90分分满意度等级满意度等级不满意不满意满意满意非常满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由估计哪个地区用户的满意度等级为不满意的概率大?说明理由.索引解解A地区用户的满意度等级为不满意的概率大地区用户的满意度等级为不满意的概率大.记记CA表示事件:表示事件:“A地区用户的满意度等级为不满意地区用户的满意度等级为不满意”;CB表示事件:表示事件:“B地区用户的满意度等级为不满意地区用户的满意度等级为不满意”.”.由直方图得由直方图得P(CA)的估计值为的估计值为(0.010.020.0
18、3)100.6,P(CB)的估计值为的估计值为(0.0050.02)100.25.所以所以A地区用户的满意度等级为不满意的概率大地区用户的满意度等级为不满意的概率大./索引考点二统计图表及应用多维探究多维探究角度角度1扇形图扇形图【例【例2】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:前后农村的经济收入构成比例,得到如图所示的饼图:索引解析
19、解析法一法一设新农村建设前经济收入为设新农村建设前经济收入为a,则新农村建设后经济收入为,则新农村建设后经济收入为2a,则,则由饼图可得新农村建设前种植收入为由饼图可得新农村建设前种植收入为0.6a,其他收入为,其他收入为0.04a,养殖收入为,养殖收入为0.3a.新农村建设后种植收入为新农村建设后种植收入为0.74a,其他收入为,其他收入为0.1a,养殖收入为,养殖收入为0.6a,养殖收入与,养殖收入与第三产业收入的总和为第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的,所以新农村建设后,种植收入减少是错误的.法二法二因为因为0.6”连接连接).s1s2s3121314
20、0708091011010203040506索引解析解析根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较远,表现的最分散,标准差最大,乙的数据分布均匀,不如甲组中偏离平均远,表现的最分散,标准差最大,乙的数据分布均匀,不如甲组中偏离平均值大,标准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最值大,标准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最集中,方差最小,故集中,方差最小,故s1s2s3.1213140708091011010203040506索引三、解答题三、解答题10.(2021福州一模福州一
21、模)为了解某知名品牌两个不同型号手机为了解某知名品牌两个不同型号手机M9,M10的待机时间的待机时间(单位:小时单位:小时),淮北某手机卖场从仓库中随机,淮北某手机卖场从仓库中随机抽取抽取M9,M10两种型号的手机各两种型号的手机各6台,在相同的条件下进行测台,在相同的条件下进行测试,统计结果如图:试,统计结果如图:(1)根据茎叶图计算根据茎叶图计算M9,M10两种型号手机的平均待机时间;两种型号手机的平均待机时间;1213140708091011010203040506索引10.(2021福州一模福州一模)为了解某知名品牌两个不同型号手机为了解某知名品牌两个不同型号手机M9,M10的待机时间
22、的待机时间(单位:小时单位:小时),淮北某手机卖场从仓库中随机,淮北某手机卖场从仓库中随机抽取抽取M9,M10两种型号的手机各两种型号的手机各6台,在相同的条件下进行测台,在相同的条件下进行测试,统计结果如图:试,统计结果如图:(2)根据茎叶图判断根据茎叶图判断M9,M10两种型号被测试手机待机时间方两种型号被测试手机待机时间方差的大小,并说明理由差的大小,并说明理由.解解M9手机待机时间方差大于手机待机时间方差大于M10手机待机时间方差手机待机时间方差.理由:理由:M9的数据分布比较分散,波动较大;的数据分布比较分散,波动较大;M10的数据分布比较集中,波的数据分布比较集中,波动较小动较小.
23、1213140708091011010203040506索引11.某市民用水拟实行阶梯水价,每人月用水量中某市民用水拟实行阶梯水价,每人月用水量中不超过不超过w立方米的部分按立方米的部分按4元元/立方米收费,超出立方米收费,超出w立方米的部分按立方米的部分按10元元/立方米收费,从该市随立方米收费,从该市随机调查了机调查了10 000位居民,获得了他们某月的用水位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:量数据,整理得到如下频率分布直方图:(1)如果如果w为整数,那么根据此次调查,为使为整数,那么根据此次调查,为使80%以上居民在以上居民在该月的用水价格为该月的用水价格为4
24、元元/立方米,立方米,w至少定为多少?至少定为多少?1213140708091011010203040506索引解解如题图所示,用水量在如题图所示,用水量在0.5,2)的频率的和为的频率的和为(0.20.30.4)0.50.45,用水量在用水量在0.5,3)的频率的和为的频率的和为(0.20.30.40.50.3)0.50.85.用水量小于等于用水量小于等于2立方米的频率为立方米的频率为0.45,用水量小于等于,用水量小于等于3立方米的频率为立方米的频率为0.85,又,又w为整数,为整数,为使为使80%以上的居民在该月的用水价格为以上的居民在该月的用水价格为4元元/立方米,立方米,w至少定为至
25、少定为3.1213140708091011010203040506索引11.某市民用水拟实行阶梯水价,每人月用水量中某市民用水拟实行阶梯水价,每人月用水量中不超过不超过w立方米的部分按立方米的部分按4元元/立方米收费,超出立方米收费,超出w立方米的部分按立方米的部分按10元元/立方米收费,从该市随立方米收费,从该市随机调查了机调查了10 000位居民,获得了他们某月的用水位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:量数据,整理得到如下频率分布直方图:(2)假设同组中的每个数据用该组区间的右端点值代替,当假设同组中的每个数据用该组区间的右端点值代替,当w3时,估计该市时,估计
26、该市居民该月的人均水费居民该月的人均水费.1213140708091011010203040506索引解解当当w3时,该市居民该月的人均水费估计为时,该市居民该月的人均水费估计为(0.110.151.50.220.252.50.153)40.15340.05(3.53)0.05(43)0.05(4.53)107.21.81.510.5(元元).即当即当w3时,该市居民该月的人均水费估计为时,该市居民该月的人均水费估计为10.5元元.1213140708091011010203040506索引12.(2020郑州调研郑州调研)区域经济变化影响着人口的流动,下图为过去某连续区域经济变化影响着人口的
27、流动,下图为过去某连续5年各省、年各省、自治区及直辖市自治区及直辖市(不含港澳台不含港澳台)人口增长统计图人口增长统计图.某连续某连续5年各省、自治区及直辖市年各省、自治区及直辖市(不含港澳台不含港澳台)人口增长统计图人口增长统计图B级 能力提升/1213140708091011010203040506索引根据图中的信息,下面结论中不正确的是根据图中的信息,下面结论中不正确的是()A.广东人口增量最多,天津增幅最高广东人口增量最多,天津增幅最高B.黑龙江无论是增量还是增幅均居末尾黑龙江无论是增量还是增幅均居末尾C.天津、北京、重庆和上海四大直辖市增幅均超过天津、北京、重庆和上海四大直辖市增幅均
28、超过5%D.人口增量超过人口增量超过200万的省、自治区或直辖市共有万的省、自治区或直辖市共有7个个A解析解析对于对于A,由图知广东,由图知广东5年人口增加超过年人口增加超过400万,增量最多,天津增幅达到了万,增量最多,天津增幅达到了19.2%,增幅最高,增幅最高,A正确;对于正确;对于B,由图易知正确;对于,由图易知正确;对于C,上海的人口增幅,上海的人口增幅为为4.9%,未超过,未超过5%,不正确;对于,不正确;对于D,人口增量超过,人口增量超过200万的省或直辖市有天万的省或直辖市有天津、北京、重庆、广东、河北、湖南和山东,正确津、北京、重庆、广东、河北、湖南和山东,正确.综上,选综上
29、,选C.1213140708091011010203040506索引16,18解析解析x1,x2,x3,xn的平均数为的平均数为5,x1,x2,x3,xn的方差为的方差为2,3x11,3x21,3x31,3xn1的方差是的方差是32218.1213140708091011010203040506索引14.(2021石家庄模拟石家庄模拟)“一带一路一带一路”是是“丝绸之路经济带丝绸之路经济带”和和“21世纪海上丝绸世纪海上丝绸之路之路”的简称的简称.某市为了了解人们对某市为了了解人们对“一带一路一带一路”的认知程度,对不同年龄和的认知程度,对不同年龄和不同职业的人举办了一次不同职业的人举办了一次
30、“一带一路一带一路”知识竞赛,满分为知识竞赛,满分为100分分(90分及以上分及以上为认知程度高为认知程度高).现从参赛者中抽取了现从参赛者中抽取了x人,按人,按年龄年龄分成分成5组,第一组:组,第一组:20,25),第二组:,第二组:25,30),第三第三组:组:30,35),第四组:,第四组:35,40),第五组,第五组:40,45,得到如图所示的频率分布直方图,得到如图所示的频率分布直方图,已知已知第一第一组有组有6人人.(1)求求x;1213140708091011010203040506索引(2)求抽取的求抽取的x人的年龄的中位数人的年龄的中位数(结果保留整数结果保留整数);1213
31、140708091011010203040506索引(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取方法依次抽取6人,人,42人,人,36人,人,24人,人,12人,分别记为人,分别记为15组,从这组,从这5个个按年龄分的组和按年龄分的组和5个按职业分的组中每组各选派个按职业分的组中每组各选派1人参加人参加“一带一路一带一路”知识知识竞赛,分别代表相应组的成绩,年龄组中竞赛,分别代表相应组的成绩,年龄组中15组的成绩分别为组的成绩分别为93,96,97,94,90,职业组中,职业组中15组的成绩分别为组的成绩分别为93,98,94,95,90.分别求分别求5个年龄组和个年龄组和5个职业组成绩的平均数和方差;个职业组成绩的平均数和方差;以上述数据为依据,评价以上述数据为依据,评价5个年龄组和个年龄组和5个职业组对个职业组对“一带一路一带一路”的认知的认知程度,并谈谈你的感想程度,并谈谈你的感想.1213140708091011010203040506索引INNOVATIVE DESIGNTHANKS本节内容结束