1、第2节 统计图表、数据的数字特征、用样本估计总体,最新考纲 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.,知 识 梳 理,1.频率分布直方图,(1)频率分布表的画法:,极差,分组,(2)频率分布直方图:反映样本频率分布的直方图(如图),
2、频率,2.茎叶图,统计中一种被用来表示数据的图叫作茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.,3.样本的数字特征,最多,最中间,平均数,微点提醒,1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.,基 础 自 测,1.判断下列结论正误(在括号内打“”或“”),(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中
3、.( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( ) (4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( ),解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散.,(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误. 答案 (1) (2) (3) (4),2.(必修3P33讲解引申改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A.4 B.8 C.12 D.16,答案 B
4、,3.(必修3P20示例改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( ),A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92,解析 这组数据由小到大排列为87,89,90,91,92,93,94,96,,答案 A,4.(2018全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:,则下面结论中不正确的是( ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.
5、新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半,解析 法一 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的. 法二 因为0.60.372,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的. 答案 A,5.(2019新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随
6、机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( ),A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关 C.倾向选择生育二胎的人员中,男性人数与女性人数相同 D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,解析 由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为6060%36,女性人数为
7、4060%24,不相同.故选C. 答案 C,答案 50,考点一 茎叶图及其应用,【例1】 (1)(2018济南模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成就按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为( ),A.2 B.4 C.5 D.6,(2)(2019长沙质检)为比较甲乙两地某月11时的气温情况,随机选取该月5天1
8、1时的气温数据(单位:)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ,则甲地该月11时的平均气温的标准差为( ),(2)甲地该月5天11时的气温数据(单位:)为28,29,30,30m,32; 乙地该月5天11时的气温数据(单位:)为26,28,29,31,31, 则乙地该月11时的平均气温为(2628293131)529(), 所以甲地该月11时的平均气温为30 , 故(28293030m32)530,解得m1. 则甲地该月11时的平均气温的标准差为,答案 (1)A (2)B,规律方法 1.茎叶图的三个关注点 (1)“叶”的位置只有一个数字,而“茎”的位
9、置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小. 2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息.,【训练1】 空气质量指数 (Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,050为优;51100为良;101150为轻度污染;151200为中度污染;201300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如下.根据该
10、统计数据,估计此地该年AQI大于100的天数约为_(该年为365天).,答案 146,考点二 频率分布直方图 【例2】 (2019石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:20,25),第二组:25,30),第三组:30,35),第四组:35,40),第五组:40,45,得到如图所示的频率分布直方图,已知第一组有6人.,(1)求x; (2)求抽取的x人的年龄的中位数(结果
11、保留整数);,(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为15组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中15组的成绩分别为93,96,97,94,90,职业组中15组的成绩分别为93,98,94,95,90. ()分别求5个年龄组和5个职业组成绩的平均数和方差; ()以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.,(2)设中位数为a,则0.0150.075(a30)0.060.5,,()从平均数来看两组的认知程度相
12、同,从方差来看年龄组的认知程度更稳定(感想合理即可).,【训练2】 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表. A地区用户满意度评分的频率分布直方图,图,B地区用户满意度评分的频率分布表,(1)在图中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);,B地区用户满意度评分的频率分布直方图,图,(2)根据用户满意度评分,将用户和满意度分为三个等级:,估计哪个地区用户的满意度等级为不满意
13、的概率大?说明理由.,解 (1)作出频率分布直方图如图:,通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.,(2)A地区用户的满意度等级为不满意的概率大. 记CA表示事件:“A地区用户的满意度等级为不满意”; CB表示事件:“B地区用户的满意度等级为不满意”. 由直方图得P(CA)的估计值为(0.010.020.03)100.6, P(CB)的估计值为(0.0050.02)100.25. 所以A地区用户的满意度等级为不满意的概率大.,考点三 样本的数字特征 【例3】 (
14、1)(2017全国卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) A.x1,x2,xn的平均数 B.x1,x2,xn的标准差 C.x1,x2,xn的最大值 D.x1,x2,xn的中位数 (2)(2019济南模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( ),解析 (1)刻画评估这种农作物亩产量稳定程度的指标是标准差.,答案 (1)B (2)A,规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围
15、绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定. 2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.,【训练3】 (1)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:,则成绩较为稳定(方差较小)的那位运动员成绩的方差为_.,(2)(2018北京东城质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:,假设每名同学最近一周平均每天的锻炼时间是互相独立的. 男生每天锻炼的时间差别小,女生每天锻炼的时间差别大; 从平均值分析,男生每天锻炼的时间比女生多;,男生平均每天锻炼
16、时间的标准差大于女生平均每天锻炼时间的标准差; 从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大. 其中符合茎叶图所给数据的结论是( ) A. B. C. D.,(2)由茎叶图知,男生每天锻炼时间差别小,女生差别大,正确.,又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, s甲s乙,错误, 因此符合茎叶图所给数据的结论是. 答案 (1)2 (2)C,思维升华 1.用样本估计总体是统计的基本思想. 用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及
17、应用. 2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质. (2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大. 3.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律.,易错防范 1.在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义. 2.直方图与条形图不要搞混 频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.,