1、 1抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较 小; 2注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点 1抽样方法 抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但 又各有其特点和适用范围 2统计中的四个数据特征 (1)众数:在样本数据中,出现次数最多的那个数据 (2)中位数:样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数 据的平均数作为中位数 (3)平均数:样本数据的算术平均数,即x1 n(x1x2?xn) (4)方差与标准差 s21 n(x1
2、 x)2(x2x)2?(xnx)2, s 1 n(x1x )2(x2x)2?(xnx)2 3直方图的两个结论 (1)小长方形的面积组距频率 组距频率 (2)各小长方形的面积之和等于 1 4回归分析与独立性检验 (1)回归直线y bxa经过样本点的中心点( x,y),若 x 取某一个值代入回归直线方程y bxa中,可求出 y 的估计值 (2)独立性检验 对于取值分别是x1,x2和y1,y2的分类变量 X 和 Y,其样本频数列联表是: y1 y2 总计 知识与技巧的梳理知识与技巧的梳理 考向预测考向预测 专题五专题五 第第 1 1 讲讲 统计统计与与统计统计案例案例 概率概率与统计与统计 x1 a
3、 b ab x2 c d cd 总计 ac bd n 则 K2 n(adbc)2 (ab)(cd)(ac)(bd)(其中 nabcd 为样本容量) 型更合适,并用此模型预测 A 超市广告费支出为 8 万元时的销售额 参数数据及公式:x8,y42, 7 i1xiyi2 794, 7 i1x 2 i708, (1)解析 k39183841,且 P(K2k03841)005,根据独立性检验思想“这种血清能起到预防感 冒的作用”出错的可能性不超过 5% 答案 B (2)解 x8,y42, 7 i1xiyi2 794, 7 i1x 2 i708 因此a yb x42178284 所以,y 关于 x 的线
4、性回归方程是y 17x284 075 50%,所以超过了经济收 入的一半,所以 D 正确; 故选 A 经典常规题 限时训练限时训练 (45 分钟) 3(2018 全国 III 卷))某公司有大量客户,且不同龄段客户对其服务的评价有较大差异为了解客户的评价, 该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法 是_ 【解题思路】由题可知满足分层抽样特点 【答案】由于从不同龄段客户中抽取,故采用分层抽样,故答案为分层抽样 47(2018 全国 II 卷)下图是某地区 2000 年至 2016 年环境基础设施投资额?(单位:亿元)的折线图 为了预测该地区
5、 2018 年的环境基础设施投资额,建立了?与时间变量?的两个线性回归模型根据 2000 年至 2016 年的数据(时间变量?的值依次为1, 2, ?, 17)建立模型:? ? = ?304+ 135?;根据 2010 年至 2016 年的数据(时间变量?的值依次为1, 2, ?, 7)建立模型:? ? = 99 + 175? (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由 【解题思路】 (1)两个回归直线方程中无参数,所以分别求自变量为 2018 时所对应的函数值,就得结果, (2)根据折线图知 2000
6、到 2009,与 2010 到 2016 是两个有明显区别的直线,且 2010 到 2016 的增幅明显高 于 2000 到 2009,也高于模型 1 的增幅,因此所以用模型 2 更能较好得到 2018 的预测 【答案】 (1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为? ?=304+135 19=2261(亿 元) 利用模型,该地区 2018年的环境基础设施投资额的预测值为? ?=99+175 9=2565(亿元) (2)利用模型得到的预测值更可靠 理由如下: (i)从折线图可以看出,2000年至 2016 年的数据对应的点没有随机散布在直线 y=304+135t上下, 这
7、说明利用 2000年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势 2010年相对 2009年的环境基础设施投资额有明显增加,2010年至 2016 年的数据对应的点位于一条直线的 附近,这说明从 2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010年至 2016年的数据 建立的线性模型? ?=99+175t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型 得到的预测值更可靠 (ii)从计算结果看,相对于 2016年的环境基础设施投资额 220亿元,由模型得到的预测值 2261亿元的 增幅明显偏低,而利用模型得到
8、的预测值的增幅比较合理,说明利用模型得到的预测值更可靠 以上给出了 2种理由,考生答出其中任意一种或其他合理理由均可得分 点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数, 则根据回归直线方程恒过点(?,?)求参数 1 (2018 内江期末)为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”, 某记者分别从社区 6070 岁, 4050 岁,2030 岁的三个年龄段中的 128,192,x 人中,采用分层抽样的方法共抽出了 30 人进行调查,若 6070 岁这个年龄段中抽查了 8 人,那么 x 为( ) A64 B96 C144 D160 【解
9、题思路】根据 6070 岁这个年龄段中 128 人中抽查了 8 人,可知分层抽样的抽样比为 8 128= 1 16, 因为共抽出 30 人,所以总人数为30 16=480人,即可求出 2030 岁年龄段的人数 【答案】根据 6070 岁这个年龄段中 128 人中抽查了 8 人,可知分层抽样的抽样比为 8 128= 1 16, 因为共抽出 30 人,所以总人数为30 16=480人, 所以,2030 岁龄段的人有480 ? 128 ? 192 = 160,故选 D 2 (2017 全国卷)某城市为了解游客人数的变化规律, 提高旅游服务质量, 收集并整理了 2014 年 1 月至 2016 年 1
10、2 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图 根据该折线图,下列结论错误的是( ) A月接待游客量逐月增加 B年接待游客量逐年增加 C各年的月接待游客量高峰期大致在 7,8 月 D各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性更小,变化比较平稳 【解题思路】由题图可知,2014 年 8 月到 9 月的月接待游客量在减少,则 A 选项错误 【答案】A 3(2017 泉州模拟)某厂在生产甲产品的过程中,产量 x(吨)与生产能耗 y(吨)的对应数据如表: x 30 40 50 60 y 25 35 40 45 高频易错题 根据最小二乘法求得回归方程为y 06
11、5xa,当产量为 80 吨时,预计需要生产能耗为_吨 【解题思路】由回归直线方程过样本点中心可得a 【答案】由题意,x45,y3625,代入y 065xa,可得a7,当产量为 80 吨时,预计需要生产 能耗为 06580759故填 59 4 (2018 全国 I 卷)某家庭记录了未使用节水龙头 50 天的日用水量数据(单位:m3)和使用了节水龙头 50 天的日用水量数据,得到频数分布表如下: 未使用节水龙头 50 天的日用水量频数分布表 日用水量 ? 0,0.1 ?0.1,0.2 ?0.2,0.3 ?0.3,0.4 ?0.4,0.5 ?0.5,0.6 ?0.6,0.7 频数 1 3 2 4 9
12、 26 5 使用了节水龙头 50 天的日用水量频数分布表 日用水量 ? 0,0.1 ?0.1,0.2 ?0.2,0.3 ?0.3,0.4 ?0.4,0.5 ?0.5,0.6 频数 1 5 13 10 16 5 (1)在答题卡上作出使用了节水龙头 50 天的日用水量数据的频率分布直方图: (2)估计该家庭使用节水龙头后,日用水量小于 035 m3的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按 365 天计算,同一组中的数据以这组数据所 在区间中点的值作代表 ) 【解题思路】(1)根据题中所给的使用了节水龙头 50 天的日用水量频数分布表,算出落在相应区间上的频率, 借助于直
13、方图中长方形的面积表示的就是落在相应区间上的频率, 从而确定出对应矩形的高, 从而得到直方图; (2)结合直方图,算出日用水量小于 035 的矩形的面积总和,即为所求的频率; (3)根据组中值乘以相应的频率作和求得50天日用水量的平均值, 作差乘以365天得到一年能节约用水多少?3, 从而求得结果 【答案】 (1) (2)根据以上数据,该家庭使用节水龙头后 50天日用水量小于 035m3的频率为 02 01+1 01+26 01+2 005=048, 因此该家庭使用节水龙头后日用水量小于 035m3的概率的估计值为 048 (3)该家庭未使用节水龙头 50 天日用水量的平均数为 ?1= 1 5
14、0(005 1 + 015 3 + 025 2 + 035 4 + 045 9 + 055 26 + 065 5) = 048 该家庭使用了节水龙头后 50 天日用水量的平均数为 ?2= 1 50(005 1 + 015 5 + 025 13 + 035 10 + 045 16 + 055 5) = 035 估计使用节水龙头后,一年可节省水(048 ? 035) 365 = 4745(m3) 1(2017 汉中模拟)已知两个随机变量 x,y 之间的相关关系如表所示: x 4 2 1 2 4 y 5 3 1 05 1 根据上述数据得到的回归方程为y bxa,则大致可以判断( ) Aa 0,b0 Ba 0,b0 Da 0,a2706 所以有 90%的把握认为“微信控”与“性别”有关