1、 1抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较 小; 2注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点 1抽样方法 抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但 又各有其特点和适用范围 2统计中的四个数据特征 (1)众数:在样本数据中,出现次数最多的那个数据 (2)中位数:样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数 据的平均数作为中位数 (3)平均数:样本数据的算术平均数,即x1 n(x1x2?xn) (4)方差与标准差 s21 n(x1
2、 x)2(x2x)2?(xnx)2, s 1 n(x1x )2(x2x)2?(xnx)2 3直方图的两个结论 (1)小长方形的面积组距频率 组距频率 (2)各小长方形的面积之和等于 1 4回归分析与独立性检验 (1)回归直线y bxa经过样本点的中心点( x,y),若 x 取某一个值代入回归直线方程y bxa中,可求出 y 的估计值 (2)独立性检验 对于取值分别是x1,x2和y1,y2的分类变量 X 和 Y,其样本频数列联表是: y1 y2 总计 知识与技巧的梳理知识与技巧的梳理 考向预测考向预测 专题五专题五 第第 1 1 讲讲 统计统计与与统计统计案例案例 概率概率与统计与统计 x1 a
3、 b ab x2 c d cd 总计 ac bd n 则 K2 n(adbc)2 (ab)(cd)(ac)(bd)(其中 nabcd 为样本容量) 型更合适,并用此模型预测 A 超市广告费支出为 8 万元时的销售额 参数数据及公式:x8,y42, 7 i1xiyi2 794, 7 i1x 2 i708, (1)解析 k39183841,且 P(K2k03841)005,根据独立性检验思想“这种血清能起到预防感 冒的作用”出错的可能性不超过 5% 答案 B (2)解 x8,y42, 7 i1xiyi2 794, 7 i1x 2 i708 因此a yb x42178284 所以,y 关于 x 的线
4、性回归方程是y 17x284 0750,b0 Ba 0,b0 Da 50%,所以超过了经济收 入的一半,所以 D 正确; 故选 A 3 【解题思路】由题可知满足分层抽样特点 【答案】由于从不同龄段客户中抽取,故采用分层抽样,故答案为分层抽样 4 【解题思路】 (1)两个回归直线方程中无参数,所以分别求自变量为 2018 时所对应的函数值,就得结果, (2)根据折线图知 2000 到 2009,与 2010 到 2016 是两个有明显区别的直线,且 2010 到 2016 的增幅明显高 于 2000 到 2009,也高于模型 1 的增幅,因此所以用模型 2 更能较好得到 2018 的预测 【答案
5、】 (1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为? ?=304+135 19=2261(亿 元) 利用模型,该地区 2018年的环境基础设施投资额的预测值为? ?=99+175 9=2565(亿元) (2)利用模型得到的预测值更可靠 理由如下: (i)从折线图可以看出,2000年至 2016 年的数据对应的点没有随机散布在直线 y=304+135t上下, 这说明利用 2000年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势 2010年相对 2009年的环境基础设施投资额有明显增加,2010年至 2016 年的数据对应的点位于一条直线的 附近
6、,这说明从 2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010年至 2016年的数据 建立的线性模型? ?=99+175t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型 得到的预测值更可靠 经典常规题 (ii)从计算结果看,相对于 2016年的环境基础设施投资额 220亿元,由模型得到的预测值 2261亿元的 增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠 以上给出了 2种理由,考生答出其中任意一种或其他合理理由均可得分 点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程
7、有待定参数, 则根据回归直线方程恒过点(?,?)求参数 1 【解题思路】根据 6070 岁这个年龄段中 128 人中抽查了 8 人,可知分层抽样的抽样比为 8 128= 1 16, 因为共抽出 30 人,所以总人数为30 16=480人,即可求出 2030 岁年龄段的人数 【答案】根据 6070 岁这个年龄段中 128 人中抽查了 8 人,可知分层抽样的抽样比为 8 128= 1 16, 因为共抽出 30 人,所以总人数为30 16=480人, 所以,2030 岁龄段的人有480 ? 128 ? 192 = 160,故选 D 2 【解题思路】由题图可知,2014 年 8 月到 9 月的月接待游
8、客量在减少,则 A 选项错误 【答案】A 3 【解题思路】由回归直线方程过样本点中心可得a 【答案】由题意,x45,y3625,代入y 065xa,可得a7,当产量为 80 吨时,预计需要生产 能耗为 06580759故填 59 4【解题思路】 (1)根据题中所给的使用了节水龙头 50天的日用水量频数分布表, 算出落在相应区间上的频率, 借助于直方图中长方形的面积表示的就是落在相应区间上的频率, 从而确定出对应矩形的高, 从而得到直方图; (2)结合直方图,算出日用水量小于 035 的矩形的面积总和,即为所求的频率; (3)根据组中值乘以相应的频率作和求得50天日用水量的平均值, 作差乘以36
9、5天得到一年能节约用水多少?3, 从而求得结果 【答案】 (1) 高频易错题 (2)根据以上数据,该家庭使用节水龙头后 50天日用水量小于 035m3的频率为 02 01+1 01+26 01+2 005=048, 因此该家庭使用节水龙头后日用水量小于 035m3的概率的估计值为 048 (3)该家庭未使用节水龙头 50 天日用水量的平均数为 ?1= 1 50(005 1 + 015 3 + 025 2 + 035 4 + 045 9 + 055 26 + 065 5) = 048 该家庭使用了节水龙头后 50 天日用水量的平均数为 ?2= 1 50(005 1 + 015 5 + 025 13 + 035 10 + 045 16 + 055 5) = 035 估计使用节水龙头后,一年可节省水(048 ? 035) 365 = 4745(m3) 1 【解题思路】作出散点图,画出回归直线直观判定b 0,a2706 所以有 90%的把握认为“微信控”与“性别”有关