1、 十年高考全国课标卷统计与概率解答题的考察研究 以 2009 年至 2018 年高考全国课标卷理科为例 宋健辉 (福建省福州格致中学) 1 引言 统计与概率是高中数学的重要内容,2018 年普通高等学校招生全国统一考试大纲的 说明(理科)对统计与概率内容的要求是,高考主要考查随机抽样,用样本估计总体,变 量的相关性,随机事件的概率,古典概型,几何概型,回归分析,独立性检验,离散型随机 变量的分布列、期望、方差,正态分布考查重点是用样本估计总体,古典概型,离散型随 机变量的分布列、期望、方差,应用回归分析与独立性检验思想方法解决简单实际问题的能 力试题强调应用性,以实际问题
2、为背景,构建数学模型,突出考查统计与概率的思想和考 生的数据处理能力以及应用意识 本文将以2009年至2018年高考全国课标卷统计与概率 (理 科)解答题为例,对其进行一次理论与实践的总结和分析,与大家分享试题背后的思想和试 题对教学的引导作用, 希望能给一线教师提供一点经验 2 基本情况分析表2009 年至 2018 年高考课标卷统计与概率解答题统计 试题年份 题号 考查的知识点 涉及的统计图或表 字符 2009 (海南宁夏卷) 19 从统计的角度计算概率、由频率分 布直方图估计均值与方差 频率分布表、 频率分 布直方图 417
3、 2010 19 分层抽样、独立性检验、调整抽样 方法 列联表 169 2011 19 从统计的角度计算概率、分段函数、 分布列 频率分布表 307 2012 18 分段函数、分布列、期望方差、统 计推断 统计表 290 2013() 19 概率计算、分布列、数学期望 文字语言 267 2013() 19 分段函数、由频率分布直方图估计 概率、期望 频率分布直方图 261 2014() 17 由频率分布直方图估计均值与方 差、由正态分布计算概率与期 望 频率分布直
4、方图 232 2014() 19 线性回归方程 表格 222 2015() 19 非线性回归方程、从统计的角度计 算二次型函数的最值 散点图 341 2015() 18 茎叶图、从统计的角度计算概率 茎叶图、 数据以及表 格 377 2016() 19 分布列、从统计的角度求最值、统 计推断 频率分布直方图 291 2016() 18 从统计的角度计算概率、条件概率、 期望 表格 239 2016() 18 相关系数、回归直线方程 折线图 190 2017() 1
5、9 正态分布3的理解、统计推断、期 望与方差 表格 440 试题年份 题号 考查的知识点 涉及的统计图或表 字符 2017() 18 从统计的角度计算概率、独立性检 验、由频率分布直方图估计中 位数 频率分布直方图 243 2017() 18 分布列、统计推断 频率分布表 383 2018() 20 二项分布、导数求最值、期望、统 计推断 文字语言 333 2018() 18 利用回归方程求预报值、判断回归 模型得到预报值的可靠性 折线图 210
6、 2018() 18 茎叶图、中位数、独立性检验 茎叶图、 列联 表 275 由表,统计与概率命题范围主要有:用样本估计总体,离散型随机变量的分布列、期 望与方差, 正态分布, 回归分析与独立性检验, 统计决策, 并多次与函数结合在一起考查 其 基本情况有如下点: 从题号来看,除了 2014 年卷和 2018 年卷外,其余均是解答题的第 18 或 19 题, 属中档和中档偏上的题目 但从实测数据来看, 以福建省 2016 年和 2017 年公布的数据: 2016 年难度 0.34,2017 年难度 0.24,由此可以看到课标卷的统计概率题难点在于“新” 除
7、了 2013 年卷和 2018 年卷外, 所有题目都与统计图表紧密相连, 涉及频率分布 直方图、茎叶图、折线统计图、散点图,读图识表作图是基本要求 不含空格,从统计的字符来看,信息量相当大,需要很好的数学阅读能力 大部分考查离散型随机变量分布,尤其是超几何分布与二项分布,其中 2014 年卷 与 2017 年卷结合正态考查二项分布 十年所考的 19 题对统计与概率的知识、 思想能力进行了非常全面的考查, 强调应用性, 试题呈现出三大特点: ()背景公平, 控制难度 全国卷的统计与概率解答题主要是以考数学应用题的考查 目标而出现的, 此它必须以大多数考生熟悉的社会热点问题为背景才能显示公平, 而
8、且考查 的难度适中 ()以统计为主,概率为辅在命题设计中,对概率的考查基本上都是从统计的角度 来计算概率, 即概率计算是为统计服务的, 重在强调对统计的基本思想方法及其应用的考查, 重在利用统计与概率思想解决实际问题 ()强调对随机模型的建立,统计数据的收集、整理和处理,直至最终作出相关统计 决策的全过程的考查 试题分析 3.1 突出统计概率思想分析、解释和统计决断 统计与概率思想包含统计思想与概率思想两个部分, 统计思想是指利用统计数据, 依据 统计问题的要求,得到统计结论;概率思想是通过对随机现象的观察研究发现必然,去研究 隐藏在随机现象背后的统计规律,进而理解随机现象 例(2018 全国
9、卷理 20)某工厂的某种产品成箱包装,每箱 200 件,每一箱产品在 交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品检验时,先从这箱产 品中任取 20 件作检验,再根据检验结果决定是否对余下的所有产品作检验设每件产品为 不合格品的概率都为(01)pp,且各件产品是否为不合格品相互独立 ()记 20 件产品中恰有 2 件不合格品的概率为( )f p,求( )f p的最大值点 0 p; ()现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以()中确定的 0 p作为 p的值已知每件产品的检验费用为 2 元,若有不合格品进入用户手中,则工厂要
10、对每件 不合格品支付 25 元的赔偿费用 (i)若不对该箱余下的产品作检验,这一箱的检验费用与赔偿费用的和记为X,求 EX; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作 检验? 简解()由 2218 20 ( )(1) ,(0,1)f pC ppp,求得当 1 10 p 时,( )f p有最大,所 以 0 0.1p ()(i)剩余 180 件产品中恰有Y件是不合格品服从二项分布(180,0.1)B,所以检 验费用与赔偿费用的和2540XY,则(2540)490EXEY (ii)如果对余下的产品作检验,则这一箱
11、产品所需要的检验费为 400 元,由于 400EX ,故应该对余下的所有产品作检验 本题以统计思想为引导,从统计的角度求得概率,让概率为统计服务,考查样本估计总 体的思想,考查统计思维课标卷的统计概率解答题尤其突出统计概率思想分析问题、解释 问题和统计推断, 充分体现了高考的考查重点是利用统计与概率思想解决实际问题, 体现了 数学的应用性价值十年高考题中具有“统计决断”特征的试题如下: 表统计决断问题统计 年份 问题描述 2010 根据()的结论,能否提供更好的调查方法来估计该地区老年人,需要志 愿帮助的老年人的比例?说明理由 2012 若花店计划一天应购进
12、 16 枝或 17 枝玫瑰花, 你认为应购进 16 枝还是 17?请 说明理由 2016() 以购买易损零件所需费用的期望值为决策依据, 在 n=19 与 n=20 之中选其一, 应选用哪个 2017() 试说明上述监控生产过程方法的合理性 2018() 以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产 品作检验 2018() 你认为用哪个模型得到的预测值更可靠?并说明理由 3.2 对数据处理能力提出了较高要求 数据处理能力是指会收集数据、整理数据、分析数据,能从数据中提取对研究问题有用 的信息,并做出合理判断数据
13、处理能力主要是针对研究对象的特殊性,选择合理的收集数 据的方法,根据问题的具体情况,选取合适的统计方法整理数据,并构建模型对数据进行分 析、推断,获得结论数据处理能力要求学生能理解问题所提供的文字、数字、图形、图表 等信息,并能从中提取有关信息,对它们进行分析和处理能对有关的数据和图形进行统计 和分析,应用统计或统计案例中的方法解决实际问题 例(2017 全国卷理 19)为了监控某种零件的一条生产线的生产过程,检验员每天 从该生产线上随机抽取 16 个零件,并测量其尺寸(单位:cm)根据长期生产经验,可 以认为这条生产线正常状态下生产的零件的尺寸服从正态分布 2 (
14、,)N ()假设生产状态正常,记X表示一天内抽取的 16 个零件中其尺寸在 (3 ,3 ) 之外的零件数,求(1)P X 及X的数学期望; ()一天内抽检零件中,如果出现了尺寸在(3 ,3 ) 之外的零件,就认为这 条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查 (i)试说明上述监控生产过程方法的合理性; (ii)下面是检验员在一天内抽取的 16 个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10
15、.05 9.95 经计算得 16 1 1 9.97 16 i i xx , 1616 2 22 11 11 ()(160.212 1616 ii ii sxxxx 其中 i x 为抽取的第i个零件的尺寸,1,2,16i 用样本平均数x作为的估计值,用样本标 准差s作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除 (3 ,3 ) 之外的数据,用剩下的数据估计和(精确到 0.01)附:若随机变量 Z服从正态分 2 ( ,)N ,则(33 )0.9974PZ, 16 0.99740.9592, 0.0080.09 &n
16、bsp;简解()由正态分布知一个零件的尺寸在(3 ,3 ) 之外的概率为 0.0026,再由独 立 重 复 试 验 的 概 率 模 型 可 知 故X服 从 二 项 分 布(16,0.0026)B, 从 而 16 (1)1(0)1 0.99740.0408P XP X ,16 0.00260.416EX ()() 如果生产状态正常, 零件尺寸服从正态分布, 那么零件在(3 ,3 ) 之外取值的概率只有 0.0026抽取的 16 个零件中,出现尺寸在(3 ,3 ) 之外的概 率只有 0.0408,发生的概率很小这样小概率事件在实际中几乎不会发生一旦发生这种情
17、况,就有理由认为这个事件不是小概率事件,即可推断零件尺寸不服从正态分布,也就是说 生产状态不正常, 即这条生产线在这一天的生产过程可能出现了异常情况, 需对当天的生产 过程进行检查,可见上述监控生产过程的方法是合理的 ()由题中所给条件易得结果,只是要注意充分利用题中的信息在计算的估计 值时, 先判断剔除的数据是 9.22, 计算剩下数据的平均数为 1 (16 9.979.22)10.02 15 , 进而剔除数据后的样本方差为 22 1 (1591.1349.2215 10.02 )0.008 15 ,因此 的估 计值为0.09 本题充满了创新性, 数据处理问题是该题
18、的另一个亮点, 从大量数据中对研究问题提取 出有用的信息,构建“随机抽样一收集数据一整理、分析数据一提取信息一用信息去说明问 题”的框架在统计问题中,数据的获得是至关重要的此题用给出的数据,灵活的考查了 相关知识,尤其第()小题,在原有 16 个数据平均数和标准差考查去掉一个数后的平均 数标准差,用数据说话,也是每年高考概率与统计试题之中的有效考查方式 课标卷的统计与概率解答题分别以“频率分布直方图”、“茎叶图”、“折线统计图”、“统 计表”和“文字语言”不同方式呈现对数据处理能力的考查,考查的知识点也各不相同,但从 考查的“数据处理能力”来看,思路一直没有改变,且不断加强无论是哪种方式呈现,
19、数据 都是含有信息的, 根据数据的特点选择不同的计算方式以及对公式或数据进行变形和对参考 数据的解读, 这些都是最基本的, 所以与数据处理能力相伴而生的是对数据的解读和对数据 或公式的变形应用,体现了数据分析的核心素养 3.3 作图读图识图提到了非常重要的位置 从表的统计来看,所有试题都与统计图表紧密相连,突出考查“读图识图”的应用意识 和能力,另外统计与概率中有大量的数据与图形相关,要能够识图处理数据主要类型如下 表所示: 表统计图类型统计 试题年份 图形类型 考查内容 2009 作图 作图作频率分布直方图 2015() 作图 作茎叶图 20
20、09 频率分布直方图 估计方差,计算平均数 2013() 频率分布直方图 计算概率与方差 2014() 频率分布直方图 计算平均数与方差 2015() 散点图 求回归方程 2015() 茎叶图 估计平均值与分散程度 2016() 频率分布直方图 求分布列 2016() 折线图 回归分析,相关系数 2017() 频率分布直方图 计算概率, 列联表,中位数 2018() 折线图 回归分析,统计推断 2018() 茎叶图 计算平均数,中位数, 列联表 例(2018 全国卷理 18
21、)下图是某地区 2000 年至 2016 年环境基础设施投资额(单位: 亿元)的折线图 为了预测该地区 2018 年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模 型根据 2000 年至 2016 年的数据(时间变量t的值依次为 1,2,17)建立模型: 30.4 13.5yt ;根据 2010 年至 2016 年的数据(时间变量t的值依次为 1,2,7) 建立模型:99 17.5yt ()分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; ()你认为用哪个模型得到的
22、预测值更可靠?并说明理由 简解()利用模型,该地区 2018 年的环境基础设施投资额的预测值为 30.4 13.5 19226.1y 亿元;利用模型,该地区 2018 年的环境基础设施投资额的 预测值为99 17.5 9256.5y 亿元 ()利用模型得到的预测值更可靠理由如下:()从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线30.4 13.5yt 上下 这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋 势2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2
23、016 年的数据对应 的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增 长趋势,利用 2010 年至 2016 年的数据建立的线性模型99 17.5yt可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠 ()从 计算结果看, 相对于 2016 年的环境基础设施投资额 220 亿元, 由模型得到的预测值 226.1 亿元的增幅明显偏低, 而利用模型得到的预测值的增幅比较合理 说明利用模型得到的 预测值更可靠 以上给出了种理由,考生答出其中任意一种或其他合理理由均可得分 本题背景源于社会生活的实际,要求考生读懂该统计
24、图,从统计图中获得相关的信息, 问题的设置很人性化,通俗易懂,有利于考生分析、解决问题本题注重对数学素养和能力 的考查,在引导中学加强“数学应用能力和应用意识”的教育培养方面具有很好的引导作用, 堪称“读图识图”的典范 3.4 从统计的角度计算概率 概率计算问题,从课标卷来看,既注重计算概率的基本根据计数原理的应用,更注重从 统计的观点来计算概率, 尤其在统计与概率的解答题中体现的淋漓尽致, 是新课标思想的极 致体现 表概率计算统计 试题年份 问题描述 2009 求甲、乙两工人都被抽到的概率 2011 分别估计用配方,配方生产的产品的优质品率 2
25、013() 求这批产品通过检验的概率 2013() 根据直方图估计利润不少于元的概率 2015() 求事件:“地区用户的满意度等级高于地区用户的满意度等级“ 的概率 2016() 求一续保人本年度的保费高于基本保费的概率; 若一续保人本年度的保费高于基本保费, 求其保费比基本保费高出的 概率 2017() 估计事件的概率 3.5 注重综合考查,关注知识交汇 考试大纲在考查要求上开门见山地强调了知识交汇, 与函数相结合考查是课标卷的统计 与概率解答题又一特色之一, 试题的设计注重学科的内在联系和知识的综合性,
26、 从学科的整 体高度和思维价值的高度考虑问题,将交汇的特色突出地彰显 表与函数结合统计 试题年份 函数类型 问题描述 2011 分段函数 利用分段函数求分布列 2012 分段函数 若花店一天购进 16 枝玫瑰花,求当天的利润(单位: 元)关于需求量 n(单位:份,nN)的函数解析式 2013() 分段函数 将表示为的函数 2015() 回归方程 计算二次型函数的最值 2017() 一次函数 求进货量为多少时期望达到最大值 2018() 导数 求( )f p的最大值点 0 p
27、 4 结语 随着人们对统计在决策中的作用的认识的深入,课标卷中加大了对统计内容考查的力 度课标卷统计与概率的命题,从数学学科的整体高度和思维能力的角度出发,将知识、能 力与素养融为一体,全面考查了学生的数学能力与素养,试题注重了数学的学科特点,突出 了知识的基础性和综合性,以知识为主体,顺应时代需求,在知识交汇处设计试题,使对统 计概率的基础知识的考查达到了必要的深度和广度, 以此来推动概率统计思想在中学教学中 的渗透和发展 本文以 2009 年至 2018 年高考全国课标卷理科为例, 把十年课标卷的统计与概率内容进 行了一次较为系统的总结与分析,详细阐述了近几年统计与概率解答题的探索与改革方向, 以及试题背后蕴含的统计思想, 以期让一线教师更加了解试题的设计初衷, 为更好地进行统 计与概率的教与学提供了一个参考框架本人水平有限,如有不当之处请批评指正 参考文献 中华人民共和国教育部普通高中数学课程标准(实验)北京:人民教育出 版社,2003 教育部考试中心2018 年普通高等学校招生全国考试大纲的说明北京:高 等教育出版社,2017 陈昂,任子朝课改后统计与概率内容考查研究数学通报,2013,62(2): 1316 吕荣春全国卷高考数学分析与对策四川:四川大学出版社,2018