1、概率与统计二轮复习概率与统计二轮复习海淀区海淀区2020届高三数学二轮复习指导届高三数学二轮复习指导参考资料参考资料p 中国高考评价体系中国高考评价体系参考资料参考资料p 20192019年普通高等学校招生全国统一考试大纲年普通高等学校招生全国统一考试大纲参考资料参考资料p 2019年北京文理考试说明p 普通高中数学课程标准(2017年版)p 2017 年普通高中数学学科教学与评价指导意见p 高考试题(北京及全国卷)p 近三年各区模拟试题目 录CONTENTS考试内容考试内容“数据分析数据分析”学科学科核心素养核心素养教学教学建议建议规范表达规范表达01明确考试内容对照原北京考试对照原北京考试
2、说明说明删除删除删除删除对照原北京考试对照原北京考试说明说明对照原北京考试对照原北京考试说明说明提高提高降低降低02高考中的“数据分析”学科核心素养命题原则命题原则指导意见指出:命题应依据“课程内容”和数学核心素养要求,注重对学生数学核心素养的考查。课标(2017年版):将“数据分析”作为高中数学课程目标中培养学生所具备的六个数学学科核心素养之一数据分析素养的内涵数据分析素养的内涵课标(2017年版)指出:数据分析是指针对研究对象获取数据,运用统计方法对数据进行整理、分析和推断,形成关于研究对象知识的素养。数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论。数据分
3、析素养的内涵数据分析素养的内涵数据分析数字型数据非数字型数据有效收集和整理数据获得结论形成知识有效的建模和推断数据数据分析数据分析素养的数学学科价值素养的数学学科价值课标(2017年版)指出:数据分析是研究随机现象的重要数学技术,是大数据时代数学应用的主要方法,也是“互联网+”相关领域的主要数学方法,已经深入到科学、技术、工程和现代社会生活的各个方面。数据分析数据分析素养的数学学科价值素养的数学学科价值独特之处立论基础不同立论基础不同判断准则不同判断准则不同推理方法不同推理方法不同数据分析数据分析素养素养的的育人育人价值价值课标(2017年版)指出:通过高中数学课程的学习,学生能提升获取有价值
4、信息并进行定量分析的意识和能力;适应数字化学习的需要,增强基于数据表达现实问题的意识,形成通过数据认识事物的思维品质,积累依托数据探索事物本质、关联和规律的活动经验。数据分析数据分析素养素养的的三三个水平个水平【情境与问题】【知识与技能】【思维与表达】【交流与反思】数据分析数据分析素养素养的的三三个水平举例分析(个水平举例分析(20192019年北京高考)年北京高考)【情境与问题情境与问题】支付方式的变化支付方式的变化如何如何用统计估计概率,如何计用统计估计概率,如何计算随机事件的概率,以及如何算随机事件的概率,以及如何根据概率的思想作出决策。根据概率的思想作出决策。数据分析数据分析素养素养的
5、的三三个水平举例分析(个水平举例分析(20192019年北京高考)年北京高考)【知识与技能之一知识与技能之一】了解概率的意义以及频率与概率的区别,可以通过统计的方法估计概率,会用样本的频率分布估计总体分布对应水平一对应水平一数据分析数据分析素养素养的的三三个水平举例分析(个水平举例分析(20192019年北京高考)年北京高考)【思维与表达之一思维与表达之一】从全校学生中随机抽取1人,他的支付方式是不确定的,从中理解随机事件发生的不确定理解随机事件发生的不确定性性,而样本中上个月A,B两个支付方式都使用的频率是0.4,这是确定的,所以可以估计从全校学生中随机抽取1人,A,B两个支付方式都使用的概
6、率为0.4,从中体会用样本估计总体会用样本估计总体体的的统计推断统计推断思想思想。数据分析数据分析素养素养的的三三个水平举例分析(个水平举例分析(20192019年北京高考)年北京高考)【知识与技能之二知识与技能之二】能够识别随机现象,知道随机现象与随机变量之间的关联,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性,并能计算简单离散型随机变量的均值能够选择合适的概率模型计算能够选择合适的概率模型计算概率概率对应水平二对应水平二对应水平一对应水平一数据分析数据分析素养素养的的三三个水平举例分析(个水平举例分析(20192019年北京高考)年北京高考)【思维与表达
7、之二思维与表达之二】研究一个随机现象,就是要了解它所有可能出现的结果和每一个结果出现的概率,分布列正是描述了离散型随机变量取值的概率规律,要能够规范地表达求解分布列的过程。而在计算概率的时候,必须能够准确地分清概率模型。数据分析数据分析素养素养的的三三个水平举例分析(个水平举例分析(20192019年北京高考)年北京高考)【知识与技能之三知识与技能之三】能够用概率的思维分析随机现象。考察学生对概率思想的正确理解和认识,以及运用概率思想对实际生活中遇到的问题作出决策的科学素养。对应水平三对应水平三数据分析数据分析素养素养的的三三个水平举例分析(个水平举例分析(20192019年北京高考)年北京高
8、考)【思维与表达之三思维与表达之三】能够主动地运用概率知识来研究随机现象发生的可能性大小,分析随机现象的本质,用概率的语言进行表达。数据分析数据分析素养素养的的三三个水平举例分析(个水平举例分析(20192019年北京高考)年北京高考)【交流与思考交流与思考】用用数据说话,表达要到位数据说话,表达要到位面对以数据为载体的概率统计问题,教师要按照题目的要求,引导学生对已知数据做处理,处理的过程就是数据分析的过程。这一过程不仅仅是简单的读题,而是有引导的思维过程。这就充分说明,数据分析这一核心素养与其他的数学的五个核心素养同等重要,教师在教学中要教会学生领悟。张鹤03教学建议 聚焦概念、查漏补缺聚
9、焦概念、查漏补缺p 总体与样本总体是统计研究的对象,通常总体中的每个个体可以对应成数值,当知道了这些数值在总体中所占的比例,就知道了总体的分布。样本是揭示总体规律的手段。样本的原则要样本的分布符合总体的规律,同时,样本的选取要具有随机性。随机性是样本最大的特点。有的时候研究的对象是总体中的某一类。【20202020届西城期末届西城期末1616题题】分不清总体和样本是造成分不分不清总体和样本是造成分不清超几何分布和二项分布的一清超几何分布和二项分布的一个原因之一个原因之一 聚焦概念、查漏补缺聚焦概念、查漏补缺p 频率与概率【20192019届北京高考届北京高考1717题题】【20182018届西
10、城届西城一模一模1616题题】对对概率概率的意义的意义以及以及频率频率与概率的与概率的区别区别还存在认识上的问还存在认识上的问题题【20172017北京高考文北京高考文1717题题】聚焦概念、查漏补缺聚焦概念、查漏补缺p 超几何分布与二项分布 聚焦概念、查漏补缺聚焦概念、查漏补缺p 超几何分布与二项分布【20202020届西城期末届西城期末1616题题】易混点易混点乘坐高铁的所有成年人都是可分乘坐高铁的所有成年人都是可分为两类:老年人、非为两类:老年人、非老年人老年人随机选取随机选取1人,这个人是老年人的人,这个人是老年人的概率概率相同相同差异差异 研究的对象数量是否明确研究的对象数量是否明确
11、 不不放回还是放回抽取放回还是放回抽取 相互独立还是不独立相互独立还是不独立当做一次试验,发生的结果有两种情况时,随机变量当做一次试验,发生的结果有两种情况时,随机变量要么服从超几何分布,要么服从二项分布,如何区分?要么服从超几何分布,要么服从二项分布,如何区分?第一招:第一招:如果研究的对象数量明确,一般是超几何分布,如果不明如果研究的对象数量明确,一般是超几何分布,如果不明确,一定是二项分布;确,一定是二项分布;第二招第二招:如果题目给出了:如果题目给出了“独立独立”“”“有放回有放回”“”“互相不影响互相不影响”“”“以以频率作为概率频率作为概率”“”“计划计划”“”“未来未来”等等关键
12、词等等关键词,一定是二项分布。,一定是二项分布。品牌品牌A的测试结果大于品牌的测试结果大于品牌B的测试结果的测试结果 品牌品牌A的测试的测试结果不大于结果不大于品牌品牌B的测试的测试结果结果6次次6次次 超标超标 不超标不超标 5天天 10天天优或良优或良不是优良不是优良20天天10天天30人人成绩优秀成绩优秀 成绩不优秀成绩不优秀 30人人 10人人 非超几何与二项分布的模型非超几何与二项分布的模型 突出重点、核心,不求全面覆盖突出重点、核心,不求全面覆盖p 排列组合知识不必单独复习p 深化对重点知识的理解和运用以及方法的一般化 统计部分重点是如何刻划和描述结果?概率部分重点是几个典型的随机
13、变量分布模型,以及随机变量的数字特征 开放性问题进行推断的依据就是对数字特征的分析,以及随机思想的运用 以数字特征为例以数字特征为例p 平均数、中位数、众数表示一组数据的集中趋势p 极差、方差、标准差表示一组数据离散的表示一组数据离散的程度程度p 随机变量的期望(均值)刻画了随机变量取值的中心位置,反映了取值的平均水平,随机变量的 方差反映了随机变量相对于期望的平均波动大小(离散程度)。样本的数字特征是随机的,样本改变,则其相应的数字特征可能就会发生变化。但是,随机变量的分布完全描述了随机现象的规律,它完全确定了期望等数字特征,所以随机变量的数字特征没有随机性,是确定的。20142014年北京
14、高考题年北京高考题EXx 以数字特征为例以数字特征为例常用结论常用结论2()()()()E YaE XbD Ya D X+1.平均数与方差的大小与数值的顺序无关 以数字特征为例以数字特征为例常用结论常用结论由图判断从哪天开始连续由图判断从哪天开始连续三天的空气质量指数方差三天的空气质量指数方差最大?(结论不要求证明)最大?(结论不要求证明)试判断这试判断这100名患者中服药者指标名患者中服药者指标x数据的方差与未服药者指标数据的方差与未服药者指标y数据数据的方差的大小(只需写出结论)的方差的大小(只需写出结论)以数字特征为例以数字特征为例常用结论常用结论 以数字特征为例以数字特征为例常用结论常
15、用结论5.在在频率分布直方图中,通常假设它们在组内均匀分布频率分布直方图中,通常假设它们在组内均匀分布.样本平均数样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替积之和近似代替;样本的中位数样本的中位数应该满足左边和右边的直方图的面积相等应该满足左边和右边的直方图的面积相等;样本的众数样本的众数可以用高度最高的小矩形的底边中点的横坐标近似代替可以用高度最高的小矩形的底边中点的横坐标近似代替.平均数:中位数:众数:5.70.077 3+0.107(-4.2)=0.5x6.71x 在下面的三种分布形态中,平均数、中位数、众
16、数的大小关系为:以数字特征为例以数字特征为例常用结论常用结论6.超几何分布超几何分布 二项分布二项分布 二点分布二点分布 ()ME XnN(),()(1)E Xnp D Xnpp(),()(1)E Xp D Xpp142536DDDDDD辨别辨别(3 0 3)X B,.3 0.30.9EX 如何如何“用数据说话用数据说话”一位田径教练想确定运动员们在运动时适宜的心率。他选择了五位最好的跑步运动员,并让他们在运动时佩戴心率检测器。在训练过程中,他得到了五位运动员的心率:130,135,140,145,325.那么,这名田径教练应该是选择平均数还是选择中位数来得到心率的平均水平呢?【答案】五个数值
17、中的四个数值相对较近,对于训练时的心率来说似乎很合理。325这个很大的数值是一个异常值,可能是心率检测值坏了,因为任何人达到这一高心率时都应该处于心脏骤停的状况。所以,如果教练选择均值来作为整体的平均水平,就会包括这个异常值,使用这个数据时会出现错误。如果选择中位数来体现平均水平,会得到一个更为合理的数值,因为中位数不会被异常值所影响。如何如何“用数据说话用数据说话”不能被数据误导不能被数据误导奥尼尔:奥尼尔:50%50%卡特:卡特:57.1%57.1%11221122,acacbdbd12121212aaccbbdd+表:投篮命中率表:投篮命中率【2018年西城一模年西城一模】某企业 201
18、7 年招聘员工,其中 A、B、C、D、E 五种岗位的应聘人数、录用人数和录用比例(精确到 1%)如下:岗岗位位 男男性性应应聘聘人人数数 男男性性录录用用人人数数 男男性性录录用用比比例例 女女性性应应聘聘人人数数 女女性性录录用用人人数数 女女性性录录用用比比例例 A 269 167 62%40 24 60%B 40 12 30%202 62 31%C 177 57 32%184 59 32%D 44 26 59%38 22 58%E 3 2 67%3 2 67%总计 533 264 50%467 169 36%()表中 A、B、C、D、E 各岗位的男性、女性录用比例都接近(二者之差的绝对值
19、不大于5%),但男性的总录用比例却明显高于女性的总录用比例研究发现,若只考虑其中某四种岗位,则男性、女性的总录用比例也接近,请写出这四种岗位(只需写出结论)【答案】这四种岗位是:B、C、D、E 如何如何“用数据说话用数据说话”男生掷实心球得分如下:男生掷实心球得分如下:4 4 4 6 6 6 7 7 8 8 8 8 9 9 9 9 9 10 10女生掷实心球得分如下:女生掷实心球得分如下:5 6 7 7 7 7 7 7 8 8 8 9 9 9 9 9 9 9 10 10 1.1.估计全年级学生实心球项目的得估计全年级学生实心球项目的得分中分中9 9分的最多。分的最多。2.2.估计全年级学生中男
20、、女生实心估计全年级学生中男、女生实心球项目得分的中位数都为球项目得分的中位数都为8 8。3.3.估计全年级学生中男生实心球项估计全年级学生中男生实心球项目平均得分低于女生的平均得分。目平均得分低于女生的平均得分。4.4.估计全年级学生中男生实心球项估计全年级学生中男生实心球项目的得分不如女生的得分集中。目的得分不如女生的得分集中。如何如何“用数据说话用数据说话”明确有两个明确有两个角度:角度:一一个是个是集中的角度集中的角度(参数有:平均数、中位数、众数(参数有:平均数、中位数、众数)一一个是个是离散的角度离散的角度(极差、方差、标准差)。(极差、方差、标准差)。如何如何“用数据说话用数据说
21、话”新高考的变化:新高考的变化:p 考题可选择充分尊重学生的个性化发展,让学生有更多的学习选择p 答案开放性培养学生思考问题和解决问题能力,而不是僵化标准答案对统计的考查不仅是计算统计量的大小,更重要的是要会对计算得出的样本的数字特征去对总计进行估计,能通过对数据的分析为合理决策提供一些依据,考查样本估计总体的统计思想对概率的考查不只停留在对概率计算的层面,要能够利用概率的计算结果,为决策提供关键性的依据评分标准:评分标准:给给出明确结论,出明确结论,1 1分,分,结合已有数据,能够运用以下三个标准中的任何一个陈结合已有数据,能够运用以下三个标准中的任何一个陈述得出该结论的理由,述得出该结论的
22、理由,2 2分分.标准标准1:1:会用主题活动前后的百分比变化进行会用主题活动前后的百分比变化进行阐述阐述标准标准2 2:会用三个周期的诚信度平均数变化进行阐述:会用三个周期的诚信度平均数变化进行阐述 标准标准3 3:会用主题活动前后诚信度变化趋势进行阐述:会用主题活动前后诚信度变化趋势进行阐述评分标准:评分标准:给给出明确结论,出明确结论,1分;分;结合已有数据,能够运用以下结合已有数据,能够运用以下8个标准中的任何一个陈述得出该结论的理由,个标准中的任何一个陈述得出该结论的理由,2分分.2018届海淀期末届海淀期末()如果选择)如果选择A,可以从,可以从A的亩产数据的中位数或平均值比的亩产
23、数据的中位数或平均值比B高等方面叙述理由高等方面叙述理由 如果选择如果选择B,可以从,可以从B的亩产数据比的亩产数据比A的方差小,比较稳定等方面叙述理由的方差小,比较稳定等方面叙述理由2020届房山期末届房山期末18题题 突出重点、核心,不求全面覆盖突出重点、核心,不求全面覆盖p 二项式定理011()nnnrn rrnnnnnnabC aC abC abC b+1.通项(第通项(第r+1项)项)1rn rrrnTC ab+2.区分二项展开式中某一项的系数、二项式系数区分二项展开式中某一项的系数、二项式系数3.区分二项展开式中各项的系数和、各项的二项式系数和区分二项展开式中各项的系数和、各项的二项式系数和 举例举例04规范表达20142014年北京文科高考年北京文科高考1818题题20132013年北京文科高考年北京文科高考1616题题北京适应性考试北京适应性考试1818题题北京适应性考试北京适应性考试1818题题20172017年北京理科高考年北京理科高考1717题题【20202020届西城期末届西城期末1616题题】最好添加一句话:所以可估计最好添加一句话:所以可估计乘坐高铁的满意度均值大于乘乘坐高铁的满意度均值大于乘坐飞机的满意度均值坐飞机的满意度均值满意度不等于满意率满意度不等于满意率