1、2020高考数学核心突破专题7-概率与统计-第3讲-统计与统计案例第第3讲统计与统计案例讲统计与统计案例考情回顾考情回顾热点题型突破热点题型突破题型一抽样方法 1在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是_4突破点拨对数据分组,在区间139,151上有几组就有几个运动员解析 3575,因此可将编号为135的35个数据分成7组,每组有5个数据,在区间139,151上共有20个数据,分在4个小组中,每组取1人,共取4人 2(1)(2017山东名校联考信息卷)某
2、书法社团有男生30名,女生20名,从中抽取一个容量为5的样本,恰好抽到了2名男生和3名女生该抽样一定不是系统抽样;该抽样可能是随机抽样;该抽样不可能是分层抽样;男生被抽到的概率大于女生被抽到的概率其中说法正确的为()ABCD(2)(2018山东潍坊模拟)某校对高三年级1 600名男女学生的视力状况进行调査,现用分层抽样的方法抽取一个容量为200的样本,已知样本中女生比男生少10人,则该校高三年级的女生人数是_760突破点拨(1)根据抽样方法的特点判断(2)先求出样本中女生或男生的人数,再按分层抽样的定义求解 题型二用样本估计总体 1某电子商务公司对10 000名网络购物者2017年度的消费情况
3、进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示,则直方图中的a_3突破点拨利用各小矩形的面积和为1,建立关于a的方程,解方程求a解析 由0.11.50.12.50.1a0.12.00.10.80.10.21,解得a3.【变式考法】(1)在本例的条件下,在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_(2)在本例的条件下,求消费金额的众数和中位数 6 0002(2017全国卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm)根据长期生产经验,可以认为这条生产线正常状态下生产的零件的
4、尺寸服从正态分布N(,2)(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(3,3)之外的零件数,求P(X1)及X的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(3,3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.试说明上述监控生产过程方法的合理性;下面是检验员在一天内抽取的16个零件的尺寸:突破点拨(1)由正态分布知识及所给数据知XB(16,0.002 6),再利用二项分布知识可求解.(2)由(1)知概率很小,故合理,再利用题设数据计算均值和方程,从而估计和.解析(1)抽取的一个零件的尺寸在(3,3)之内的概率为0.99
5、7 4,从而零件的尺寸在(3,3)之外的概率为0.002 6,故XB(16,0.002 6).因此P(X1)1P(X0)1610.997 4160.040 8.X的数学期望为EX160.002 60.041 6.(2)如果生产状态正常,一个零件尺寸在(3,3)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(3,3)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.用样本估计总体的几点说明(1)用样本的频率分布(频率分布表、频率分
6、布直方图、茎叶图等)估计总体的频率分布.(2)用样本的数字特征(众数、中位数、平均数、方差、标准差)估计总体的数字特征.(3)解决频率分布直方图的有关特征数问题应清楚直方图与特征数值之间的关系,此题把统计和概率结合在一起,比较新颖,也是高考的方向,应引起重视.题型三变量的相关性与统计案例 1(2017天津质检)某市春节期间7家超市的广告费支出xi(单位:万元)和销售额yi(单位:万元)数据如下:突破点拨(1)依据公式计算和,再写出回归方程(2)先判断后计算(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间
7、为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周平均体育运动时间超过4个小时的概率;2某高校共有学生15 000人,其中男生10 500,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”突破点拨(1)由分层抽样各层与总体抽样概率相等求应收集的女生样本数(2)由“超过4小时”与“不超过4小时”是
8、对立事件,间接求得“超过4小时”的概率(3)列出22列联表;求出K2的观测值k,并对照附表作判断(3)由(2)知,300位学生中有3000.75225(位)每周平均体育运动时间超过4小时,75位每周平均体育运动时间不超过4小时因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下热点题源预测热点题源预测概率与统计的综合问题【预测】为降低汽车尾气的排放量,某厂生产甲、乙两种不同型号的节排器,分别从甲、乙两种节排器中各自随机抽取100件进行性能质量评估检测,综合得分情况的频率分布直方图如图所示(1)若从这100件甲型号节排器中按节排器等级用分层抽样的方法
9、抽取10件,再从这10件节排器中随机抽取3件,求至少有2件一级品的概率;(2)视频率分布直方图中的频率为概率,用样本估计总体若从乙型号节排器中随机抽取3件,求二级品数的分布列及数学期望E();从长期来看,投资哪种型号的节排器平均利润较大?【变式考法】(2017安徽三市联考)据某市地产数据研究院的数据显示,2017年该市新建住宅销售均价走势如下图所示为抑制房价过快上涨,政府从8月采取宏观调控措施,10月份开始房价得到很好的抑制(1)地产数据研究院研究发现,3月至7月的各月均价y(万元/平方米)与月份x之间具有较强的线性相关关系,试建立y关于x的回归方程(系数精确到0.01),政府若不调控,以此相关关系预测12月份该市新建住宅销售均价;(2)地产数据研究院在2017年的12个月份中,随机抽取三个月份的数据作样本分析若关注所抽三个月份的所属季度,记不同季度的个数为X,求X的分布列和数学期望解析(1)根据题目中的图象可列数据如下