1、高考大题增分专项六高考中的概率、统计与统计案例,-2-,从近五年的高考试题来看,在高考的解答题中,对概率、统计与统计案例的考查主要有三个方面:一是统计与统计案例,以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计、判断,其中回归分析、独立性检验、用样本的数据特征估计总体的数据特征是考查重点,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查;二是统计与概率综合,以现实生活为背景,利用频率估计概率,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查;三是古典概型的综合应用,以现实生活为背景,求某些事件发生的概率,常与抽样方法、茎叶图等统计知识交汇考查.,-3-,题
2、型一,题型二,题型三,题型四,题型五,已知样本的频率分布表或样本的频率分布直方图,求样本的中位数、平均数、方差、标准差等数字特征.由于每个样本的具体值不知道,只知道各区间上的端点值,这时取区间两端数据的平均值作为样本的具体值,求样本的数字特征.,-4-,题型一,题型二,题型三,题型四,题型五,例1我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图.,-5-,题型一,题型二,题型三,题型四,题型五,(1)求直方图中a
3、的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图,可知月均用水量在0,0.5)的频率为0.080.5=0.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5a+0.5a,解得a=0.30.,-6-,题型一,题型二,题型三,题型四,题型五,(2)由(1),100位居民月均用水量不低于3吨的频率为0.
4、06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 0000.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.730.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.480.5,所以2x2.5.由0.50(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.,-7-,题型一,题型二,题型三,题型四,题型五,对点训练1从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布
5、表:,-8-,题型一,题型二,题型三,题型四,题型五,(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?,-9-,题型一,题型二,题型三,题型四,题型五,解 (1),-10-,题型一,题型二,题型三,题型四,题型五,(2)质量指标值的样本平均数为 =800.06+900.26+1000.38+1100.22+1200.08=100.质量指标值的样本方差为s2=(-20)20.06+(-10)20.26+0
6、0.38+1020.22+2020.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.,-11-,题型一,题型二,题型三,题型四,题型五,-12-,题型一,题型二,题型三,题型四,题型五,例2某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(
7、i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,-13-,题型一,题型二,题型三,题型四,题型五,(1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:当年宣传费x=49时,年销售量及年利润的预报值是多少?当年宣传费x为何值时,年利润的预报值最大?,-14-,题型一,题型二,题型三,题型四,题型五,-15-,题型一,题型二,题型三,题型四,题型
8、五,-16-,题型一,题型二,题型三,题型四,题型五,对点训练2(2017湖北武汉五月调考)据某市地产数据研究显示,2016年该市新建住宅销售均价走势如图所示,3月至7月房价上涨过快,为抑制房价过快上涨,政府从8月开始采用宏观调控措施,10月份开始房价得到很好的抑制.(1)地产数据研究院发现,3月至7月的各月均价y(万元/平方米)与月份x之间具有较强的线性相关关系,试建立y关于x的回归方程;(2)若政府不调控,依此相关关系预测第12月份该市新建住宅销售均价.,-17-,题型一,题型二,题型三,题型四,题型五,-18-,题型一,题型二,题型三,题型四,题型五,在统计中,一般通过计算现实生活中某事
9、件的频率,从而用来估计事件的概率,然后用概率来解决其他相关问题.,-19-,题型一,题型二,题型三,题型四,题型五,例3(2017全国,文19)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:,旧养殖法,新养殖法,-20-,题型一,题型二,题型三,题型四,题型五,(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:,-21-,题型一,
10、题型二,题型三,题型四,题型五,解:(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表,-22-,题型一,题型二,题型三,题型四,题型五,(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.,-23-,题型一,题
11、型二,题型三,题型四,题型五,对点训练3(2017北京,文17)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),30,40),80,90,并整理得到如下频率分布直方图:,-24-,题型一,题型二,题型三,题型四,题型五,(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.,
12、解: (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.,-25-,题型一,题型二,题型三,题型四,题型五,(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)10=0.9,分数在区间40,50)内的人数为100-1000.9-5=5.所以总体中分数在区间40,50)内的人数估计为(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)10100=60,所以样本中分数不小于70的
13、男生人数为60 =30.所以样本中的男生人数为302=60,女生人数为100-60=40,男生和女生人数的比例为6040=32.所以根据分层抽样原理,总体中男生和女生人数的比例估计为32.,-26-,题型一,题型二,题型三,题型四,题型五,在求古典概型的概率时,常常应用列举法找出基本事件数及所求事件包含基本事件数.列举的方法通常有直接分类列举、列表、树状图等.,-27-,题型一,题型二,题型三,题型四,题型五,例4襄阳市某优质高中为了选拔学生参加“全国中学生英语能力竞赛(NEPCS)”,先在本校进行初赛(满分150分),若该校有100名学生参加初赛,并根据初赛成绩得到如图所示的频率分布直方图.
14、,(1)根据频率分布直方图,计算这100名学生参加初赛成绩的中位数;(2)该校推荐初赛成绩在110分以上的学生代表学校参加竞赛,为了了解情况,在该校推荐参加竞赛的学生中随机抽取2人,求选取的2人的初赛成绩在频率分布直方图中处于不同组的概率.,-28-,题型一,题型二,题型三,题型四,题型五,解(1)设初赛成绩的中位数为x,则(0.001+0.004+0.009)20+0.02(x-70)=0.5,解得x=81,故初赛成绩的中位数为81.(2)该校学生的初赛分数在110,130)有0.00220100=4(人),分别记为A,B,C,D;分数在130,150有0.00120100=2(人),分别记
15、为a,b.在这6人中随机选取2人,总的基本事件有(A,B),(A,C),(A,D),(A,a),(A,b),(B,C),(B,D),(B,a),(B,b),(C,D),(C,a),(C,b),(D,a),(D,b),(a,b)共15个,其中符合题设条件的基本事件有8个.故选取的2人的初赛成绩在频率分布直方图中处于不同组的概率为,-29-,题型一,题型二,题型三,题型四,题型五,对点训练4某工厂对一批共50件的机器零件进行分类检测,其质量(单位:g)统计如下:规定质量在82g及以下的为甲型,已知该批零件有甲型2件.(1)从该批零件中任选1件,若选出的零件质量在95,100内的概率为0.26,求m的值;(2)从质量在80,85)内的5件零件中,任选2件,求其中恰有1件为甲型的概率.,-30-,题型一,题型二,题型三,题型四,题型五,解 (1)因为从该批零件中任选1件,选出的零件质量在95,100内的概率为0.26,所以n=500.26=13,所以m=50-5-12-13=20.(2)质量在80,85)内的5件零件中,甲型有2件,分别记作a,b;剩下的3件分别记作c,d,e.从质量在80,85)内的5件零件中,任选2件,总的基本事件为ab,ac