1、第2讲概率与统计(大题)板块二专题四概率与统计NEIRONGSUOYIN内容索引热点分类突破真题押题精练1PART ONE热点一以二项分布为背景的期望与方差热点二以超几何分布为背景的期望与方差热点三统计与统计案例的交汇问题热点一以二项分布为背景的期望与方差利用二项分布解题的一般步骤:(1)根据题意设出随机变量.(2)分析随机变量服从二项分布.(3)找到参数n,p.(4)写出二项分布的概率表达式.(5)求解相关概率.例1(2019怀化模拟)在全国第五个“扶贫日”到来之际,某省开展“精准脱贫,携手同行”的主题活动,某贫困县调查基层干部走访贫困户数量.A镇有基层干部60人,B镇有基层干部60人,C镇
2、有基层干部80人,每人走访了不少贫困户.按照分层抽样,从A,B,C三镇共选40名基层干部,统计他们走访贫困户的数量,并将走访数量分成5组,5,15),15,25),25,35),35,45),45,55,绘制成如下频率分布直方图.(1)求这40人中有多少人来自C镇,并估计三镇基层干部平均每人走访多少贫困户.(同一组中的数据用该组区间的中点值作代表);解因为A,B,C三镇分别有基层干部60人,60人,80人,共200人,利用分层抽样的方法选40人,所以这40人中有16人来自C镇,所以三镇基层干部平均每人走访贫困户28.5户.(2)如果把走访贫困户达到或超过25户视为工作出色,以频率估计概率,从三
3、镇的所有基层干部中随机选取3人,记这3人中工作出色的人数为X,求X的分布列及期望.解由直方图得,从三镇的所有基层干部中随机选出1人,所以X的分布列为跟踪演练1(2019河北省五个一名校联盟联考)山东省高考改革试点方案规定:从2017年秋季高中入学的新生开始,不分文理科;2020年开始,高考总成绩由语数外3门统考科目和物理、化学等六门选考科目构成.将每门选考科目的考生原始成绩从高到低划分为A,B,B,C,C,D,D,E共8个等级.参照正态分布原则,确定各等级人数所占比例分别为3%,7%,16%,24%,24%,16%,7%,3%.选考科目成绩计入考生总成绩时,将A至E等级内的考生原始成绩,依照等
4、比例转换法则,分别转换到91,100,81,90,71,80,61,70,51,60,41,50,31,40,21,30八个分数区间,得到考生的等级成绩.某校高一年级共2 000人,为给高一学生合理选科提供依据,对六个选考科目进行测试,其中物理考试原始成绩基本服从正态分布N(60,169).(1)求物理原始成绩在区间(47,86的人数;解因为物理原始成绩N(60,132),所以P(4786)P(4760)P(6086)0.818 6.所以物理原始成绩在(47,86的人数为2 0000.818 61 637.(2)按高考改革方案,若从全省考生中随机抽取3人,记X表示这3人中等级成绩在区间61,8
5、0的人数,求X的分布列和期望.(附:若随机变量N(,2),则P()0.682 7,P(22)0.954 5,P(33)0.997 3)所以X的分布列为热点二以超几何分布为背景的期望与方差求超几何分布的分布列的一般步骤:(1)确定参数N,M,n的值.(2)明确随机变量的所有可能取值,并求出随机变量取每一个值时对应的概率.(3)列出分布列.例2(2019茂名质检)2018年茂名市举办“好心杯”少年美术书法作品比赛,某赛区收到200件参赛作品,为了解作品质量,现从这些作品中随机抽取12件作品进行试评.成绩如下:67,82,78,86,96,81,73,84,76,59,85,93.(1)求该样本的中
6、位数和方差;解样本数据按从小到大的顺序排列为59,67,73,76,78,81,82,84,85,86,93,96.(2)若把成绩不低于85分(含85分)的作品认为是优秀作品,现在从这12件作品中任意抽取3件,求抽到优秀作品的件数的分布列和期望.解设抽到优秀作品的个数为X,则X的可能值为0,1,2,3,所以X的分布列为跟踪演练2(2019天津市十二重点中学联考)某大学在一次公益活动中聘用了10名志愿者,他们分别来自于A,B,C三个不同的专业,其中A专业2人,B专业3人,C专业5人,现从这10人中任意选取3人参加一个访谈节目.(1)求3个人来自两个不同专业的概率;解令事件A表示“3个人来自于两个
7、不同专业”,A1表示“3个人来自于同一个专业”,A2表示“3个人来自于三个不同专业”,3个人来自两个不同专业的概率(2)设X表示取到B专业的人数,求X的分布列与期望.解随机变量X的取值为0,1,2,3,X的分布列为热点三统计与统计案例的交汇问题1.解决回归分析问题要注意:(2)利用回归直线方程只能进行预测与估计,而得不到准确数值.2.解决统计案例问题关键是过好三关:(1)假设关,即假设两个分类变量无关.(2)应用公式关,把相关数据代入独立性检测公式求出K2的观测值k.(3)对比关,将k与临界值进行对比,进而作出判断.例3(2018全国)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产
8、任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;解第二种生产方式的效率更高.理由如下:()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min;用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.()由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 mi
9、n;用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.()由茎叶图可知,用第一种生产方式的工人完成生产任务平均所需时间高于80 min;用第二种生产方式的工人完成生产任务平均所需时间低于80 min.因此第二种生产方式的效率更高.()由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生
10、产任务所需的时间更少.因此第二种生产方式的效率更高.(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表;超过m不超过m总计第一种生产方式 第二种生产方式 总计 列联表如下:超过m不超过m总计第一种生产方式15520第二种生产方式51520总计202040(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?P(K2k0)0.0500.0100.001k03.8416.63510.828所以有99%的把握认为两种生产方式的效率有差异.跟踪演练3(2019德州模拟)某数学小组从医院和气象局获得今年1月至6月份每月
11、20日的昼夜温差(x,x3)和患感冒人数(y/人)的数据,画出折线图.(1)由折线图看出,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;可用线性回归模型拟合y与x的关系.(2)建立y关于x的线性回归方程(精确到0.01),预测昼夜温差为4时患感冒的人数(精确到整数).预测昼夜温差为4时患感冒的人数约为4人.2PART TWO押题预测真题体验(2018全国,理,20)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的
12、概率都为p(0p1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0;真题体验令f(p)0,得p0.1.当p(0,0.1)时,f(p)0;当p(0.1,1)时,f(p)0.所以f(p)的最大值点为p00.1.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);解由(1)知,p0.1.令Y表示余下的180件产品中的不合
13、格品件数,依题意知YB(180,0.1),X20225Y,即X4025Y.所以E(X)E(4025Y)4025E(Y)40251800.1490.以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?解若对余下的产品作检验,则这一箱产品所需要的检验费用为400元.由于E(X)400,故应该对余下的产品作检验.押题预测某学校为了了解全校学生的体重情况,从全校学生中随机抽取了100人的体重数据,结果这100人的体重全部介于45公斤到75公斤之间,现将结果按如下方式分为6组:第一组45,50),第二组50,55),第六组70,75,得到如下图(1)所示的频率分布直方图,并发现这
14、100人中,其体重低于55公斤的有15人,这15人体重数据的茎叶图如图(2)所示,以样本的频率作为总体的概率.(1)求频率分布直方图中a,b,c的值;解由图(2)知,100名样本中体重低于50公斤的有2人,在50,55)上有13人,该组的频率为0.13,(2)从全校学生中随机抽取3名学生,记X为体重在55,65)的人数,求X的分布列和期望;解用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在55,65)的概率为0.07100.7,随机抽取3人,相当于三次独立重复试验,随机变量X服从二项分布B(3,0.7),X的所有可能取值为0,1,2,3.所以X的分布列为X0123P0.0270.1890.4410.343E(X)30.72.1.(3)由频率分布直方图可以认为,该校学生的体重近似服从正态分布N(,2),其中60,225.若P(20.954 5,则认为该校学生的体重是正常的.试判断该校学生的体重是否正常,并说明理由.解由N(60,25)得5,由图(2)知P(22)P(500.954 5.所以可以认为该校学生的体重是正常的.