1、第七章 随机变量及其分布基础知识知识点一概率乘法公式由条件概率的定义,任意两个事件A与B ,若P(A)0,则,我们称上式为概率的乘法公式.知识点二全概率公式一般地,设A1,A2,An是一组两两互斥的事件,A1A2An,且P(Ai)0,i1,2,n,则对任意的事件B,有P(B)(Ai)P(B|Ai),我们称该公式为全概率公式知识点三贝叶斯公式设A1,A2,An是一组两两互斥的事件,A1A2An,且P(Ai)0,i1,2,n,则对任意的事件B,P(B)0,有P(Ai|B),i1,2,n.知识点四离散型随机变量的分布列及其性质1定义:一般地,设离散型随机变量X的可能取值为x1,x2,xn,我们称X取
2、每一个值xi的概率P(Xxi)pi,i1,2,3,n为X的概率分布列,简称分布列2分布列的性质(1)pi0,i1,2,n.(2)p1p2pn1.知识点五离散型随机变量的均值与样本平均值之间的关系均值是随机变量可能取值关于取值概率的加权平均数,它综合随机变量的取值和取值的概率,反映随机变量取值的平均水平若YaXb,其中a,b是常数(X是随机变量),则Y也是随机变量,且有E(aXb)aE(X)b.如下:如果YaXb,其中a,b为常数,X是随机变量,那么Y也是随机变量因此P(Yaxib)P(Xxi),i1,2,3,n,所以Y的分布列为Yax1bax2baxibaxnbPp1p2pipn于是E(Y)(
3、ax1b)p1(ax2b)p2(axib)pi(axnb)pna(x1p1x2p2xipixnpn)b(p1p2pipn)aE(X)b,即E(aXb)aE(X)b.(1)区别:随机变量的均值是一个常数,不依赖于样本的抽取,样本平均值是一个随机变量,它随样本抽取的不同而变化(2)联系:对于简单的随机样本,随着样本容量的增加,样本平均值越来越接近于总体的均值知识点六 二项分布的均值与方差二项分布的均值与方差(1)二项分布的均值:在n次独立重复试验中,若XB(n,p),则E(X )=np.(2) 二项分布的方差:若离散型随机变量X从二项分布,即XB(n,p),则D(X)=np(1-p).知识点七 超
4、几何分布的均值设随机变量X服从超几何分布,则X可以解释为从包含M件次品的N件产品中,不放回地随机抽取n件产品中的次品数.令p=MN , 则p是N件产品的次品率,而是抽取的 n件产品的次品率,则E( Xn )=p,即E(X)=np.知识点八 正态曲线的性质:曲线位于轴上方,与轴不相交;曲线是单峰的,它关于直线对称;曲线在时达到峰值;当时,曲线上升;当时,曲线下降.并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近.曲线与轴之间的面积为1;决定曲线的位置和对称性;当一定时,曲线的对称轴位置由确定;如下图所示,曲线随着的变化而沿轴平移。确定曲线的形状;当一定时,曲线的形状由确定。越小,曲
5、线越“高瘦”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散。题型探究例1某大学为了解学生对两本数学图书的喜好程度,从这两本数学图书都阅读过的生中随机抽取了人,分别对这两本图书进行评分反馈,满分为分,得到的相应数据整理如下表:分数图书频数图书频数学生对图书的“评价指数”如下表:分数评价指数3(1)从两本图书都阅读过的学生中任选人,试估计其对图书“评价指数”为的概率;(2)从对图书“评价指数”为的学生中任选人进一步访谈,设为人中评分在内的人数,求随机变量的分布列及数学期望;(3)试估计学生更喜好哪一本图书,并简述理由.【答案】(1);(2)分布列见解析,;(3)图书,理由见解析
6、.【详解】(1)由频数分布表可知:对图书评分的学生中,“评价指数”为的学生所占的频率为,从两本图书都阅读过的学生中任选人,估计其对图书“评价指数”为的概率为. (2)由题意得:的所有可能取值为,则,的分布列为:的数学期望为.(3)设学生对图书的“评价指数”为,对图书的“评价指数”为从阅读过两本图书的学生中任取一位,估计的分布列为:所以;估计的分布列为:;,学生更喜好图书.例2自从开始实施生活垃圾分类,这一举措对改善环境污染起到了积极的作用,但其是一个需要长期落实的过程,只有坚持落实,才能持续减少对环境的污染为了解垃圾分类的落实情况,现某市从人口数量在两万人左右的320个社区中随机抽取50个社区
7、,对这50个社区某天产生的垃圾量(单位:吨)行了调查,得到如下频数分布表,并将产生的垃圾量在28吨/天及以上的社区确定为“超标”社区:垃圾量频数467911643(以区间中点值作为该组产生的垃圾量)(1)通过频数分布表估算出这50个社区这一天产生的垃圾量的平均值;(2)市政府决定从样本中的“超标”社区中选取4个检验分类成果,经统计,垃圾量不超过30吨/天时可回收率为28%,垃圾量在30吨/天及以上时可回收率为25%记为选取社区回收资源量(单位:吨),求的分布列和数学期望(结果精确到0.01)【答案】(1)23.64吨;(2)分布列见解析;期望为【详解】解:(1)根据频数分布表得:,所以这50个
8、社区这一天产生的垃圾量的平均值为23.64吨(2)由频数分布表知,有7个“超标”社区,其中4个社区一天产生的垃圾量为29吨,回收资源量为吨;3个社区一天产生的垃圾量为31吨,回收资源量为吨,所以可能的取值32.48,32.11,31.74,31.27,且;所以的分布列为32.4832.1131.7431.37所以例32020年,新冠病毒席卷全球,给世界各国带来了巨大的灾难面对疫情,我们伟大的祖国以人民生命至上为最高政策出发点,统筹全国力量,上下一心,进行了一场艰苦的疫情狙击战,控制住了疫情的蔓延并迅速开展相关研究工作某医疗科学小组为了了解患有重大基础疾病(如,糖尿病、高血压)是否与更容易感染新
9、冠病毒有关,他们对疫情中心的人群进行了抽样调查,对其中50人的血液样本进行检验,数据如下表:感染新冠病毒未感染新冠病毒合计不患有重大基础疾病15患有重大基础疾病25合计30(1)请填写列联表,并判断是否有99%的把握认为患有重大基础疾病更容易感染新冠病毒;(2)在抽样调查过程中,发现某样本小组5人中有1人感染新冠病毒,需要通过化验血液来确定感染者,血液化验结果呈阳性即为感染者,呈阴性即未感染下面是两种化验方法:方法一:逐一检验,直到检出感染者为止;方法二:先取3人血液样本,混合在一起检验,如呈阳性则逐一检验,直到检出感染者为止;如呈阴性,则检验剩余2人中任意1人的血液样本求方法一的化验次数大于
10、方法二的化验次数的概率;用X表示方法二中化验的次数,求X的数学期望0.0500.0100.0013.8416.63510.828附:,其中【答案】(1)填表见解析;有;(2);(次)【详解】解:(1)列联表完成如下图感染新冠病毒未感染新冠病毒合计不患有重大基础疾病101525患有重大基础疾病20525合计302050所以有99%的把握认为患重大基础疾病更容易感染新冠病毒(2)记表示依方法一需化验i次,表示依方法二需化验j次,A表示方法一的化验次数大于方法二的化验次数,依题意知与相互独立,由于所以即的可能取值为2,3,所以(次)例4“T2钻石联赛”是世界乒联推出一种新型乒乓球赛事,其赛制如下:采
11、用七局四胜制,比赛过程中可能出现两种模式:“常规模式”和“FAST5模式”.在前24分钟内进行的常规模式中,每小局比赛均为11分制,率先拿满11分的选手赢得该局;如果两名球员在24分钟内都没有人赢得4局比赛,那么将进入“FAST5”模式,“FAST5”模式为5分制的小局比赛,率先拿满5分的选手赢得该局.24分钟计时后开始的所有小局均采用“FAST5”模式.某位选手率先在7局比赛中拿下4局,比赛结束.现有甲、乙两位选手进行比赛,经统计分析甲、乙之间以往比赛数据发现,24分钟内甲、乙可以完整打满2局或3局,且在11分制比赛中,每局甲获胜的概率为,乙获胜的概率为;在“FAST5”模式,每局比赛双方获
12、胜的概率都为,每局比赛结果相互独立.()求4局比赛决出胜负的概率;()设在24分钟内,甲、乙比赛了3局,比赛结束时,甲乙总共进行的局数记为,求的分布列及数学期望.【答案】()见解析;()分布列见解析,.【详解】()设前24分钟比赛甲胜出分别为,乙胜出分别为,在“FAST5”模式每局比赛甲获胜为,4局比赛决出胜负记为事件.若24分钟内甲、乙打满2局,则;若24分钟内甲、乙打满3局,则;()的可能取值为4、5、6、7;所以,随机变量的概率分别列为:4567的数学期望为.例5某电子公司新开发一电子产品,该电子产品的一个系统G有2n1个电子元件组成,各个电子元件能正常工作的概率均为p,且每个电子元件能
13、否正常工作相互独立若系统中有超过一半的电子元件正常工作,则系统G可以正常工作,否则就需维修(1)当时,若该电子产品由3个系统G组成,每个系统的维修所需费用为500元,设为该电子产品需要维修的系统所需的总费用,求的分布列与数学期望;(2)为提高系统G正常工作的概率,在系统内增加两个功能完全一样的电子元件,每个新元件正常工作的概率均为p,且新增元件后有超过一半的电子元件正常工作,则系统C可以正常工作,问p满足什么条件时,可以提高整个系统G的正常工作概率?【答案】(1)分布列见解析,数学期望为750;(2)【详解】(1)当时,一个系统有3个电子元件,则一个系统需要维修的概率为,设为该电子产品需要维修
14、的系统个数,则,的分布列为:050010001500P(2)记个元件组成的系统正常工作的概率为个元件中有个正常工作的概率为,因此系统工常工作的概率在个元件组成的系统中增加两个元件得到个元件组成的系统,则新系统正常工作可分为下列情形:(a)原系统中至少个元件正常工作,概率为;(b)原系统中恰有个元件正常工作,且新增的两个元件至少有1个正常工作,概率为;(c)原系统中恰有个元件正常工作,且新增的两个元件均正常工作,概率为所以,因此, ,故当时,单调增加,增加两个元件后,能提高系统的可靠性例6第13届女排世界杯于2019年9月14日在日本举行,共有12支参赛队伍.本次比赛启用了新的排球用球MIKSA
15、-V200W ,已知这种球的质量指标 (单位:g )服从正态分布N (270, ).比赛赛制采取单循环方式,即每支球队进行11场比赛(采取5局3胜制),最后靠积分选出最后冠军积分规则如下:比赛中以3:0或3:1取胜的球队积3分,负队积0分;而在比赛中以3:2取胜的球队积2分,负队积1分.已知第10轮中国队对抗塞尔维亚队,设每局比赛中国队取胜的概率为p(0p1). (1)如果比赛准备了1000个排球,估计质量指标在(260,265内的排球个数(计算结果取整数).(2)第10轮比赛中,记中国队3:1取胜的概率为.(i)求出f(p)的最大值点;(ii)若以作为p的值记第10轮比赛中,中国队所得积分为
16、X,求X的分布列.参考数据: N(u,),则p(-X+)0.6826,p(-2X +2)0.9644.【答案】(1)140;(2)(i);(ii)分布列见解析.【详解】(1)因为服从正态分布N (270, ),所以,所以质量指标在(260,265内的排球个数为个;(2)(i),令,得,当时,在上单调递增;当时,在上单调递减;所以的最大值点;(ii)的可能取值为0,1,2,3.; ;所以的分布列为0123P课后小练1某省参加2021年普通高考统考报名的所有考生均可选考英语口试科目,考生自愿参加,不作为统一要求.考生卷面成绩采用百分制.某市从参加高三英语口语考试的1000名学生中随机抽取100名学
17、生,将其英语口试成绩(均为整数)分成六组,后得到如下部分频率分布直方图,已知第二组与第三组的频数之和等于第四组的频数.(1)求频率分布直方图中未画出矩形的总面积;(2)预估该市本次参加高三英语口语考试的1000名学生中成绩处于的人数;(3)用分层抽样的方法在高分(不低于80分)段的学生中抽取一个容量为12的样本,将该样本看成一个总体,再从中任取3人,记这3人中成绩低于90分的人数为,求随机变量的分布列及数学期望.2某小微企业生产一种如下图所示的电路子模块,要求三个不同位置1、2、3接入三种不同类型的电子元件,且备选电子元件为A、B、C型,它们正常工作的概率分别为0.9、0.8、0.7.假设接入
18、三个位置的元件能否正常工作相互独立.当且仅当1号位元件正常工作,同时2号位与3号位元件中至少有一件正常工作时,电路子模块才能正常工作.(1)共可组装出多少种不同的电路子模块?(2)求电路子模块能正常工作的概率最大值;(3)若以每件5元、3元、2元的价格分别购进A、B、C型元件各1000件,组装成1000套电路子模块出售,设每套子模块组装费为20元.每套子模块的售价为150元,但每售出1套不能正常工作子模块,除退还购买款外,还将支付购买款的3倍作为赔偿金.求生产销售1000套电路子模块的最大期望利润.3随着时代发展和社会进步,教师职业越来越受青睐,考取教师资格证成为不少人的就业规划之一当前,中小
19、学教师资格考试分笔试和面试两部分已知某市2020年共有10000名考生参加了中小学教师资格考试的笔试,现从中随机抽取100人的笔试成绩(满分视为100分)作为样本,整理得到如下频数分布表:笔试成绩人数51025302010(1)假定笔试成绩不低于90分为优秀,若从上述样本中笔试成绩不低于80分的考生里随机抽取2人,求至少有1人笔试成绩为优秀的概率;(2)由频数分布表可认为该市全体考生的笔试成绩近似服从正态分布,其中近似为100名样本考生笔试成绩的平均值(同一组中的数据用该组区间的中点值代替),据此估计该市全体考生中笔试成绩不低于85.9的人数(结果四舍五入精确到个位)(3)考生甲为提升综合素养
20、报名参加了某拓展知识竞赛,该竞赛要回答3道题,前两题是哲学知识,每道题答对得3分,答错得0分;最后一题是心理学知识,答对得4分,答错得0分已知考生甲答对前两题的概率都是,答对最后一题的概率为,且每道题答对与否相互独立,求考生甲的总得分的分布列及数学期望(参考数据:;若,则,)4健康中国行动(20192030年)包括15个专项行动,其中全民健身行动提出鼓励公众每周进行3次以上每次30分钟以上中等强度运动,或者累计150分钟中等强度或75分钟高强度身体活动,日常生活中要尽量多动,达到每天6千步10千步的身体活动量,某高校从该校教职工中随机抽取了若干名,统计他们的日均步行数(均在2千步14千步之间)
21、,得到的数据如下表:日均步行数/千步人数1224249频率0.080.160.40.160.06(1)求,的值;(2)“每天运动一小时,健康工作五十年”,学校为了鼓励教职工积极参与锻炼,决定对日均步行数不低于千步的教职工进行奖励,为了使全校30%的教职工得到奖励,试估计的值;(3)在第(2)问的条件下,以频率作为概率,从该校得到奖励的教职工中随机抽取3人,设这3人中日均步行数不低于10千步的人数为,求的分布列和数学期望.5某病毒在进入人体后有潜伏期,患者在潜伏期内无任何症状,但已具传染性.假设一位病毒携带者在潜伏期内每天有n位密接者,每位密接者被感染的概率为p,(1)若,求一天内被一位病毒携带
22、者直接感染人数X的分布列和均值:(2)某定点医院为筛查某些人员是否感染此病毒,需要检测血液样本是否为阳性,有以下两种检验方式:逐份检验,即k份血液样本需要检验k次;混合检验,即将k份(且)血液样本分别取样混合在一起检验,若检验结果为阴性,则这k份血液样本全为阴性,因而这k份血液样本只要检验一次就够了:如果检验结果为阳性,为了明确这k份血液样本究竞哪份为阳性,就要对k份血液样本再逐份检验,此时这k份血液样本的检验次数为k+1次. 假设样本的检验结果相互独立,且每份样本检验结果是阳性的概率为,为使混合检验需要的检验的总次数的期望值比逐份检验的总次数的期望值更少,求k的取值范围.参考数据:,.参考答
23、案1(1)0.45;(2)150名;(3)分布列见解析,.【详解】(1)因为分数在内的频率为,因为矩形的面积等于组距频率,所以频率分布直方图中未画出部分矩形的总面积为0.45.(2)设第三组与第四组的频率分别为,.因为第二组与第三组的频数之和等于第四组的频数.所以第二组与第三组的频率之和等于第四组的频率.所以,解得所以成绩处于第三组之间的频率为0.15.所以预估该市本次参加高三英语口语考试的000名学生中成绩处于的人数为(名).(3)由题意,分数段的人数为(人),分数段的人数为(人).因为用分层抽样的方法在高分段的学生中抽取一个容量为12的样本,所以需在分数段内抽取10人;在分数段内抽取2人;
24、设“从样本中任取3人,3人中成绩少于90分”的人数为,则的所有可能取值是1,2,3.,.所以随机变量的分布列为123所以随机变量的数学期望为.2(1)6;(2);(3)27600元.【详解】(1)电子元件为A、B、C设接入三个位置共有种不同的子模块;(2)根据1号位放入A、B、C三种元件,共有三种情况,记其正常工作为A、B、C事件,可得:, ,则,所以1号位接型电子元件时,子模块正常工作的概率最大为;(3)若要最大利润,选择正常工作的概率最大的电路子模块,应把A型元件接入1号位,此时,设1000套子模块中能正常工作的套数为X,利润为Y,则,则,所以,故生产销售1000套电路子模块的最大期望利润
25、为27600元.3(1);(2)人;(3)分布列见解析;期望为【详解】(1)由已知,样本中笔试成绩不低于80分的考生共30人,其中成绩优秀10人(2)有表格数据知,又,即,由此可估计该市全体考生笔试成绩不低于85.9分的人数为人(3)考生甲的总得分的所有可能取值为0,3,4,6,7,10,的分布列为:03467104(1),;(2);(3)分布列答案见解析,数学期望:.【详解】解:(1)由题可得,解得.易知,.(2)由题意知,日均步行数在内的频率为,日均步行数在内的频率为,则,解得.所以当时,全校30%的教职工能够得到奖励.(3)由题意知该校得到奖励的教职工在全校教职工中所占的比例为0.3,所
26、以日均步行数不低于10千步的教职工在得到奖励的教职工中所占的比例为,所以,所以的分布列为0123数学期望.5(1)答案见解析;(2)且kN*【详解】(1)若n3,p,依题意可知X服从二项分布,即XB(3,),从而,i0,1,2,3随机变量X的分布列为:X0123P随机变量X的均值为 (2)由题意知的所有可能取值为1,且,又E()k,依题意E()E(),即:k1k(1p)kk,(1p)k,p1,()k,lnkk设,则,所以时,时,所以f(x)在(0,3)上单调递增,在(3,)上单调递减,由于f(1)0,f(2)ln20,f(4)ln40.05300,f(5)ln50.05730,故k的取值范围为且kN*