1、第七章 随机变量及其分布7.4二项分布与超几何分布知识梳理知识点一n重伯努利试验及其特征1n重伯努利试验的概念将一个伯努利试验独立地重复进行n次所组成的随机试验称为n重伯努利试验2n重伯努利试验的共同特征(1)同一个伯努利试验重复做n次(2)各次试验的结果相互独立思考在相同条件下,有放回地抽样试验是n重伯努利试验吗?答案是其满足n重伯努利试验的共同特征知识点二:二项分布一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0p1),用X表示事件A发生的次数,则X的分布列为P(Xk)Cpk(1p)nk,k0,1,2,n.称随机变量X服从二项分布,记作XB(n,p)知识点三二项分布的均值与
2、方差二项分布的均值与方差(1)二项分布的均值:在n次独立重复试验中,若XB(n,p),则E(X )=np.(2) 二项分布的方差:若离散型随机变量X从二项分布,即XB(n,p),则D(X)=np(1-p).知识点四超几何分布定义:一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为P(Xk),km,m1,m2,r.其中n,N,MN*,MN,nN,mmax0,nNM,rminn,M如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布超几何分布的均值设随机变量X服从超几何分布,则X可以解释为从包含M件次品
3、的N件产品中,不放回地随机抽取n件产品中的次品数.令p=MN , 则p是N件产品的次品率,而是抽取的 n件产品的次品率,则E( Xn )=p,即E(X)=np.题型探究例12021年某省开始的“3+1+2”模式新高考方案中,对化学生物地理和政治等四门选考科目,制定了计算转换分(即记入高考总分的分数)的“等级转换赋分规则(详见附1和附2),具体的转换步骤为:原始分等级转换;原始分等级内等比例转换赋分某校的一次年级模拟考试中,政治化学两选考科目的原始分分布如下表:等级比例约约约约约政治学科各等级对应的原始分区间化学学科各等级对应的原始分区间现从政治化学两学科中分别随机抽取了20个原始分成绩数据如下
4、:政治化学个位数十位数个位数98766540647998654210701234579986281346949358(1)该校的甲同学选考政治学科,其原始分为86分,乙同学选考化学学科,其原始分为93分基于高考实测的转换赋分模拟,试分别计算甲乙同学的转换分,并从公平性的角度谈谈你对新高考这种“等级转换赋分法的看法(2)若从该校化学学科等级为的学生中,随机抽取3人,设这3人转换分不低于90分的有人,求的分布列和数学期望附1:等级转换的等级人数占比与各等级的转换分赋分区间等级原始分从高到低排序的等级人数占比约约约约约转换分的赋分区间附计算转换分的等比例转换赋分公式:(其中:,分别表示原始分对应等级
5、的原始分区间下限和上限;分别表示原始分对应等级的转换分赋分区间下限和上限的计算结果按四舍五入取整)【答案】(1)甲乙两位同学的转换分都为90分;答案见解析;(2)分布列见解析;期望为【详解】(1)甲同学选考政治学科原始分为86分,根据等比例转换赋分公式:得乙同学选考化学学科原始分为93分,根据等比例转换赋分公式:得,故甲乙两位同学的转换分都为90分从公平性的角度谈谈你对新高考这种“等级转换赋分法”的看法:从已知可得甲乙同学原始分都排第三,转换后都是90分,因此高考这种“等级转换赋分法”具有公平性与合理性甲同学与乙同学原始分差7分,但转换后都是90分,高考这种“等级转换赋分法”对尖子生不利(2)
6、该校化学学科原始分为93分时,根据等比例转换赋分公式:,得,即原始分低于93分的转换分低于90分,所以转换分不低于90分的有3人,低于90分的有5人,的所有取值有,的分布列为:0123例2健康中国行动(20192030年)包括15个专项行动,其中全民健身行动提出鼓励公众每周进行3次以上每次30分钟以上中等强度运动,或者累计150分钟中等强度或75分钟高强度身体活动,日常生活中要尽量多动,达到每天6千步10千步的身体活动量,某高校从该校教职工中随机抽取了若干名,统计他们的日均步行数(均在2千步14千步之间),得到的数据如下表:日均步行数/千步人数1224249频率0.080.160.40.160
7、.06(1)求,的值;(2)“每天运动一小时,健康工作五十年”,学校为了鼓励教职工积极参与锻炼,决定对日均步行数不低于千步的教职工进行奖励,为了使全校30%的教职工得到奖励,试估计的值;(3)在第(2)问的条件下,以频率作为概率,从该校得到奖励的教职工中随机抽取3人,设这3人中日均步行数不低于10千步的人数为,求的分布列和数学期望.【答案】(1),;(2);(3)分布列答案见解析,数学期望:.【详解】解:(1)由题可得,解得.易知,.(2)由题意知,日均步行数在内的频率为,日均步行数在内的频率为,则,解得.所以当时,全校30%的教职工能够得到奖励.(3)由题意知该校得到奖励的教职工在全校教职工
8、中所占的比例为0.3,所以日均步行数不低于10千步的教职工在得到奖励的教职工中所占的比例为,所以,所以的分布列为0123数学期望.例3某中学高一(1)班在接种了“新冠疫苗”之后,举行了“疫情防控,接种疫苗”知识竞赛.这次竞赛前名同学成绩的茎叶图如图所示,已知前名女生的平均得分为分.(1)求茎叶图中的值;如果在竞赛成绩高于分且按男生和女生分层抽样抽取人,再从这人中任选人作为后期举行的“接种疫苗,感恩祖国”主题班会中心发言人,求这人中有女生的概率;(2)如果在竞赛成绩高于分的学生中任选人参加学校座谈会,用表示人中成绩超过分的人数,求的分布列和期望.【答案】(1);(2)分布列见解析,期望为.【详解
9、】(1)由茎叶图可知,前名女生的平均得分为,解得;竞赛成绩高于分的女生有人,男生有人,按男生和女生分层抽样抽取人,则样本中的男生人数为,女生人数为,记事件从人中任选人作为后期举行的“接种疫苗,感恩祖国”主题班会中心发言人,这人中有女生,则;(2)竞赛成绩高于分的学生共有人,成绩高于分的学生共有人,由题意可知,随机变量的可能取值有、,则,所以,随机变量的分布列如下表所示:因此,.例4某食品厂为了检查一条自动包装流水线的生产情况,对该流水线上的产品进行简单随机抽样,获得数据如下表:分组区间(单位:克)产品件数34751包装质量在克的产品为一等品,其余为二等品(1)估计从该流水线任取一件产品为一等品
10、的概率;(2)从上述抽取的样本产品中任取2件,设X为一等品的产品数量,求X的分布列;(3)从该流水线上任取2件产品,设Y为一等品的产品数量,求Y的分布列;试比较期望与则望的大小.(结论不要求证明)【答案】(1);(2)分布列见解析;(3)分布列见解析,【详解】解:(1)样本中一共有件产品,包装质量在克的产品有件,故从该流水线任取一件产品为一等品的概率(2)依题意的可能取值为、;,故的分布列为:(3)由(2)可得依题意,则的可能取值为,故的分布列为:所以所以例5某商城玩具柜台元旦期间促销,购买甲、乙系列的盲盒,并且集齐所有的产品就可以赠送元旦礼品而每个甲系列盲盒可以开出玩偶,中的一个,每个乙系列
11、盲盒可以开出玩偶,中的一个(1)记事件:一次性购买个甲系列盲盒后集齐,玩偶;事件:一次性购买个乙系列盲盒后集齐,玩偶;求概率及;(2)礼品店限量出售甲、乙两个系列的盲盒,每个消费者每天只有一次购买机会,且购买时,只能选择其中一个系列的一个盲盒通过统计发现:第一次购买盲盒的消费者购买甲系列的概率为,购买乙系列的概率为;而前一次购买甲系列的消费者下一次购买甲系列的概率为,购买乙系列的概率为;前一次购买乙系列的消费者下一次购买甲系列的概率为,购买乙系列的概率为;如此往复,记某人第次购买甲系列的概率为;若每天购买盲盒的人数约为100,且这100人都已购买过很多次这两个系列的盲盒,试估计该礼品店每天应准
12、备甲、乙两个系列的盲盒各多少个【答案】(1),;(2);应准备甲系列盲盒40个,乙系列盲盒60个【详解】解:(1)由题意基本事件共有:种情况,其中集齐,玩偶的个数可以分三类情况, 玩偶中,每个均有出现两次,共种;, 玩偶中,一个出现一次,一个出现两次,一个出现三次,共种;, 玩偶中,两个出现一次,另一个出现四次,共种;故.根据题意,先考虑一次性购买个乙系列盲盒没有集齐,玩偶的概率,即,所以.(2)由题意可知:,当时,所以是以为首项,为公比的等比数列,因为每天购买盲盒的100人都已购买过很多次,所以,对于每一个人来说,某天来购买盲盒时,可以看作n趋向无穷大,所以购买甲系列的概率近似于,假设用表示
13、一天中购买甲系列盲盒的人数,则,所以,即购买甲系列的人数的期望为40,所以礼品店应准备甲系列盲盒40个,乙系列盲盒60个课后小练1.在某学校某次射箭比赛中,随机抽取了100名学员的成绩(单位:环),并把所得数据制成了如下所示的频数分布表; 成绩分组4,5)5,6)6,7)7,8)8,9)9,10频数5182826176附:若 ZN(,2) ,则 P(-Z+)=0.6827,P(-2Z+2)=0.9545 , 1.611.27 ,结果取整数部分(1)求抽取的样本平均数 x (同一组中的数据用该组区间的中点值作代表); (2)已知这次比赛共有2000名学员参加,如果近似地认为这次成绩Z服从正态分布
14、 N(,2) (其中 近似为样本平均数 x,2 近似为样本方差 s2=1.61 ),且规定8.27环是合格线,那么在这2000名学员中,合格的有多少人? (3)已知样本中成绩在9,10的6名学员中,有4名男生和2名女生,现从中任选3人代表学校参加全国比赛,记选出的男生人数为 , ,求 的分布列与期望 E . 2.某公司招聘员工,分初试和面试两个阶段,初试通过方可进入面试受新冠疫情影响,初试采取线上考核的形式,共考核 A 、 B 、 C 三项技能,其中 A 必须过关, B 、 C 至少有一项过关才能进入面试现有甲、乙、丙三位应聘者报名并参加初试,三人能否通过初试互不影响,每个人三项考核的过关率均
15、相同,各项技能过关率如下表,且每一项考核能否过关相互独立 考核技能A B C 过关率23 12 12 ()求甲应聘者能进入面试的概率;()用 X 表示三位应聘者中能进面试的人数,求 X 的分布列及期望 EX 3.据相关部门统计,随着电商网购的快速普及,快递包装业近年来实现了超过50%的高速年均增长,针对这种大好形式,某化工厂引进了一条年产量为1000万个包装胶带的生产线.已知该包装胶带的质量以某项指标值 k 为衡量标准.为估算其经济效益,该化工厂先进行了试生产,并从中随机抽取了1000个包装胶带,统计了每个包装胶带的质量指标值k,并分成以下5组,其统计结果及产品等级划分如下表所示: 质量指标
16、k 50,60) 60,70) 70,80) 80,90) 90,100 产品等级A 级B 级C 级D 级废品频数16030040010040试利用该样本的频率分布估计总体的概率分布,并解决下列问题(注:每组数据取区间的中点值).参考数据:若随机变量 ZN(,2) ,则 P(-Z+)=0.6827 , P(-2Z+2)=0.9545 , P(-3Z+3)=0.9973 , 0.8186290.0030 , ln132.6 .(1)由频数分布表可认为,该包装胶带的质量指标值 k 近似地服从正态分布 N(,2) ,其中 近似为样本平均数 x , 近似为样本的标准差 s ,并已求得 s10.03 .
17、记 X 表示某天从生产线上随机抽取的30个包装胶带中质量指标值 k 在区间 (50.54,80.63 之外的包装胶带个数,求 P(X=1) 及 X 的数学期望(精确到0.001); (2)已知每个包装胶带的质量指标值 k 与利润 y (单位:元)的关系如下表所示: (t(1,4) . 质量指标 k 50,60) 60,70) 70,80) 80,90) 90,100 利润 y 5t 3t 2t t -5et 假定该化工厂所生产的包装胶带都能销售出去,且这一年的总投资为5000万元(含引进生产线、兴建厂房等等一切费用在内),问:该化工厂能否在一年之内通过生产包装胶带收回投资?试说明理由.4.在传
18、染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患者的相关信息,得到如下表格: 潜伏期(单位:天)0,2 (2,4 (4,6 (6,8 (8,10 (10,12 (12,14 人数85205310250130155附:P(K2k0) 0.050.0250.010k0 3.8415.0246.635K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d) 其中 n=a+b+c+d .(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准
19、进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表.请将列联表补充完整,并根据列联表判断是否有95%的把握认为潜伏期与患者年龄有关; 潜伏期6天潜伏期6天总计50岁以上(含50岁)10050岁以下55总计200(2)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,设潜伏期超过6天的人数为 X ,则 X 的期望是多少? 5.某制造企业根据长期检测结果,发现生产产品的一项质量指标值服从正态分布 N(,2) ,并把质量指标值在 (-,+) 内的产品称为优等品,质量指
20、标值在 (+,+2) 内的产品称为一等品,其余范围内的产品作为废品处理.优等品与一等品统称为正品,现从该企业生产的产品中随机抽取1000件,测得产品质量指标值的样本数据统计如下图: (1)根据频率分布直方图,求样本平均数 x ; (2)根据大量的产品检测数据,得出样本数据的方差的近似值为100,用样本平均数 x 作为 的近似值,用样本标准差s作为 的估计值,求该厂生产的产品为正品的概率; 参考数据:若随机变量 服从正态分布 N(,2) ,则: P(-+)0.6827 , P(-2+2)0.9545 , P(-3+3)0.9973 .(3)假如企业包装时要求把3件优等品5件一等品装在同一个箱子甲
21、,质检员每次从箱子中随机取出3件产品进行检验,记取出3件产品中优等品的件数为X,求X的分布列以及数学期望. 答案解析1.【答案】 (1)解:由所得数据列成的频数分布表,得样本平均数 x=4.50.05+5.50.18+6.50.28+7.50.26+8.50.17+9.50.06=7 .(2)解:由(1)知 ZN(7,1.61) , P(Z8.27)=1-0.68272=0.15865 , 在这2000名学员中,合格的有: 20000.15865317 人.(3)解:由已知得 的可能取值为1,2,3 P(=1)=C41C22C63=15 , P(=2)=C42C21C63=35 , P(=3)
22、=C43C20C63=15 , 的分布列为:I23P153515E=115+235+315=2 (人).【解析】(1)由所得数据列成的频数分布表,利用平均数公式即可求出抽取的样本平均数; (2)根据正态分布的性质即可合格的人数; (3)的可能取值为1,2,3 分别求出对应的概率,即可求解分布列和期望.2.【答案】 解:()甲应聘者这三项考核分别记为事件 A , B , C ,且事件 A , B , C 相互独立,则甲应聘者能进入面试的概率 P(ABC)+P(ABC)+P(ABC)=231212+231212+231212=12 ()由题知, X 的所有可能取值为0,1,2,3,且 XB(3,1
23、2) P(X=0)=C30(12)3=18 ; P(X=1)=C31(12)(12)2=38 ;P(X=2)=C32(12)2(12)=38 ; P(X=3)=C33(12)3(12)0=18 ,分布列为:X 0123P 18 38 38 18 XB(3,12) , EX=312=32 【解析】(1)利用已知条件将甲应聘者这三项考核分别记为事件 A , B , C ,且事件 A , B , C 相互独立, 再利用独立事件乘法概率公式结合互斥事件加法概率公式,进而求出甲应聘者能进入面试的概率。 (2) 由题知,求出随机变量 X 的所有可能取值,再结合二项分布求概率公式,进而求出随机变量X的分布列
24、,再利用随机变量X的分布列结合数学期望公式,进而求出随机变量X的数学期望。3.【答案】 (1)解:由题意可得 中间值5565758595概率0.160.30.40.10.04则样本平均数 x=550.16+650.3+750.4+850.1+950.04=70.6 ,(-2,+=(70.6-20.06.70.6+10.03=(50.54.80.63 ,而 P(-2k+)=12P(-k+)+12P(-2k+2)=0.8186 ,从而质量指标值 k 在区间 (50.54,80.63 之外的概率为0.1814,则 P(X=1)=C3010.8186290.1814300.00300.18140.01
25、63260.016 ,X的数学期望为 E(X)=300.1814=5.442 (2)解:由题意可得该包装胶带的质量指标值 k 与对应的概率如下表所述 (1t0 ,当 t(ln13,4) 时, y0 .所以当 t=ln13=2.6 时, y 取得最大值,ymax=-0.2eln13+2.6ln13-2.6+2.62.6=4.16 (元),由已知可得改生产线的年产量为 1000 万个,故该生产线的年盈利的最大值为 4.161000=4160 (万元),而 4160 万元 5000 万元,故该化工厂不能在一年之内通过销售包装胶带收回投资【解析】(1) 计算出样本的平均数,可得出 (-2,+=(50.
26、54.80.63 ,利用 3 原则可求得 P(-2k+) 的值,利用独立重复试验的概率公式可求得 P(X=1) 的值,利用二项分布的期望公式可求得 E(X) 的值;(2)求得每个包装胶带的利润 y 关于 t 的函数关系式,利用导数求得 y 的最大值,由此可求得该生产线的年盈利的最大值,进而可得出结论.4.【答案】 (1)解:根据题意,补充完整的列联表如下: 潜伏期6天潜伏期6天总计50岁以上(含50岁)653510050岁以下5545100总计12080200则 K2=(6545-5535)212080100100=25122.083 ,经查表,得 K22.0833.841 ,所以,没有95%
27、的把握认为潜伏期与年龄有关.(2)解:由题可知,该地区每1名患者潜伏期超过6天发生的概率为 4001000=25 , 设调查的20名患者中潜伏期超过6天的人数为 X ,则 X 服从二项分布:XB(20,25) , P(X=k)=C20k(25)k(35)20-k , k=0,1,2,20 ,则 E(X)=2025=8 ,所以, X 的期望为 E(X)=8 .【解析】(1) 从已知数据知潜伏期有 (0,6 的有600人,超过6天的有400人,由分层抽样按比例可得潜伏期不超过6天的抽样人数及超过6天的抽样人数,由此可填写列联表,计算 K2 后可得结论;(2)由题可知,该地区每1名患者潜伏期超过6天
28、发生的概率为 4001000=25 ,设调查的20名患者中潜伏期超过6天的人数为 X ,则 X 服从二项分布: XB(20,25) ,由二项分布的期望公式可直接得期望5.【答案】 (1)解:由频率分布直方图可知, x=0.0101046+562+0.0201056+662+0.0451066+762 +0.0201076+862+0.0051086+962=70 .(2)解:由题意可知,样本方差 s2=100 ,故 s2=10 , 所以质量指标值 YN(70,102) ,该厂生产的产品为正品的概率P=P(60Y90)=P(60Y70)+P(70Y90) =12(0.6827+0.9545)=0
29、.8186 .(3)解:X的可能取值为0,1,2,3,则 P(X=0)=C30C53C83=528 , P(X=1)=C31C52C83=1528 ,P(X=2)=C32C51C83=1556 , P(X=3)=C33C50C83=156 .所以X的分布列为X0123P528 1528 1556 156 数学期望 E(X)=0528+11528+21556+3156=98 .【解析】(1) 根据频率分布直方图直接计算平均数;(2) 由条件可知 =70 , =10 ,并根据数据计算正品的概率;(3)由条件可知优等品的件数 X=0,1,2,3 ,根据超几何分布的概率公式计算概率,列出分布列和计算数学期望.