1、7.4.2超几何分布超几何分布讲课人:邢启强2:,PxXP)n,2, 1i (xX,x,x,x,xX,iiini21以以表表格格的的形形式式表表示示如如下下率率的的概概取取每每一一个个值值可可能能取取的的不不同同值值为为若若离离散散型型随随机机变变量量一一般般地地 XP1p2 2p ipnp1x2xixnx., 2 , 1,.,22的分布列表示也用等式有时为了表达简单的为简称的称为离散型随机变量表XnipxXPXXii 概率分布列分布列分布列分布列的概念:分布列的概念:复习引入复习引入讲课人:邢启强32.二项分布则若),(pnBX(1)(),0,1,2, .kkn knC ppP Xkkn3.
2、()( ,),()(,1).E XnXB np DpXnpp如果那么 X 0 1 k nPnnqpC00111nnqpCknkknqpC0qpCnnn1.n重伯努利试验复习引入复习引入讲课人:邢启强4不服从二项分布X, 4 , 3 , 2 , 1 , 0可能的取值为X的分布列为X. 4 , 3 , 2 , 1 , 0)(41004928kCCCkXPkkXP01234410049208CCC410039218CCC410029228CCC410019238CCC410009248CCC 问题问题. 已知100件产品中有8件次品,分别采用有放回和不放回的方式随机抽取4件.设抽取的4件产品中次品数
3、为X,求:随机变量X的分布列.如果采用有放回抽样,则每次抽到次品的概率为0.08且各次抽样的结果相互独立,此时XB(4,0.08).如果采用不有放回抽样,那么抽到4件产品中次品数X是否服从二项分布?如果不服从,那么X的分布列是什么?讲课人:邢启强5 例例3.在含有在含有5件次品的件次品的100件产品中,任取件产品中,任取3件,试求:件,试求:(1)取到的次品数)取到的次品数X的分布列;的分布列;(2)至少取到)至少取到1件次品的概率件次品的概率.3100,C从从100件产品中任取件产品中任取3件,其中恰有件,其中恰有K件次品的结果为件次品的结果为3595kkCC那么从那么从100件产品中任取件
4、产品中任取3件,其中恰好有件,其中恰好有K件次品的概率为件次品的概率为35953100()kkCCp XkC规律:规律:一般地,在含有一般地,在含有M件次品的件次品的N件产品中,任取件产品中,任取n件,其中恰有件,其中恰有X件次品数,件次品数,则事件则事件X=k发生的概率为发生的概率为*(),0,1,2,min, , ,kn kMNMnNCCP XkkmCmM nnN MN n M NN其其中中且且例题讲评例题讲评解:(解:(1)从)从100件产品中任取件产品中任取3件结果数为件结果数为讲课人:邢启强6学习新知学习新知超几何分布 一般地,假设一批产品共有N件,其中有M件次品.从N件产品中随机抽
5、取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为., 2, 1,)(rmmmkCCCkXPnNknMNkM.,min, 0max,MnrMNnmNnNMNMNn其中 如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布超几何分布.1.公式中个字母的含义N总体中的个体总数M总体中的特殊个体总数(如次品总数)n样本容量k样本中的特殊个体数(如次品数)2.求分布列时可以直接利用组合数的意义列式计算,不必机械记忆这个概率分布列.3. “任取n件,恰有k件次品”是一次性抽取,用组合数列式.4.各对应的概率和必须为1.讲课人:邢启强7解:55044911) 1(CCCXP
6、101例例1.从50名学生中随机选出5名学生代表,求甲被选中的概率.设X表示选出的5名数学中含甲的人数(只能取0或1),则X服从超几何分布,且N=50,M=1,n=5, 因此甲被选中的概率为1.判断随机变量是否服从超几何分布;2.根据已知条件,确定M,N,n对应的值;3.代入超几何分布的概率公式,求出结果;例题讲评例题讲评讲课人:邢启强8解:. 3 , 2 , 1 , 0)(103010273kCCCkXPkk.7192. 0另解:.7192. 0例例2. 一批零件共有30个,其中有3个不合格,随机抽取10个零件进行检测,求至少有1件不合格的概率.例题讲评例题讲评设抽取的10个零件中不合格品数
7、为,则服从超几何分布,且=30,=3,=10,的分布列为至少有1件不合格的概率为(1)=(=1)+(=2)+(=3)(1)=1(=0)讲课人:邢启强9探究:nNknMNkMCCCkXP )(,即NMp 令NnMnpXE)(猜想., 2, 1,)(rmmmkCCCkXPnNknMNkM由.,min, 0max,MnrMNnmNnNMNMNn其中rmknNknMNkMCCCkXE)(,得rmknNknMNkMCCCM11)(11kMkMMCkC所以因为,111nNknMNrmkkMCCC11()rkn kMN Mnk mNMCCECXnNnNCMC11nPNnM,)1 ()1 ()1 ( ,(11
8、MNMNxxx易知)1的系数相等等号两侧展开式的nx服从超几何分布的随机变量的均值是什么?讲课人:邢启强10超几何分布的均值., 2, 1,)(rmmmkCCCkXPnNknMNkM.,min, 0max,MnrMNnmNnNMNMNn其中NnMnpXE)( 若X服从超几何分布,学习新知学习新知则则D(X)D(X)1()(2NNnNMNnM讲课人:邢启强11解:.20, 2 , 1 , 0,6 . 04 . 0)(20201kCkXPPkkkk204060220100(),0,1,2,20.kkkC CPP XkkC 例例6.一袋中有100个大小相同的小球,其中有40个黄球,60个白球,从中随
9、机摸出20个球作为样本.用X表示样本中黄球的个数. (1).分别就有放回和不放回摸球,求X的分布列; (2).分别就有放回和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.(1)对于有放回摸球,由题意知(20,0.4),的分布列为对于不放回摸球,由题意知服从超几何分布,的分布列为讲课人:邢启强12 例例6.一袋中有100个大小相同的小球,其中有40个黄球,60个白球,从中随机摸出20个球作为样本.用X表示样本中黄球的个数. (2).分别就有放回和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过0.1的概率.解(2).20, 0,6 . 04 . 0
10、)(20201kCkXPPkkkk204060220100(),0,20.kkkC CPP XkkC20,20Xf样本中黄球的比例是一个随机变量 根据下表计算得)106() 1 . 04 . 0(:20XPfP有放回摸球.7469. 020:(0.40.1)(610)P fPX不放回摸球.7988. 0采用不放回摸球估算的结果更可靠些 讲课人:邢启强130.050 0.100.150.200.25两种摸球方式下,随机变量X服从二项分布和超几何分布.这两种分布的均值相等都等于8.但从两种分布的概率分布图看,超几何分布更集中在均值附近.当n远远小于N时,每次抽取一次,对N的影响很小.此时,超几何分
11、布可以用二项分布近似.讲课人:邢启强14二项分布与超几何分布区别和联系二项分布与超几何分布区别和联系1.区别一般地,超几何分布的模型是“取次品”是不放回抽样,而二项分布的模型是“独立重复试验”对于抽样,则是有放回抽样.2.联系当次品的数量充分大,且抽取的数量较小时,即便是不放回抽样,也可视其为二项分布.学习新知学习新知讲课人:邢启强15101P XP XP X56165 学校要从12名候选人中选4名同学组成学生会,已知有4名候选人来自甲班.假设每名候选人都有相同的机会被选到,求甲班恰有2名同学被选到的概率.解:设甲班恰有X人被选到, 则X服从超几何分布, 且N=12,M=4,n=4,22484
12、12(2)C CP XC变式变式:求甲班至多1名同学被选到的概率.413848441212CC CCC141249899495165巩固练习巩固练习讲课人:邢启强16 PM2.5是指悬浮在空气中的空气动力学当量直径小于或等于2.5微米的可入肺颗粒物,根据现行国家标 准GB30952012,PM2.5日均值在35微克/立方米以下空气质量为一级;在35微克/立方米75微克/立方米之间空气质量为二级;在75微克/立方米以上空气质量为超标.从某自然保护区2018年全年每天的PM2.5监测数据中随机地抽取10天的数据作为样本,监测值频数如下表所示: PM2.5日均值(微克/立方米)25,35)35,45
13、)45,55)55,65)65,75)75,85频数311113(1)从这10天的PM2.5日均值监测数据中,随机抽出3天,求恰有一天空气质量达到一级的概率;(2)从这10天的数据中任取3天数据,记X表示抽到PM2.5监测数据超标的天数,求X的分布列102.51)3(PM记“从这天的日均监测数据中,随机抽出 天,恰有一天空气质量达到一级”解为事件A.1237310( )C CP AC2140巩固练习巩固练习讲课人:邢启强17 2 .XX由条件知, 服从超几何分步,其中随机变量 的可能取值为0,1,2,3.337310(),(0,1,2,3).kkC CP XkkC0337310(0)C CP
14、XC7.241237310(1)C CP XC21.402137310(2)C CP XC7.403037310(3)C CP XC1.120X故 的分布列为 X 0 1 2 3P 72421407401120讲课人:邢启强18 在一次购物抽奖活动中,假设10张奖券中有一等奖奖券1张,可获价值50元的奖品,有二等奖奖券3张,每张可获价值10元的奖品;其余6张没有奖品.(1)顾客甲从10张奖券中任意抽取1张,求中奖次数X的分布列;(2)顾客乙从10张奖券中任意抽取2张,求顾客乙中奖的概率;设顾客乙获得的奖品总价值Y元,求Y的分布列例题讲评例题讲评讲课人:邢启强19讲课人:邢启强20 袋中装有大小
15、相同的2个白球和3个黑球采取不放回抽样方式,从中依次摸出两个球,记X为摸出的两球中白球的个数,求X的分布列,并求至少有一个白球的概率巩固练习巩固练习讲课人:邢启强21解:.3512) 1 (37121312CCCCP, 2 , 1 , 0)2(服从超几何分布可能取XX. 3, 2, 7nMN其中,723510) 0(373502CCCXP,74) 1(372512CCCXP,71) 2(371522CCCXP的数学期望为X的分布列为X76712741720)(XE?72376 一袋中有7个大小相同的小球,其中有2个红球,3个黄球,2个蓝球,从中任取3个球. (1).求红、黄、蓝三种颜色的小球各取1个的概率. (2).设X表示取到的蓝色小球的个数,求X的分布列和数学期望.巩固练习巩固练习讲课人:邢启强22课堂小结课堂小结., 2, 1,)(rmmmkCCCkXPnNknMNkM2.超几何分布的均值NnMnpXE)(1.超几何分布