1、已知已知100件产品中有件产品中有8件次品,分别采用有放回和不放回的件次品,分别采用有放回和不放回的方式随机抽取方式随机抽取4件设抽取的件设抽取的4件产品中次品数为件产品中次品数为X,求随机变,求随机变量量X的分布列的分布列.问问 题题已知已知100件产品中有件产品中有8件次品,分别采用有放回和不放回的件次品,分别采用有放回和不放回的方式随机抽取方式随机抽取4件设抽取的件设抽取的4件产品中次品数为件产品中次品数为X,求随机变,求随机变量量X的分布列的分布列.我们知道,如果采用有放回抽样,则每次抽到次品的概率我们知道,如果采用有放回抽样,则每次抽到次品的概率为为0.08,且各次抽样的结果相互独立
2、,此时,且各次抽样的结果相互独立,此时X服从二项分布,即服从二项分布,即XB(4,0.08).问问 题题如果采用不放回抽样,那么抽取的如果采用不放回抽样,那么抽取的4件产品中次件产品中次品数品数X是否也服从二项分布?如果不服从,那么是否也服从二项分布?如果不服从,那么X的的分布列是什么分布列是什么?思思 考考采用不放回抽样,虽然每次抽到次品的概率都是采用不放回抽样,虽然每次抽到次品的概率都是0.08,但,但每次抽取不是同一个试验每次抽取不是同一个试验而且各次抽取的结果也不独立,而且各次抽取的结果也不独立,不符合不符合n重伯努利试验的特征,因此重伯努利试验的特征,因此X不服从二项分布不服从二项分
3、布.思思 考考可以根据古典概型求可以根据古典概型求X的分布列的分布列由题意可知,由题意可知,X可能的取值可能的取值为为0,1,2,3,4从从100 件产品中任取件产品中任取4件,样本空间包含件,样本空间包含个样本点,且每个样本点都是等可能发生的个样本点,且每个样本点都是等可能发生的其中其中4件产品中恰有件产品中恰有k 件次品的结果数为件次品的结果数为 由古典概型的知识,得由古典概型的知识,得X的分布列的分布列为为思思 考考计算的具体结果计算的具体结果(精确到精确到0.000 01)如表如表7.4-1所示所示.表表7.4-1X01234P0.712570.256210.029890.001310
4、.00002思思 考考一般地,假设一批产品共有一般地,假设一批产品共有N件,其中有件,其中有M件次品从件次品从N件产品中随机抽取件产品中随机抽取n件件(不放回不放回),用,用X表示抽取的表示抽取的n件产品件产品中的次品数,则中的次品数,则X的分布列为的分布列为其中其中n,N,MN*,M N,n N,m=max0,nN+M,r=minn,M如果随机变量如果随机变量X的分布列具有上式的形式,的分布列具有上式的形式,那么称随机变量那么称随机变量X服从服从超几何分布超几何分布(hypergeometric distribution).从从50名学生中随机选出名学生中随机选出5名学生代表,求名学生代表,
5、求甲被选中的概率甲被选中的概率.例例1 一批零件共有一批零件共有30个,其中有个,其中有3个不合格个不合格随机抽取随机抽取10个零件进行检测,求至少有个零件进行检测,求至少有1件不合格件不合格的概率的概率.例例2探探 究究服从超几何分布的随机变量的均值是什么服从超几何分布的随机变量的均值是什么?设随机变量设随机变量X服从超几何分布,则服从超几何分布,则X可以解释为从包含可以解释为从包含M件件次品的次品的N件产品中,不放回地随机抽取件产品中,不放回地随机抽取n件产品中的次品数令件产品中的次品数令 则则p是是N件产品的次品率,而件产品的次品率,而 是抽取的是抽取的n件产品的次件产品的次品率,我们猜
6、想品率,我们猜想 ,即,即 E(X)=np.实际上,令实际上,令m=max0,nN+M,r=minn,M由随机由随机变量均值的定义变量均值的定义:当当m0时时,(1)当当m=0时,注意到时,注意到(1)式中间求和的第一项为式中间求和的第一项为0,类似可以证,类似可以证明结论依然成立明结论依然成立.一个袋子中有一个袋子中有100个大小相同的球,其中有个大小相同的球,其中有40个个黄球、黄球、60个白球,从中随机地摸出个白球,从中随机地摸出20个球作为样本用个球作为样本用X表表示样本中黄球的个数示样本中黄球的个数.(1)分别就有放回摸球和不放回摸球,求分别就有放回摸球和不放回摸球,求X的分布列的分
7、布列;(2)分别就有放回摸球和不放回摸球,用样本中黄球的分别就有放回摸球和不放回摸球,用样本中黄球的比例估计总体中黄球的比例,求误差不超过比例估计总体中黄球的比例,求误差不超过0.1的概率的概率.例例3(1)对于有放回摸球,每次摸到黄球的概率为对于有放回摸球,每次摸到黄球的概率为0.4,且各,且各次试验之间的结果是独立的,因此次试验之间的结果是独立的,因此XB(20,0.4),X 的分布列为的分布列为解:解:对于不放回摸球,各次试验的结果不独立,对于不放回摸球,各次试验的结果不独立,X服从超几何分服从超几何分布,布,X的分布列为的分布列为(2)利用统计软件计算出两个分布列的概率值利用统计软件计
8、算出两个分布列的概率值(精确到精确到0.000 01),如表如表7.4-2所示所示.表表7.4-2kp1kp2kkp1kp2kkp1kp2k00.000040.0000170.165880.17972140.004850.0021710.000490.0001580.179710.20078150.001290.0004120.003090.0013590.159740.17483160.000270.0000630.012350.00714100.117140.11924170.000040.0000140.034990.02551110.070990.06376180.000000.000
9、0050.074650.06530120.035500.02667190.000000.0000060.124410.12422130.014560.00867200.000000.00000有有放回摸球:放回摸球:P(|f 200.4|0.1)=P(6X 10)0.746 9.不放回摸球:不放回摸球:P(|f 200.4|0.1)=P(6X 10)0.798 8.因此,在相同的误差限制下,采用不放回摸球估计的结果更因此,在相同的误差限制下,采用不放回摸球估计的结果更可靠些可靠些.样本中黄球的比例是一个随机变量,根据表样本中黄球的比例是一个随机变量,根据表7.4-2,计算得计算得两种摸球方式下
10、,随机变量两种摸球方式下,随机变量X分别服从二项分布和超几何分分别服从二项分布和超几何分布虽然这两种分布有相等的均值布虽然这两种分布有相等的均值(都是都是8),但从两种分布的概,但从两种分布的概率分布图率分布图(图图7.4-4)看,超几何分布更集中在均值附近看,超几何分布更集中在均值附近.图图7.4-4二项分布和超几何分布都可以描述随机抽取的二项分布和超几何分布都可以描述随机抽取的n件产品件产品中次品数的分布规律,并且二者的均值相同对于不放回抽中次品数的分布规律,并且二者的均值相同对于不放回抽样,当样,当n远远小于远远小于N时,每抽取一次后,对时,每抽取一次后,对N的影响很小,此的影响很小,此时,超几何分布可以用二项分布近似时,超几何分布可以用二项分布近似.