1、2.2 离散型随机变量离散型随机变量 有些随机变量,有些随机变量, 它全部可能取值只有有限个或可列无穷多它全部可能取值只有有限个或可列无穷多 个,这类随机变量叫做个,这类随机变量叫做离散型随机变量离散型随机变量例如,掷一颗骰子观例如,掷一颗骰子观察出现的点数、某射手射击察出现的点数、某射手射击10次,观察命中的次数、电话交换次,观察命中的次数、电话交换台单位时间接到的呼叫次数等,它们都是离散型随机变量台单位时间接到的呼叫次数等,它们都是离散型随机变量 而测定电子元件的使用寿命,其可能取的值充满了区间而测定电子元件的使用寿命,其可能取的值充满了区间(0, +),是无法按一定次序一一列举出来的,是
2、无法按一定次序一一列举出来的, 所以它是一个所以它是一个非离非离散型的随机变量散型的随机变量 为了完全描述随机变量为了完全描述随机变量X,只知道它可能取的值是远远不,只知道它可能取的值是远远不够的,更重要的是要知道它取各个值的概率够的,更重要的是要知道它取各个值的概率 设离散型随机变量设离散型随机变量X 的可能取值为的可能取值为xk (k =1,2,),事件,事件X = xk 的概率为的概率为 PX = xk = pk (k =1,2,) (1)1)()2(1 Ppkk 称称(1)式为离散型随机变量式为离散型随机变量X 的的概率分布概率分布或或分布律分布律它也可它也可以用表格的形式来表示:以用
3、表格的形式来表示:X x1 x2 xn pk p1 p2 pn 由概率的定义,由概率的定义,pk满足如下两个条件满足如下两个条件 (1) pk 0 (k =1,2,) ; 反之,满足上述条件的数列反之,满足上述条件的数列pk都是某一随机变量的分布列。都是某一随机变量的分布列。 一般地,离散型随机变量的分布函数可表成一般地,离散型随机变量的分布函数可表成 xxkkxXPxF)(都是右连续单调不减的都是右连续单调不减的阶梯函数阶梯函数它在它在X 的每一个可能取值处的每一个可能取值处发生发生 “跳跃跳跃”,其跳跃的高度恰为,其跳跃的高度恰为X 取取xi 的概率的概率 显然,离散随机变量的分布函数由其
4、分布律惟一确定反显然,离散随机变量的分布函数由其分布律惟一确定反之,若已知离散随机变量的分布函数,则其分布律亦被惟一地之,若已知离散随机变量的分布函数,则其分布律亦被惟一地确定下来因而分布律和分布函数都能完整描述离散型随机变确定下来因而分布律和分布函数都能完整描述离散型随机变量的统计规律,在应用时可选一种即可。量的统计规律,在应用时可选一种即可。例例1 设设X 的分布函数为的分布函数为 51546 . 0425 . 0202 . 000)(xxxxxxF求求X 的分布率。的分布率。 解解 离散随机变量仅在其分布函数发生跳跃的点处取值,离散随机变量仅在其分布函数发生跳跃的点处取值,且其概率恰等于
5、该点处的跃度且其概率恰等于该点处的跃度 于是由分布函数可得分布律为于是由分布函数可得分布律为 X 0 2 4 5PX=k 0.2 0.3 0.1 0.4 1两点分布两点分布(0-1分布分布) 若随机变量若随机变量X只可能取两个值,其概率分布为只可能取两个值,其概率分布为 PX = 1= p,PX = 0= q( 0p1 ,pq =1) 则称则称X 服从服从两点分布两点分布或或0-1分布分布也可表示为:也可表示为: X 0 1pk 1 p p 111000)(xxqxxXPxF分布函数为分布函数为 对于只有两种可能结果的随机试验,总可以令其中一个对于只有两种可能结果的随机试验,总可以令其中一个结
6、果为事件结果为事件A,则另一个结果为,则另一个结果为则问题就归结为两点分布例如,一次射击的命中与否;一个则问题就归结为两点分布例如,一次射击的命中与否;一个新生儿是男是女;一次抽样结果是正品还是次品,等等新生儿是男是女;一次抽样结果是正品还是次品,等等 2二项分布二项分布 在在1.7中介绍了中介绍了n 重伯努利试验,当每次试验中事件重伯努利试验,当每次试验中事件A发生发生的概率为的概率为p(0p1)时,时,n 次试验中次试验中A发生的次数发生的次数X 的可能值为的可能值为0,1,2,n且且PX = k= pk =.A用用X=1表表A,X=0 表表.A)1;, 1 , 0( qpnkqpCknk
7、knX是一个离散型随机变量,是一个离散型随机变量,pk 满足满足(1) pk 0,k=0,1,2,n;1)()2(00 nnkknkknnkkqpqpCp 由于由于 pk 是二项式定理展开式的一般项,故称是二项式定理展开式的一般项,故称X 服从服从二项分布二项分布。 n 和和p 是两个重要的参数,又记为是两个重要的参数,又记为X B(n,p) 特别地,当特别地,当n=1时,二项分布即为两点分布时,二项分布即为两点分布 例例2 按规定,某型号的电子元件的使用寿命超过按规定,某型号的电子元件的使用寿命超过1500小时的小时的 为一级品已知某一大批产品的一级品率为为一级品已知某一大批产品的一级品率为
8、0.2, 现在从中随机地现在从中随机地 抽查抽查20只求只求20只元件中恰有只元件中恰有k只只(k = 0,1,20)为一级品的概率为一级品的概率. 解解 这是不放回抽样但由于这批元件的总数很大,且抽这是不放回抽样但由于这批元件的总数很大,且抽查的元件的数量相对于元件的总数来说又很小,因而可以当作查的元件的数量相对于元件的总数来说又很小,因而可以当作有放回抽样来处理,这样做会有一些误差,但误差不大我们有放回抽样来处理,这样做会有一些误差,但误差不大我们将检查一只元件看它是否为一级品看成是一次试验,检查将检查一只元件看它是否为一级品看成是一次试验,检查20只只元件相当于做元件相当于做20重伯努利
9、试验以重伯努利试验以X 记记20只元件中一级品的只只元件中一级品的只数,那么数,那么X 是一个随机变量,且有是一个随机变量,且有XB(20,0.2)由二项分布由二项分布的计算公式即得所求概率为的计算公式即得所求概率为 PX = k=kkkC 2020)8 . 0()2 . 0( k = 0,1,2,20)其具体计算结果为:其具体计算结果为: PX = 0=0.012 PX = 1=0.058 PX = 2=0.137PX = 3=0.205 PX = 4=0.218 PX = 5=0.175PX = 6=0.109 PX = 7=0.055 PX=8=0.022PX=9=0.007 PX =
10、10=0.002 PX = k 0.001 (k 11) 为了对本题的结果有一个直观了解为了对本题的结果有一个直观了解, 我们作出上述结果的图我们作出上述结果的图形,如图形,如图2.1所示所示 当当k 增加时增加时, 概率概率 PX =k 先是先是随之增加直至达到最大值随之增加直至达到最大值(k = 4), 随后单调减少一般,对于固定随后单调减少一般,对于固定的的n及及p,二项分布,二项分布B(n,p)都具有这一性都具有这一性质质 例例3 有一繁忙汽车站有大量汽车通过,设每辆汽车在一有一繁忙汽车站有大量汽车通过,设每辆汽车在一天的某段时间内出事故的概率为天的某段时间内出事故的概率为0.0001
11、,在某天的该段时间内,在某天的该段时间内有有1000辆汽车通过,问出事故的次数不小于辆汽车通过,问出事故的次数不小于2的概率是多少?的概率是多少? 解解 此题可看作是此题可看作是n = 1000的独立重复试验的独立重复试验, 每次试验事件每次试验事件出现的概率是出现的概率是p = 0.0001, 即即X B(1000,0.0001) 由于由于904818. 0)0001. 01()0001. 0(01000001000 CXP090482. 0)0001. 01()0001. 0(1999111000 CXP212 XPXP0047. 0101 XPXP 以上计算相当繁杂以上计算相当繁杂187
12、3年法国数学家泊松提出了泊松分年法国数学家泊松提出了泊松分 布当布当n 很大很大p 很小时,二项分布可用泊松分布近似计算很小时,二项分布可用泊松分布近似计算. 3泊松分布泊松分布 若随机变量若随机变量X 的概率分布为:的概率分布为:!kekXPk 1!)2(00 eekekXPkkk), 2 , 1 , 0( k为常数,则称为常数,则称X 服从参数为服从参数为的泊松分布,记为的泊松分布,记为X P().易证易证 (1) PX = k 0,k = 0,1,2,; 泊松定理泊松定理 设随机变量设随机变量X B(n,p)又设又设0是一常数,是一常数,n 是任意正整数,若是任意正整数,若np = ,则
13、对任一固定的非负整数,则对任一固定的非负整数k,有,有!)1(limkeppCkknkknn np 证证明明:由由knkknkknnnkknnnppC )1()(!)1()1()1( knknnnknk )1()1)(11()11(1 ! nnkknkknnnkppC)1(lim!)1(lim !kek 根据上述定理当根据上述定理当n很大,很大,p 很小的时候,二项分布有以下近很小的时候,二项分布有以下近似计算公式:似计算公式:!)1(keppCkXPkknkkn 其中其中 = n p 从下面的表格可以直观地看出上式的近似程度从下面的表格可以直观地看出上式的近似程度 二项分布公式二项分布公式泊
14、松近似公式泊松近似公式PX=kn=10 n=20 n=40 n=100 P=0.1 P=0.05 P=0.025 P=0.01= np =1PX=0PX=1PX=2PX=3PX=4PX40.349 0.358 0.369 0.3660.385 0.377 0.372 0.3700.194 0.189 0.186 0.1850.057 0.060 0.060 0.0610.011 0.013 0.014 0.0150.004 0.003 0.005 0.003 0.3680.3680.1840.0610.0150.004 在在n 20, p 0.05时通常用泊松分布近似代替二项分布时通常用泊松分
15、布近似代替二项分布效果比较好泊松分布的方便之处在于有现成的分布表可查效果比较好泊松分布的方便之处在于有现成的分布表可查. 例例4 为了保证设备正常工作,需配备适量的维修工人,为了保证设备正常工作,需配备适量的维修工人, 现现有同类型设备有同类型设备300台,各台工作是相互独立的,发生故障的概率台,各台工作是相互独立的,发生故障的概率都是都是0.01在通常情况下一台设备的故障可由一个人处理在通常情况下一台设备的故障可由一个人处理(我们我们也只考虑这种情况也只考虑这种情况),问至少需配备多少工人,才能保证当设备,问至少需配备多少工人,才能保证当设备发生故障但不能及时维修的概率小于发生故障但不能及时
16、维修的概率小于0.01? 解解 设配备设配备N人记同一时刻发生故障的设备台数为人记同一时刻发生故障的设备台数为X,那,那么,么,XB(300,0.01)所需解决的问题是确定最小的所需解决的问题是确定最小的N, 使得使得 PX N 0.01 由泊松定理由泊松定理(这里这里 = n p3):01. 0!313 NkkkeNXP 查附表查附表3, 可知满足上式最小的可知满足上式最小的N 是是8 因此因此, 为达到上述要为达到上述要求求, 至少需配备至少需配备8个工人个工人 类似的问题在其它领域也会遇到例如,机场的每条跑道类似的问题在其它领域也会遇到例如,机场的每条跑道不允许同时供多于一架飞机使用,而
17、对每架飞机都修一条跑道不允许同时供多于一架飞机使用,而对每架飞机都修一条跑道显然不是上策,但又不允许飞机在上空盘旋很久而得不到空闲显然不是上策,但又不允许飞机在上空盘旋很久而得不到空闲的跑道,这就要合理地确定修建跑道的条数的跑道,这就要合理地确定修建跑道的条数 泊松分布有广泛的应用,不仅在于它可以作为二项分布的泊松分布有广泛的应用,不仅在于它可以作为二项分布的极限形式,还由于许多问题中随机变量服从或近似服从泊松分极限形式,还由于许多问题中随机变量服从或近似服从泊松分布如,电话交换台在一分钟内收到的呼唤次数、纺织厂生产布如,电话交换台在一分钟内收到的呼唤次数、纺织厂生产的布匹上疵点个数的、一本书
18、一页中的印刷错误数、放射性物的布匹上疵点个数的、一本书一页中的印刷错误数、放射性物质在一段时间内放射的粒子数,等等,都可以认为是泊松分布质在一段时间内放射的粒子数,等等,都可以认为是泊松分布 不同的教材泊松分布表的形式可能不同:不同的教材泊松分布表的形式可能不同: 有的给出有的给出PX k ,有的直接给出,有的直接给出PX = k 例例5 设电话交换台每分钟接到呼唤次数设电话交换台每分钟接到呼唤次数X 服从参数为服从参数为=5的泊松分布求一分钟内呼唤次数为的泊松分布求一分钟内呼唤次数为8的概率和呼唤次数不超的概率和呼唤次数不超过过10次的概率次的概率 解解 由泊松分布公式,由泊松分布公式,X
19、的概率分布为的概率分布为),2,1 ,0(!55 kkekXPk065278.0!85858 eXP986205.0!5101005 kkkeXP 9585!5!5kkkkkeke 115!51kkke 4超几何分布超几何分布 设设N 件同类产品中有件同类产品中有M 件为次品,现从中任取件为次品,现从中任取n 件令件令X表示表示“n 件中所含次品数件中所含次品数”,则,则X 是一个离散型随机变量其概是一个离散型随机变量其概率分布为率分布为),min(, 1 , 0(nMkCCCkXPnNknMNkM 这时称这时称X 服从服从超几何分布超几何分布 如如100件产品中有件产品中有5件次品,从中任取件次品,从中任取10件,则次品数件,则次品数X 的的 概率分布为概率分布为)5 , 4 , 3 , 2 , 1 , 0(1010010955 kCCCkXPkk 可以证明当可以证明当N 很大时,超几何分布可用二项分布逼近,可令很大时,超几何分布可用二项分布逼近,可令knkknnNknMNkMppCCCCNNMp )1 (,当当