1、 随机变量 离散型随机变量 连续型随机变量 概率分布函数 随机变量函数的分布第二章 随机变量及其分布1.1 随机变量一随机变量的概念 为了更深入地研究随机现象,就要建立数学模型,随机变量是随机现象的最基本的数学模型.引入了随机变量,我们就可以用随机变量的值表示随机试验的结果 在实际问题中,随机试验的结果可以用在实际问题中,随机试验的结果可以用数量来表示,由此引入了随机变量的概念数量来表示,由此引入了随机变量的概念 1 1、有些试验结果本身与数值有关(本身、有些试验结果本身与数值有关(本身就是一个数)就是一个数)例如例如 掷一颗骰子,观察出现的点数;掷一颗骰子,观察出现的点数;观察某天从北京下火
2、车的人数;观察某天从北京下火车的人数;观察昆虫的产卵数观察昆虫的产卵数 2 2、此外,还有些试验结果看来与数值无、此外,还有些试验结果看来与数值无关,但我们可以引进一个变量来表示它的各关,但我们可以引进一个变量来表示它的各种结果种结果.也就是说,可以也就是说,可以将试验结果数值化将试验结果数值化 正如正如裁判员在运动场裁判员在运动场上不叫运动员的名字而叫上不叫运动员的名字而叫运动员的运动员的号码一样,二者号码一样,二者之间建立了一种对应关系之间建立了一种对应关系.这种对应关系在数学上理这种对应关系在数学上理解为定义了一种实值函数解为定义了一种实值函数 例例1 1 掷一颗骰子掷一颗骰子,样本空间
3、是样本空间是 1,2,6 用用X 表示掷出的点数表示掷出的点数,称称X 是随机变量是随机变量 3X 表示掷出的点数不超过表示掷出的点数不超过3 31,2,3X 是事件是事件并且并且再看两个例子再看两个例子 ,X将将X 视为视为 上的函数上的函数 1,2,Xjj 则则是事件是事件例例1 1(续)(续)例例2 2 在一副扑克的在一副扑克的52 张中任取一张张中任取一张 样本空间的每个样本点表示一张扑克样本空间的每个样本点表示一张扑克用用X 表示所取扑克的大小表示所取扑克的大小称称X 是随机变量是随机变量 3X 表示所取到的扑克是表示所取到的扑克是3 33XX =草花草花3,黑桃黑桃3,红桃红桃3,
4、方块方块3 是事件是事件将将X 视为样本空间上的函数视为样本空间上的函数 ,XX则则例例2 2(续)(续)可以看出,上述随机试验的每一个结果都对应着变量X 的一个确定的取值,因此变量X 是样本空间 上的实值函数:并且定义了随机变量后,就可以用随机变量的取值情况来刻划随机事件 XX 由此看到,随机试验的结果可以用数量来表示,因此引入随机变量的概念 XX 定义定义1.11.1 X 通常将随机变量通常将随机变量 简记为简记为X 一般一般用用X,Y,Z,等表等表示随示随机变机变量量 ,随机随机变量变量X 是是定义定义在样在样本空本空间间 上的上的 实实值值函函数数:对对每每一一个个样样本本点点 一一个
5、个实实数数 X,是是 1 1、随机变量随机变量X 随试验结果的不同而取不随试验结果的不同而取不同的值,因而在试验之前只知道它可能取值同的值,因而在试验之前只知道它可能取值的范围,而不能预先肯定它将取哪个值的范围,而不能预先肯定它将取哪个值 2 2、由于试验结果的出现具有一定的概率,由于试验结果的出现具有一定的概率,于是这种实值函数取每个值和每个确定范围内于是这种实值函数取每个值和每个确定范围内的值也有一定的概率的值也有一定的概率说 明说 明 Xx XA Xx 3 3、我们用我们用 表示事件表示事件 表示事件表示事件 对于实数的集合对于实数的集合A,我们用我们用 XA XAXA即 XxXx即 4
6、 4、在许多实际问题中在许多实际问题中,一个随机变量一个随机变量X 的的含义是十分清楚的含义是十分清楚的,所以一般不再关心随机变所以一般不再关心随机变量量X 在样本空间在样本空间上是如何定义的上是如何定义的.可以认为可以认为X的所有取值就是我们的样本空间的所有取值就是我们的样本空间.只是在必要只是在必要的时候才将自变元的时候才将自变元 写出来写出来说 明 引入了随机变量引入了随机变量,随机试验中的各种事件,随机试验中的各种事件,就可以通过随机变量的关系式表达出来就可以通过随机变量的关系式表达出来 可见,随机事件这个概念实际上是包容在可见,随机事件这个概念实际上是包容在随机变量这个更广的概念内随
7、机变量这个更广的概念内.也可以说,也可以说,随机随机事件是从静态的观点来研究随机现象,而随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点变量则是一种动态的观点.就象数学分析中常就象数学分析中常量与变量的区别那样量与变量的区别那样二随机变量的意义 随机变量概念的产生是概率论发展史上的随机变量概念的产生是概率论发展史上的重大事件重大事件.引入随机变量后,对随机现象统计引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究大为对随机变量及其取值规律的研究 例3 一批产品有50 件,其中有8件次品
8、,42 件正品,现从中取出 6 件 X 表示取出6 件产品中的次品数 则X 就是一个随机变量 它的取值为 0,1,2,6 0X 表示取出的产品全是正品这一随机事件 1X 表示取出的产品至少有一件是次品这一随机事件 例4 上午 8:009:00 在某路口观察 Y 表示该时间间隔内通过的汽车数 则Y 就是一个随机变量 它的取值为 0,1,100Y 表示通过的汽车数小于100辆这一随机事件 50100Y 注意 Y 的取值是可列无穷个!表示通过的汽车数大于50 辆但不超过100辆这一随机事件 例5 观察某生物的寿命(单位:小时)Z 表示该生物的寿命 则Z 就是一个随机变量 它的取值为所有非负实数 15
9、00Z 3000Z 表示该生物的寿命大于 3000小时这一随机事件表示该生物的寿命不超过1500小时这一随机事件注意注意 Z 的取值是的取值是不可列无穷个不可列无穷个例6 掷一枚硬币,令掷硬币出现反面掷硬币出现正面01X则X 是一个随机变量注意在同一个样本空间上可以定义不同的随机变量 例7 掷一枚骰子,在例1中,我们定义了随机变量 X 表示出现的点数.我们还可以定义其它的随机变量,例如我们可以定义出现奇数点出现偶数点01Y6061点数不为点数为Z等等一.离散型随机变量的概念与性质2.2 2.2 离散型随机变量离散型随机变量 有些随机变量只能取有些随机变量只能取有限个有限个或或可列个可列个值值,
10、比如,被访问者的性别、年龄、职业比如,被访问者的性别、年龄、职业;一批一批产品中次品个数产品中次品个数;一个医学试样中白细胞个一个医学试样中白细胞个数数;掷两个骰子第一次得到掷两个骰子第一次得到12点的次数点的次数;等等等等 定义定义 2.12.112,nxxx12,xx 如果随机变量如果随机变量 X 只取有限个值只取有限个值或可列个值或可列个值则称则称 X 是是离散型随机变量离散型随机变量,简称为简称为离散随机离散随机变量变量离散型随机变量的定义离散型随机变量的定义设X 是离散型随机变量,称 ,1kkP Xxpk离散型随机变量的概率分布离散型随机变量的概率分布定义定义 2.22.2 kp为为
11、X 的的概率分布概率分布;称称 是是概率分布列概率分布列,简称为简称为分布列分布列 离散型随机变量的离散型随机变量的概率分布概率分布也常常用也常常用如下方式表达如下方式表达说 明 离散型随机变量可完全由其分布列来刻划.即离散型随机变量可完全由其可能取值以及取这些值的概率唯一确定分布列具有如下性质 10;1kjjapbp 用这两条性质判断用这两条性质判断一个函数是否是一个函数是否是概率分布概率分布例1 从110这10个数字中随机取出5个数字,X 表示取出的5个数字中的最大值.试求X 的分布列 415105610kCP XkkC,即 X 的分布列为解:X 的取值为5,6,7,8,9,10.并且例2
12、 将 1枚硬币掷 3次,X 表示出现的正面次数与反面次数之差.试求X 的分布列解:X 的取值为-3,-1,1,3则 X 的分布列为例3 设离散型随机变量 X 的分布列为 则 2012P XP XP XP X 131161616 516 例3(续)345P XP XP X341616 716 0.5312PXP XP X 311616 416 例4 设随机变量 X 的分布列为 1124nP Xncn,解:由分布列的性质,得 11114nnnP Xnc该级数为等比级数,故有 11114nnnP Xnc 14114c 所以3c 试求常数c例例5 5 设一汽车在开往目的地的道路上需经过四设一汽车在开往
13、目的地的道路上需经过四盏信号灯,每盏信号灯以盏信号灯,每盏信号灯以 1/2 的概率允许或禁的概率允许或禁止汽车通过止汽车通过.以以X 表示汽车首次停下时,它已表示汽车首次停下时,它已通过的信号灯的盏数,求通过的信号灯的盏数,求 X 的分布列的分布列.(.(信号信号灯的工作是相互独立的灯的工作是相互独立的)PX=3=(1-p)3p解解:以以 p 表示每盏信号灯禁止汽车通过的表示每盏信号灯禁止汽车通过的 概率,则概率,则 X 的分布列为的分布列为 0 1 2 3 4 Xpk p (1-p)p (1-p)2p (1-p)3p (1-p)4 或写成或写成 PX=k=(1-p)k p,k=0,1,2,3
14、 PX=4=(1-p)4 例例5(5(续续)以以 p=1/2 代入,得代入,得Xpk 0 1 2 3 4 0.5 0.25 0.125 0.0625 0.0625例例5(5(续续)二.几种常用的离散型随机变量如果X 只取 0或 1,概率分布是 01,0,1,P XqP Xpp qpq 或 则称随机变量 X 服从参数为 p的两点分布 1.两点分布(Bernoulli分布)1,Bp 1,XBp记作 两点分布的概率背景 1P ApP Apq,X 表示在一次试验中事件A 发生的次数令不发生若事件发生若事件AAX01 1,XBp记则 任何一次试验,当只考虑两个互逆的结果A与 时,或者形象地把两个互逆结果
15、叫做“成功”和“失败”.就可以用两点分布来描述A例6 15件产品中有4件次品,11件正品,从中任取1件.X 表示取出的一件产品中的次品数.则X 的取值为 0 或者 1,并且 114011515P XP X ,4115即即,XB 如果随机变量 X 有如下的概率分布2.二项分布(Binomial分布),Bnp则称则称X 服从服从参数为参数为 n和和 p的的二项分布二项分布,0,1,0,1kkn knP XkC p qknp qpq ,XBnp 记作记作 二项分布的二项分布的概率分布示意图概率分布示意图说 明1.显然,当 n=1 时 1XBp,此时,此时,X 服从两点分布服从两点分布这说明,两点分布
16、是二项分布的一个特例这说明,两点分布是二项分布的一个特例 0nnkkn knkpqC p q 第第k+1项项 kkn knC p q 2.2.称为二项分布的原因是称为二项分布的原因是 为为 二项展开式二项展开式二项分布的概率背景进行n重贝努里试验,设在每次试验中 1P ApP Apq,X 表示在 n 重贝努里试验中事件 A 发生的次数 ,XB np则 一般地,设在一次试验中我们只考虑两个一般地,设在一次试验中我们只考虑两个互逆的结果互逆的结果 A或或 ,或者形象地把两个互逆,或者形象地把两个互逆结果叫做结果叫做“成功成功”和和“失败失败”A 再设我们重复地进行再设我们重复地进行 n 次独立试验
17、次独立试验 (“(“重复重复”是指这个试验中各次试验条件相是指这个试验中各次试验条件相同同 )每次试验成功的概率都是每次试验成功的概率都是 p,失败的概率,失败的概率都是都是 q=1-p 这样的这样的n次独立重复试验次独立重复试验称作称作 n 重贝努里重贝努里试验试验,简称贝努里试验或,简称贝努里试验或贝努里概型贝努里概型n重贝努里试验重贝努里试验 对同一目标进行 n 次射击,若每次射击只关心“击中目标”与“未击中目标”两种情况n重贝努里试验的例子 掷 n 次硬币,只关心“出现正面”与“出现反面”这两种情况;掷 n 颗骰子,如果我们对每颗骰子只关心“出现六点”与“不出现六点”这两种情况;注注:
18、贝努里概型对试验结果没有等可能的贝努里概型对试验结果没有等可能的要求,但有下述要求要求,但有下述要求(1 1)每次试验条件相同;)每次试验条件相同;二项分布描述的是二项分布描述的是n重贝努里试验中出现重贝努里试验中出现“成功成功”次数次数 X 的概率分布的概率分布(2 2)每次试验只考虑两个互逆结果)每次试验只考虑两个互逆结果A或或 ,A且且 P(A)=p ,()1P Ap(3 3)各次试验相互独立)各次试验相互独立.设在n重贝努里试验中 1P ApP Apq,12,n每一个样本点可记作现考虑事件现考虑事件n 重贝努里试验中事件重贝努里试验中事件A 恰好发生恰好发生k 次次,Bkn 其中每一个
19、 只取 A 或 ,i A2n共共有有个个 :现求概率现求概率,knBP分析 12,kn knPp q 在在 n 次次试试验验中,中,指指定定 k 次次出出现现 A(成成功功),其其余余 n k 次次出出现现 (失失败败),这这种种指指定定的的方方法法有有 种种knCA 而对于每一种指定好的方法,有 1kkn knknP BC p qqp,0,1,kn 因此 用用X 表示表示 n重贝努里试验中事件重贝努里试验中事件 A(成功)出现的次数(成功)出现的次数,则,则()(1)0,1,kkn knP XkC ppkn 称称X 服从参数为服从参数为 n和和 p的二项分布,记作的二项分布,记作 X B(n
20、,p)二项分布的图形二项分布的图形二项分布随机数二项分布随机数演示演示例7 一张考卷上有5 道选择题,每道题列出4个可能答案,其中只有一个答案是正确的.某学生靠猜测至少能答对4 道题的概率是多少?41APA,则答对一道题则答 5 道题相当于做 5 重贝努里试验解:每答一道题相当于做一次试验则1 5,4X令 X 表示该学生靠猜测能答对的题数例7(续)所以 45P XP X P 至少能答对4 道题 4P X 4545131444C 164 2.泊松分布(Poisson 分布)P 如果随机变量 X 有如下的概率分布 !0,1,kP Xkekk X P 记记作作 0 其中 是常数.则称X 服从参数是
21、的Poisson分布,泊松分布的图形泊松分布的图形泊松分布随机数泊松分布随机数演示演示Poisson分布的应用 电话总机在某一时间间隔内收到的呼叫次数;放射物在某一时间间隔内发射的粒子数;容器在某一时间间隔内产生的细菌数,等等.在一定条件下,都是服从Poisson分布的 Poisson分布是概率论中重要的分布之一 自然界及工程技术中的许多随机指标都服从Poisson分布,例如 例8 1910年,著名科学家Rutherford(罗瑟福)和 Geiger(盖克)观察了放射性物质钋放射 粒子的情况 他们进行了N=2608次观测,每次观测7.5秒,一共观测到10094个 粒子放出,下面的表是观测记录
22、观测到的粒子数 k观测到k 个粒子的次数 发生的频率 0 570.0220.021 12030.0780.081 23830.1470.156 35250.2010.201 45320.2040.195 54080.1560.151 62730.1050.097 71390.0530.054 8 450.0170.026 9 270.0100.01110+160.0060.007 总计 2608 0.999 1.00 km/kmN P Yk 3.87YP用用Y 表示这块放射性钋在表示这块放射性钋在7.5秒内放射出的秒内放射出的 粒子数粒子数 P Yk 在在 N=2608 次重复观测中发生的次重
23、复观测中发生的频率频率和和 基本相同基本相同.见书见书p42图图 Yk 表的最后两列表明表的最后两列表明,事件事件 3.87P 其中的Y 是服从 分布的随机变量,是7.5秒中放射出 粒子的平均数10094/26083.87 11211!n kkknnnkn knnC ppn nnnkknn lim0nnnp 设在n重贝努里试验中,以 代表事件 A 在一次试验中发生的概率,它与试验总数n 有关.若 npPoisson定理则 lim1!kn kkknnnnC ppek 证明:nnnp 令则Poisson定理的证明(续)1211111!n kknnkknnnn 对于固定的 k,有limkknn 得l
24、imlimnnnnnp 由lim 1lim1nnn knnn knnnnnn e Poisson定理的证明(续)所以 lim1n kkknnnnC pp 121lim1111!n kknnnkknnnn 1121limlim 111lim 1!n kknnnnnkknnnn !kek Poisson定理的应用 二项分布与泊松分布关系 由 Poisson 定理,可知()XB np若若,1!n kkknnnkP XkC ppek 有np 令则当 n比较大,p 比较小时上面我们提到上面我们提到单击图形播放单击图形播放/暂停暂停ESCESC键退出键退出二项分布二项分布 泊松分布泊松分布)(nnp 例例
25、9 9 为了保证设备正常工作,需配备适量的维为了保证设备正常工作,需配备适量的维修工人,现有同类型设备修工人,现有同类型设备 300台,各台工作是台,各台工作是相互独立的,发生故障的概率都是相互独立的,发生故障的概率都是 0.01.在在通常情况下,一台设备的故障可有一人来处理通常情况下,一台设备的故障可有一人来处理.问至少需配备多少工人,才能保证当设备发生问至少需配备多少工人,才能保证当设备发生故障但不能及时维修的概率小于故障但不能及时维修的概率小于0.01?解解:设需配备设需配备 N 人,记同一时刻发生故障的人,记同一时刻发生故障的 设备台数为设备台数为X,则则 X B(300,0.01)欲
26、确定最小的欲确定最小的 N 的取值,使得的取值,使得0.01P XN 3030.99!kNkeP XNk 33013310.01!kkNkkNeekk 查表可知,满足上式的最小的查表可知,满足上式的最小的 N是是 8,因此因此至少需配备至少需配备 8 个工人个工人0.01P XN 例例9(9(续续)例例1010 设有设有 80 台同类型的设备,各台工作是台同类型的设备,各台工作是相互独立的,发生故障的概率都是相互独立的,发生故障的概率都是 0.01,且,且一台设备的故障能由一个人处理。考虑两种一台设备的故障能由一个人处理。考虑两种配备维修工人的方法配备维修工人的方法:其一,由其一,由 4人维护
27、,每人负责人维护,每人负责 20 台台其二,由其二,由 3 人,共同维护人,共同维护 80 台台试比较这两种方法试比较这两种方法在设备发生故障时不能及在设备发生故障时不能及时维修的概率的大小时维修的概率的大小2P X 2!kkek 解解:按第一种方法按第一种方法.以以 X 记记“第第1人负责人负责 的的20台中同一时刻发生故障的台数台中同一时刻发生故障的台数”则则 X B(20,0.01)以以 Ai 表示事件表示事件“第第 i 人负责的台中人负责的台中发生故障不能及时维修发生故障不能及时维修”则则 80 台中发生故障而不能及时维修台中发生故障而不能及时维修的概率为的概率为例例10(10(续续)
28、0.22(0.2)0.0175!kkek 12341()()P AAAAP A 按第二种方法按第二种方法.以以 Y 记记 80 台中同一台中同一时刻发生故障的台数时刻发生故障的台数则则 Y B(80,0.01)故故 80 台中发生故障而不能及时维修的台中发生故障而不能及时维修的概率为概率为0.84(0.8)40.0091!kkP Yek 第二种方法中发生故障而不能及时维修第二种方法中发生故障而不能及时维修的概率小,且维修工人减少一人。的概率小,且维修工人减少一人。运用运用概率论讨论国民经济问题,可以有效地概率论讨论国民经济问题,可以有效地使用人力、物力资源使用人力、物力资源例例10(10(续续
29、)12P XP X解:随机变量 X 的分布律为 ,0,1,!kP Xkekk 由已知 12P XP X 4P X 试求试求 例11 设随机变量X 服从参数为 的Poisson分布,且已知例11(续)得由此得方程得解所以121!2!ee 220 2 (另一个解 不合题意,舍去)0 223e-=0.09022=42244!PXe 4.超几何分布(Hypergeometric分布)H(n,M,N)如果随机变量 X 有如下的概率分布 0,1,mn mMNMnNC CP XmCmM 则称则称 X 服从超几何分布服从超几何分布记作记作 ,X H n M N超几何分布的概率背景 一批产品有 N 件,其中有
30、M 件次品,其余 N-M件为正品现从中取出 n 件,X 表示取出 n 件产品中的次品数 则 X 的分布列为 0,1,mn mMNMnNC CP XmCmM ,XHn MN如果随机变量 X 有如下的概率分布5.几何分布(Geometric分布)11,2,0,1kP Xkqpkpqpq 则称则称 X 服从参数是服从参数是 p 的几何分布的几何分布几何分布的概率背景 设某试验成功概率为设某试验成功概率为 p,独立地重复独立地重复此试验此试验直到第一次成功直到第一次成功,则第一次成功需,则第一次成功需要的试验次数分布为参数要的试验次数分布为参数 p 的几何分布的几何分布 例12 对同一目标进行射击,设每次射击时的命中率为0.64,射击进行到击中目标时为止,X 表示所需射击次数试求随机变量 X 的分布列,并求至少进行2次射击才能击中目标的概率解:X 的取值为 1,2,n P Xn=P 前 n-1次射击均未击中,第 n次射击时击中目标=P 前 n-1次射击均未击中 P 第 n次射击时击中目标例12(续)10.360.641,2,nP Xnn 由独立性,得 X 的分布列为 22PP X 至至少少射射击击 次次才才命命中中120.360.64kk 0.360.6410.36 0.36 作业 2.1;2.2;2.19;2.22