1、第二章 一维随机变量及其分布第一节 随机变量第二节 离散型随机变量第三节 随机变量的分布函数第四节 连续型随机变量及其概率密度第五节 随机变量的函数的分布第一节 随机变量定义 设X X(w)是定义在样本空间W上的实值函数,称X X(w)为随机变量.随机变量通常用大写字母X,Y,Z,W,.等表示下图给出样本点w与实数X X(w)对应的示意图 W1e2e3ex 这个定义表明,随机变量 X是样本点 的一个函数,这个函数可以是不同样本点对应不同的实数,也允许多个样本点对应同一个实数.这个函数的自变量(样本点)可以是数,也可以不是数,但因变量一定是实数.w w掷一颗骰子,出现的点数X是一个随机变量.电视
2、机的寿命T是一个随机变量.例如例如 对于样本点本身不是数的随机试验,这时可根据需要设计随机变量。1,0,.Xw ww w 合合格格品品;不不合合格格品品例例2 2 一射手对目标进行射击,击中目标记为1分,未中目标记为0分.设X表示该射手在一次射击中的得分,它是一个随机变量,可以表示为.,0,1未中击中;wwX例例3 3 观察一个电话交换台在一段时间(0,T)内接到的呼叫次数如果用X表示呼叫次数,那么 表示一随机事件,显然 也表示一随机事件),2,1,0(kkX),2,1,0(kkX()BXIww()().P XIP BPXIww随机变量的取值随试验的结果而定,而试验的各个结果出现有一定的概率,
3、因而随机变量的取值有一定的概率.按照随机变量可能取值的情况,可以把它们分为两类:离散型随机变量和非离散型随机变量,而非离散型随机变量中最重要的是连续型随机变量.因此,本章主要研究离散型及连续型随机变量.BIXI记为事件是一个实数集合若一般的,即于是定义 如果随机变量的全部可能取的值只有有限个或可列无限多个,则称这种随机变量为离散型随机变量.),2,1(kxkX 取各个可能值的概率,即事件 的概率为kxX,1,2,kkP Xxpk(1)称(1)式为离散型随机变量X的分布律.一般地,设离散型随机变量 X 所有可能取的值为第二节第二节 离散型随机变量离散型随机变量分布律也可以直观地用下面的表格来表示
4、:Xnxxx21kpnppp21由概率的定义,式(1)中的 应满足以下条件:kp,2,1,01kpk。.121kkp。随机变量X的所有取值随机变量X的各个取值所对应的概率 例1 某系统有两台机器相互独立地运转设第一台与第二台机器发生故障的概率分别为0.1,0.2,以X表示系统中发生故障的机器数,求X 的分布律 2,1iiAi台机器发生故障”,表示事件“第设解72.08.09.0)(021AAPXP26.02.09.08.01.0)()(12121AAPAAPXP02.02.01.0)(221AAPXP故所求概率分布为:X210kp02.026.072.0(一)(一)(0 01 1)分布)分布
5、设随机变量 X 只可能取0与1两个值,它的分布律是)1,10(1,0,1qppkqpkXPkk则称 X 服从(01)分布或两点分布(01)分布的分布律也可写成 X10kppq抛一枚硬币,观察出现正面H还是反面T,正面X0,反面X1T H对于一个随机试验,如果它的样本空间只包含两个元素,即 ,我们总能在W上定义一个服从(01)分布的随机变量 12,Ww w.,1,0)(21wwwww当当XX来描述这个随机试验的结果。检查产品的质量是否合格,对新生婴儿的性别进行登记,检验种子是否发芽以及前面多次讨论过的“抛硬币”试验都可以用(0-1)分布的随机变量来描述伯努利试验是一种非常重要的概率模型,它是“在
6、同样条件下独立地进行重复试验或观察”的一种数学模型,有着广泛的实际应用设试验 只有两个可能结果:及 ,则称 为伯努利(Bernoulli)试验设 ,此时 ,将E 独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验.EAA)10()(ppAPpAP1)(E(二)(二)伯努利试验与二项分布伯努利试验与二项分布012kn knP Xkp qknk ,二项分布二项分布显然 0 kXP00()1nnkn knkknP Xkp qp qk 满足分布律的两个条件即kXP注意到 刚好是二项式 的展开式中 knknp qknqp)(的二项分布服从参数为量的那一项,故称随机变出现pnXpk,X记为(,)
7、B n p例例2 2 已知某类产品的次品率为0.2,现从一大批这类产品中随机地抽查20件,问恰好有k(k=0,1,2,20)件次品的概率是多少?解解 这是不放回抽样但由于这批产品的总数很大,且抽查的产品的数量相对于产品的总数来说又很小,因而可以当作放回抽样来处理这样做会有一些误差,但误差不大.我们将检查一件产品是否为次品看成是一次试验,检查20件产品相当于做20重伯努利试验以X记抽出的20件产品中次品的件数,那么X是一个随机变量,且XB(20,0.2)则所求的概率为 2020(0.2)(0.8)0120kkP Xkkk,将计算结果列表如下:kXPkXPkk0123450.0120.0580.1
8、370.2050.2180.175678910110.1090.0550.0220.0070.002 0.001作出上表的图形,如下图所示 直至达到先是随之增加增加时,概率从上图可以看出,当,kXPk4knp最大值(),随后单调减少.一般地,对于固定的 及,二项分布(,)B n p都有类似的结果。(三)泊松分布0,1,2,X设随机变量所有可能取值为,!kkXPke,210k0其中是常数()X 记为且有显然,,2,1,0kkXP1eeee000kkkkkkkkXP!而取各个值的概率为X则称 服从参数为 的泊松分布,满足分布律的两个条件即kXP1.泊松分布例3 商店的历史销售记录表明,某种商品每月
9、的销售量服从参数为 10的泊松分布为了以95%以上的概率保证该商品不脱销,问商店在月底至少应进该商品多少件?解按题意要求为件,件,月底的进货量为种商品设商店每月销售nX该95.0 nXP的泊松分布,则有服从10Xnkkk01095.0e10!由附录的泊松分布表知.95.09513.0e1095.09166.0e101501014010kkkkkk!,!只要在月底进货15件(假定上个月没有存货),就可以95%的概率保证这种商品在下个月内不会脱销证明略2.二项分布的泊松近似 lim1.!kn kknnnnppekk 1,0,1,2,.!kn kknpnnpppekkk 解解 10.2100.211
10、10.9820.018.!kkP Xek 30.9200.93110.9870.013.!kkP Xek 注意注意 此种情况下,不但所求概率比(1)中有所降低,而且3名维修工负责90台设备相当于每个维修工负责30台设备,工作效率是(1)中的1.5倍.10530510110.9860.014.!kkP Xek 注意注意 此种情况下所求概率与(2)中基本上一样,而10名维修工负责500台设备相当于每个维修工负责50台设备,工作效率是(2)的1.67倍,是(1)中的2.5倍.在几何上,它表示随机变量X的取值落在实数x左边的概率第三节 随机变量的分布函数是任意实数,函数是一个随机变量,设xX定义 xX
11、PxF)(的分布函数称为X分布函数是一个普通的函数,其定义域是整个实数轴Xx分布函数具有以下基本性质:1)(0 xF1.的不减函数是xxF)(2.1)(lim)(0)(lim)(xFFxFFxx,3.)()0(xFxF是右连续的即)(xF4.例例1 1的分布律为设随机变量XXkp-1 0 1 10 XPX的分布函数,并求求由概率的有限可加性分布函数为:0 11 104()3 0141 1xxF xxx 01010(1)(0)0311423.4PXPXP XFFP X 解解的图形如下图所示)(xF 1011 1 11014 2 4F xXX分布函数的图形是一条阶梯曲线,它在 ,处有跳跃其跳跃值分
12、别为 取,的概率,.111xF(x)的分布函数为变量一般地,设离散型随机X,21kpxXPkk的分布函数为由概率的可列可加性得 X,2,1,)(kkkxXPpkxxxF其跳跃值为处有跳跃,在分布函数xxkkpxF)(kxxk对所有满足的 求和。第四节 连续型随机变量及其概率密度定义,使对于任意实数有负函数如果存在非的分布函数对于随机变量)(),(xfxFX xttfxFd.)(概率密度的概率密度函数,简称为称其中函数称为连续型随机变量,则XxfX 具有以下性质由定义知道,概率密度xf(1)0fx (2)1fx dx1212(3),x xxx对于任意实数有 dxxfxFxFxXxPxx21122
13、1(4)()()()f xxF xf x若在点 连续,则有121212(,(,()()Xx xP xXxx xf x落在区间上的概率等于区间上曲线之下的曲边梯形的面积 如图性质(1),(2)是两个最基本的性质有的连续点对于知由性质xxf)(,)4(xxxXxPxxFxxFxfxx00limlim直观述它的分布比分布函数机变量,用概率密度描因此对于连续型随附近的值的概率大小取映出的大小能反的概率分布的密集程度在点而是的概率取值不是随机变量上式表明概率密度xXxfxXxXxf)(,)(例1 设连续型随机变量X具有概率密度 1,02,0,.kxxfx其他k确定常数)1(xFX的分布函数求)2(252
14、3)3(XP求20(1)()d1,(1)d1f xxkxx由得(2)X的分布函数为 20,01d,0241,2 xxF xf ttxxxx5335(3)22221 0.93750.0625PXFF 解1/2k 解得均匀分布具有概率密度设连续型随机变量 X,0,1其他bxaabxf),(,),(baUXbaX记为上服从均匀分布在区间则称 1d,0)(xxfxf且易知满足连续型随机变量的两个最基本性质 fx 的图形与子区间的位置无关而子区间的长度子区间的概率只依赖于落在或者说可能性是相同的一等长度的子区间内的中任落在变量上服从均匀分布的随机在,),(,),(),(baXbaXba的分布函数为X b
15、xbxaabaxaxxF ,1 ,0()F x 相应的图形为例2解指数分布概率密度为设连续型随机变量X,0 ,0,0 ,exxxfx的指数分布服从参数为则称常数为其中X,0 1ded0)(0 xxxfxfx且易知的分布函数为X.,00 ,e1其他,xxFx满足连续型随机变量的两个最基本性质指数分布的概率密度及分布函数分别如图所示 例3()1/1000,31000X已知某种电子元件寿命单位:h 服从参数的指数分布 求 个这样的元件使用小时至少有一个已损坏的概率。解:的概率密度为X.0 ,0,0 ,e100011000 xxxfx 11000ed1000 xxfXP于是各元件的寿命是否超过1000
16、小时是独立的,因此3个元件使用1000小时都未损坏的概率为 ,从而至少有一个已损坏的概率为 3e31 e正态分布概率密度为设连续型随机变量 X22()21()e,2xf xx ).,(,)0(,2 NXX记为分布的正态服从参数为则称为常数其中()0()1f xf x dx显然,下面来证明满足连续型随机变量的两个最基本性质得令,tx222()2211eded22xtxt20ed,2xx利用有22ed2tt于是22()21ed12xx如图所示)(xf.)()(,.)(,)(的图形就越平的值越大,反之,当的图形越尖。的值越小固定时当达到最大处在对称的图形关于直线函数xfxfxxfxxf 的分布函数为
17、X22()21()ed2txF xt如下图所示)(xF表示,即有分别用其概率密度和分布函数。记为服从标准正态分布时称当)(),()1,0(,1,0 xxNXX221()e,2xx221()ed2txxt()1()xx易知引理若2(,)XN 则(0,1)XYN4例解816816(2)0.977344XP XP880(2)1(2)0.022744 XP XP12882081220(3)(1)4440.99870.84130.1574XPXP查表得的分布函数由引理及,X已知求16,0P XP X及1220PX)(8,4 2NX5例设2(,)XN 内的概率落在区间求),(kkX),3,2,1(k解P
18、XkPkXk()()2()1kkk于是2(1)10.6826 P X2 2(2)10.9544 P X3 2(3)10.9973P X 3 13 0.00270.003P XP X 则有.003.0)3,3(不会发生在实际问题中常认为它,以外的概率小于落在 X)(,10,),1,0(如下图所示分位点为标准正态分布的上称点则满足条件若设uuXPuNXuux1)(的图形的对称性可知:由第五节 随机变量的函数的分布在实际问题中,不仅需要研究随机变量,往往还要研究随机变量的函数.即已知随机变量X的概率分布,求其函数Y g(X)的概率分布.1例2(1)2;(2)(1)XYXZX设随机变量 具有以下分布(
19、如下表),试求的分布律。P-10120.30.20.10.4。的所有可能取值为4,2,0,2)1(Y的分布律为得由YpkXPkYPk2解YP-20240.30.20.10.44,1,0)2(的所有可能取值为Z20(1)010.1P ZPXP X=-=21(1)1020.6P ZPXP XP X=-=+=24(1)410.3P ZPXP X=-=-=的分布律为故zZP0140.10.60.3例例2 2.,),(2的概率密度求具有概率密度设随机变量XYxxfXX解).()(),(,yFYyFxFYXYYX的分布函数先求的分布函数为分别记时有当时,故当由于00)(0,02yyFyXYY)(2yXPy
20、YPyFYyXyP()()XXFyFy-的概率密度为即得求导关于将yyyFY,)()(yfY.0,00),()(21yyyfyfyXX)(1(0,1),XN设其概率密度为,21)(22xexfxX21YX由()得的概率密度为.0,00,21221yyeyy)(yfY.12分布的服从自由度为此时称 Y定理xxfXX),(具有概率密度设随机变量)0)(0)()(xgxgxg或恒有处处可导且恒有函数其概率密度为是连续型随机变量则,)(XgY,0,)()(其他yyhyhfX)(yfY),(),(max(),(),(min(gggg其中的反函数是)()(xgyh证严格在此时的情况先考虑),()(.0)(
21、xgxg严格单调且在存在它的反函数单调增加),(,)(,yh).(),(,.yFxFYXYX的分布函数为分别记增加、可导1)(,0)(,),()(yFyyFyxgYYY时;当时故当取值在由于时当 y)()(yXgPyYPyFY)()(yhFyhXPX的概率密度即得求导关于将YyyFY,)()(),()0,XYfh y h yyfy其他的情况,同样的有再考虑0)(xg()(),()0,XYfh yh yyfy其他式,命题得证。合并以上2 min,max,.g ag bg ag b1()()()XXybybybffaaaa )(xfX而22()21e,2xx 所以2()2()1()e,.2yax baYfyxa YaXb 的的概概率率密密度度为为.),(2也服从正态分布的线性函数,试证明设随机变量baXYXNX 证明例例3 3).)(,(2abaNbaXY故ba,1在上例中取特别地,得)1,0(NXY果这就是上一节引理的结