1、 2.3 连续型随机变量连续型随机变量 一、连续型随机变量及其概率密度函数的定义一、连续型随机变量及其概率密度函数的定义 定义定义 设随机变量设随机变量X 的分布函数为的分布函数为F(x),若存在非负可积函,若存在非负可积函数数 f(x),使得对于任意实数,使得对于任意实数 x 有有 dttfxXPxFx )()(则称则称X 为为连续型随机变量连续型随机变量,函数,函数 f(x) 称为随机变量称为随机变量X 的的概率密度概率密度函数函数,简称,简称概率密度概率密度 可以证明可以证明连续型随机变量的分布函数连续型随机变量的分布函数F(x)为连续函数为连续函数 在实际应用中遇到的基本上是离散型或连
2、续型随机变量本在实际应用中遇到的基本上是离散型或连续型随机变量本书只讨论这两种随机变量书只讨论这两种随机变量 概率密度函数概率密度函数f(x) 具有以下性质:具有以下性质: (1) f(x)0)( x 1)()2(dxxf (4) 若若 f(x) 在点在点 x 处连续,则处连续,则F(x) = f (x) 由积分的几何意义:概率值由积分的几何意义:概率值Px1X x2 为曲线为曲线y = f(x)与与x 轴及两直线轴及两直线x = x1 和和x = x2 所围的平面图形的面积所围的平面图形的面积 性质性质(4)为我们揭示了密度函数的概率涵义由导数定义,为我们揭示了密度函数的概率涵义由导数定义,
3、 21)()()()3(1221xxdxxfxFxFxXxP 于是当于是当x( 0)充分小时充分小时, PxXx+ xf(x) x。这表明这表明f(x) 本身并非概率,但它的大小却决定了本身并非概率,但它的大小却决定了X 落入区间落入区间x ,x+x内的概内的概 率的大小即率的大小即f(x) 反映了点反映了点x 附近所分布的概率的附近所分布的概率的“疏密疏密”程度程度 即概率密度。即概率密度。xxFxxFxfx )()(lim)(0 xxxXxPx lim0 连续型随机变量的一个连续型随机变量的一个重要特征重要特征是:连续型随机变量取任意是:连续型随机变量取任意一个指定值的概率均为零,即一个指
4、定值的概率均为零,即PX =x0=0 事实上,对事实上,对 , 0000 xXxxxXx 0000 xXxxPxXP 有有)()(00 xxFxF ,令令0 x并注意到并注意到F(x) 的连续,即得的连续,即得PX = x0 = 0 由于连续型随机变量取一个值的概率为零,所以事件由于连续型随机变量取一个值的概率为零,所以事件 aX b、aXb、aX b与与aX b的概率都是的概率都是相等相等的的 注意注意:PX = x0= 0,并不意味着事件,并不意味着事件X = x0为不可能事件为不可能事件 例例1 已知连续型随机变量已知连续型随机变量X 的分布函数为的分布函数为 000)(2xxBeAxF
5、x及及1)(lim xFx0)0()(lim)(lim200 FBABeAxFxxx 0001)(2xxexFx即即(1) 试确定常数试确定常数A 和和B;(2) 求求P1/2 X 2;(3)求概率密度求概率密度f(x) 解解 (1)由分布函数的性质)由分布函数的性质 ABeAxFxxx )(lim)(lim2A = 1 因为连续型随机变量的分布函数因为连续型随机变量的分布函数F(x) 连续,因此,连续,因此,B = 1 (2) P1/2 X 2 = P1/2 X 2 = F(2) F(1/2) =(1e4)(1e1) = e1e4 (3) 当当x0, 0002)()(2xxexFxfx 00
6、02)(2xxexfx 其它其它0)2 , 0)(xAxxf 由于函数在一点处的值不影响函数的可积性和积分值,故由于函数在一点处的值不影响函数的可积性和积分值,故定义定义f(0) = 0(也可定义(也可定义f(0) = 2),那么),那么X 的概率密度函数的概率密度函数 例例2 设随机变量设随机变量X 的概率密度函数的概率密度函数(1) 确定常数确定常数A;(2) 求求X 的分布函数的分布函数F(x);(3) 求求P|X|2 和和P3/2 X 3。 解解 (1) 由概率密度函数的性质由概率密度函数的性质 1)(dxxf 20220000)(AxdxdxAxdxdxdxxfAxA22202 2A
7、 = 1,A = 1/2 xdttfxF)()()2(当当x0 ,00)( xdtxF 当当0 x2 ,420)(200 xdttdtxFx 当当x2, 1020)(2200 xdtdttdxxF 2120400)(2xxxxxF212121|)3( XPXP2121 XP161)21()21( FF1671691)23()3(323 FFXP 二、几种常见的连续型随机变量二、几种常见的连续型随机变量 1均匀分布均匀分布 若连续型随机变量若连续型随机变量X 的概率密度函数为的概率密度函数为 其其它它0,1)(baxabxf bxbxaabaxaxxF10)( 则称则称X 在在a,b上服从上服从
8、均匀分布均匀分布记作记作X U(a, b) 容易求得其分布函数为容易求得其分布函数为于是,对于任意的于是,对于任意的x1、x2(a, b) (x1x2), 有有Px1X x2 = F(x2) F(x1) =(x2 x1)/(b a) 这表明,均匀分布随机变量落入这表明,均匀分布随机变量落入(a, b)的任意子区间内的的任意子区间内的概率与子区间的长度成正比,而与子区间的位置没有关系概率与子区间的长度成正比,而与子区间的位置没有关系 均匀分布的密度函数与分布函数的图形如图均匀分布的密度函数与分布函数的图形如图 均匀分布是常见的连续分布之一例如数值计算中的舍入均匀分布是常见的连续分布之一例如数值计
9、算中的舍入误差、在每隔一定时间有一辆班车到来的汽车站上乘客的候车误差、在每隔一定时间有一辆班车到来的汽车站上乘客的候车时间等常被假设服从均匀分布此外,均匀分布在随机模拟中时间等常被假设服从均匀分布此外,均匀分布在随机模拟中亦有广泛应用亦有广泛应用 例例3 某市每天有两班开往某旅游景点的列车某市每天有两班开往某旅游景点的列车, 发车时间分发车时间分别为早上别为早上7点点30分和分和8点设一游客在点设一游客在7 点至点至8点间任何时刻到达点间任何时刻到达车站是等可能的车站是等可能的, 求此游客候车时间不超过求此游客候车时间不超过20分钟的概率分钟的概率 解设游客到车站的时间为解设游客到车站的时间为
10、7点点 X 分分, 则则X U(0,60),故故X 的密度函数为的密度函数为 其它其它0600601)(xxf 只有在只有在7:107:30或或7:408:00到车站其候车时间才不超过到车站其候车时间才不超过20分分 钟钟, 故所求概率为故所求概率为 P“10X 30”“ 40X 60” = P10X 30+ P 40X 603260160160403010 dxdx 例例4 在一特别的计算机存储系统中在一特别的计算机存储系统中, 系统内的信息检索是系统内的信息检索是 随机的随机的, 且所有条目的有顺序的检索是匀速的如果在且所有条目的有顺序的检索是匀速的如果在b 秒内秒内 可以检索完整个系统,
11、则到达指定条目的时间是一个服从由可以检索完整个系统,则到达指定条目的时间是一个服从由 时间时间0 到时间到时间b 区间上的均匀分布的随机变量若从区间上的均匀分布的随机变量若从a 秒钟开秒钟开 始检索,则所需时间服从由时间始检索,则所需时间服从由时间a 到到a+b 区间上的均匀分布区间上的均匀分布 2指数分布指数分布 如果随机变量如果随机变量X 的概率密度函数为的概率密度函数为为为正正常常数数) (000)( xxexfx则称则称X 服从参数为服从参数为的的指数分布指数分布记作记作X exp() 显然,显然,f (x)满足:满足: (1) f (x)01)()2(0 dxedxxfx 0001)
12、(xxexFx X 的分布函数的分布函数 本节例本节例1中的随机变量中的随机变量X 就是服从参数就是服从参数=2 的指数分布的指数分布 指数分布常用来描述随机服务系统中的等候时间及电子元指数分布常用来描述随机服务系统中的等候时间及电子元件的使用件的使用“寿命寿命”等等指数分布的等等指数分布的概率密度函数曲线概率密度函数曲线见图见图 例例5 某种元件的寿命某种元件的寿命(单位:小时单位:小时)服从服从=1/2000的指数分的指数分布,一报警系统装有该元件布,一报警系统装有该元件4个它们是独立工作的,而且只要个它们是独立工作的,而且只要不少于不少于3个元件正常工作,该系统就正常运行求该系统能正常个
13、元件正常工作,该系统就正常运行求该系统能正常运行运行1000小时以上的概率小时以上的概率 解设解设X 为元件的寿命,为元件的寿命,Y 为系统中寿命超过为系统中寿命超过1000小时的小时的元件数则由题设,有元件数则由题设,有X exp(1/2000),YB(4,p), 其中其中p = P X1000于是,于是,X 的概率密度函数为的概率密度函数为 0020001)(2000 xoxexfxp = P X10006065. 02000110005 . 02000 edxexkkkkC 4434)6065. 01()6065. 0( 从而从而 YB(4,0.6065) 故所求概率为故所求概率为 P
14、Y3 = =0.4865 3正态分布正态分布 若随机变量若随机变量X 的概率密度函数为的概率密度函数为 )(21)(222)( xexfx )(21)(22 xexx 其中其中、 (0)为常数,则称为常数,则称X 服从参数为服从参数为、 的的正态正态 分布分布,记为,记为X N( ,2) 特别特别 = 0, = 1时称为时称为标准正态分布标准正态分布,记作,记作X N(0,1), 其概率密度函数记为其概率密度函数记为由微积分知识可知:由微积分知识可知:1)()2( dxx dtexxt 2221)( 0)()1( x 是偶函数,图形关于是偶函数,图形关于y 轴对称;轴对称;x = 0时有最大值
15、;时有最大值;x=1时,曲线上对应点为拐点;时,曲线上对应点为拐点;x 轴为曲线的水平渐近线轴为曲线的水平渐近线标准正态分布的分布函数记为标准正态分布的分布函数记为)(x 正态分布正态分布N(,2)中的参数中的参数确定了对称轴的位置,而参确定了对称轴的位置,而参数数的大小则决定了曲线的形态即的大小则决定了曲线的形态即“峰峰”的陡峭程度:值小则的陡峭程度:值小则“峰峰”高而陡峭,值大则高而陡峭,值大则“峰峰”低而平缓下图显示了参数取低而平缓下图显示了参数取不同不同值的正态分布曲线的不同形态值的正态分布曲线的不同形态正态分布是连续型随机正态分布是连续型随机变量中最重要、最常用变量中最重要、最常用的
16、分布在诸如某个产的分布在诸如某个产品的质量指标品的质量指标(如长度、如长度、重量、强度等重量、强度等)的测量的测量结果;人的身高、体重;单位面积农作物的产量等都具有或近结果;人的身高、体重;单位面积农作物的产量等都具有或近似地具有正态分布似地具有正态分布一般地,如果某个数量指标一般地,如果某个数量指标X 是很多随机是很多随机因素的和,而每个因素所起的作用均匀微小,则因素的和,而每个因素所起的作用均匀微小,则X 为服从正态为服从正态分布的随机变量分布的随机变量 例如:大量生产某一产品,当设备、技术、原料、操作等例如:大量生产某一产品,当设备、技术、原料、操作等可控制的生产条件都相对稳定,不存在产
17、生系统误差的明显因可控制的生产条件都相对稳定,不存在产生系统误差的明显因素,则产品的质量指标近似服从正态分布又如,大地测量及素,则产品的质量指标近似服从正态分布又如,大地测量及化学分析中某元素含量的测定,测量及测定结果通常可以表示化学分析中某元素含量的测定,测量及测定结果通常可以表示为为X= ae,其中,其中a为真值,为真值,e 表示随机误差,那么表示随机误差,那么e 和和X一般都一般都服从正态分布正态分布还是许多概率分布的极限分布例如,服从正态分布正态分布还是许多概率分布的极限分布例如,服从二项分布的随机变量服从二项分布的随机变量XB(n,p),当,当n 充分大,而充分大,而p 不是很不是很
18、小,则小,则X 近似服从近似服从N(np,npq),那么,那么 )()(2122abdtebnpqnpXaPbat 第五章将作详细介绍第五章将作详细介绍. 由于正态分布的重要地位,人们特地编制了标准正态分布由于正态分布的重要地位,人们特地编制了标准正态分布函数值表函数值表(见附表见附表1)以方便计算标准正态分布以方便计算标准正态分布N(0,1)的分布函的分布函数具有以下性质:数具有以下性质: (1) (0) =0.5; (2) ( x) =1 (x) (简略证明简略证明) 当当X N(,2) 时,其分布函数时,其分布函数F(x)可以通过变量代换转可以通过变量代换转化为标准正态分布的函数化为标准
19、正态分布的函数(x) 来表示事实上,在一般正态分来表示事实上,在一般正态分布的分布函数中布的分布函数中, 只需令只需令u = (t )/, 则可得则可得dtexFtx222)(21)( )(2122 xdtetx)()( xxF显然,还有下列关系式成立:显然,还有下列关系式成立:Px1Xx2 =F(x2)F(x1) )()(12 xx 例例6 XN(0,1),求,求PX1.5,PX1,P|X|1,P|X|3 解解 查附表查附表1可得:可得:PX1.5= (1.5) = 0.9932 PX1 =1PX1 =1(1) =10.8413 = 0.1587 P|X|1= P1X1= P1X1 = (1
20、) (1) 表中只有表中只有x0 时的值,这里利用性质时的值,这里利用性质 ( x) =1 (x) P|X|1 = (1) (1) = (1) 1 (x) = 2(1) 1= 20.841 31 = 0.6826 P|X|2=2(2) 1=20.97721 = 0.9544 P|X|3=2(3) 1 = 20.99871 = 0.99741| XPXP对于对于X ),(2 N =(1)(1) = 0.6826 222| XPXP =(2)(2) = 0.9544333| XPXP =(3)(3) = 0.9974 由此可见当由此可见当X N(,2) 时,时,X 以很大的概率在区间以很大的概率在
21、区间 (3 , + 3) 内取值,在此区间之外的概率不超过内取值,在此区间之外的概率不超过 0.0026,这就是统计推断中,这就是统计推断中“3原则原则”的道理的道理 例例7 若若X N(0,1) ,当,当 = 0.10、 = 0.05、 = 0.01时,分别确定时,分别确定u0,使得,使得P|X|u0 = 解解 P|X|u0 = PXu0 PXu0 = (u0)1PXu0 =1(u0) 1 (u0) = 22 (u0) 若若P|X|u0= ,则,则(u0) =1/2于是,当于是,当= 0.10 时时(u0) = 0.95 ,查表得,查表得u0= 1.645 当当= 0.05时时(u0) =
22、0.975,查表得,查表得u0= 1.96 当当= 0.01时时(u0) = 0.995,查表得,查表得u0= 2.58这里所求的这里所求的u0在统计中被称为标准正态分布的在统计中被称为标准正态分布的双侧双侧100百分位百分位点,记作点,记作u/2 (也叫双侧临界值点)(也叫双侧临界值点) 若若u0 满足满足PXu0 = ,01,则称,则称u0为为标准正态分标准正态分布的上布的上100百分位点,记作百分位点,记作u (也叫上临界值点)(也叫上临界值点) 4对数正态分布对数正态分布 若随机变量若随机变量X 的概率密度函数为的概率密度函数为 00021)(222)(lnxxexxfx 其中其中、
23、(0)为常数,则称为常数,则称X 服从参数为服从参数为(,2) 的的对数对数正态分布正态分布。 若若Y =lgX N( ,2),则,则X 有对数正态分布有对数正态分布(详见下节详见下节) 对数正态分布密度曲线见对数正态分布密度曲线见60面,其分布函数为面,其分布函数为 . 0, 0, 0,21)(02)(ln22xxdtetxFxt 则则令令,ln tu . 0, 0, 0ln)(xxxxF 可见对数正态分布的概率计算亦可转化为标准正态分布计可见对数正态分布的概率计算亦可转化为标准正态分布计算对数正态分布在技术、生物学、医学、经济学、金融学、算对数正态分布在技术、生物学、医学、经济学、金融学、地质学等领域有重要应用例如,岩石、矿石中的微量元素的地质学等领域有重要应用例如,岩石、矿石中的微量元素的含量大多服从对数正态分布;而在技术中,对数正态分布广泛含量大多服从对数正态分布;而在技术中,对数正态分布广泛应用于疲劳试验结果的统计分析;金融学中,对数正态分布可应用于疲劳试验结果的统计分析;金融学中,对数正态分布可用来描述股票的收益等用来描述股票的收益等