1、第二章 随机变量及其分布第一节 随机变量第二节 离散型随机变量第三节 连续型随机变量第四节 二维随机变量及其分布第五节 随机变量函数的分布第二章 随机变量及其分布第一节 随机变量第二章 随机变量及其分布一、随机变量的定义定义1 设E 是随机试验,其样本空间为S=,如果对任一S 都有一实数X()与之对应,且对任何实数xR,集合|X()x是一随机事件,则称单值实函数X=X()为随机变量,X()简记为 X.约定用大写英文字母 X,Y 等表示随机变量.引入随机变量后,事件可以通过随机变量来表示,从而对事件及 事件概率的研究也就转化为对随机变量及其取值规律的研究.二、分布函数定义2 设 X 为随机变量,
2、x 为任意实数,称函数F(x)=P(Xx),-x+(2-1)为随机变量 X 的概率分布函数,简称分布函数.分布函数F(x)是一个普通的一元实函数,定义域是全体实数,若将随机变量 X 看作 实轴上随机点的坐标,那么分布函数F(x)的值就表示 X 落在区间(-,x上的概率,而 X 落在区间(a,b上的概率恰为分布函数F(x)在此区间两个端点的函数值之差,即P(aXb)=P(Xb)-P(Xa)=F(b)-F(a)第二章 随机变量及其分布分布函数F(x)的基本性质如下:(1)有界性:对任意x,有0F(x)1,且 ,(2)单调不减性:若x1x2,则F(x1)F(x2)(3)右连续性:F(x0+0)=F(
3、x0),即第二章 随机变量及其分布第二节 离散型随机变量第二章 随机变量及其分布一、定义定义1 若随机变量 X 只能取有限个值或者可列无穷个值x1,x2,xn,则 X 为离散型随机变量,称P(X=xi)=pi,i=1,2,3,n,(2-2)为离散型随机变量 X 的概率分布律或分布律.离散型随机变量 X 的分布律具有下面两个性质:二、几种常见的离散型随机变量的概率分布1.(0 1)分布设随机变量 X 只可能取0与1两个值,它的概率分布为P(X=1)=p,P(X=0)=1-p,(0p1)则称 X 服从参数为p 的(0 1)分布第二章 随机变量及其分布2.二项分布设试验E 只有两个可能结果A 与A.
4、设P(A)=p(0p1),此时 =1-p.将E 独立地重复n 次,则称这一串重复的独立试验为n 重伯努利试验.在n 重伯努利试验中,用 X 表示n 次试验中事件A 发生的次数,则 X 是一个离散型 随机变量,它可能的取值为0,1,2,n,且对每一个k(0kn),事件X=k即为事 件“n 次试验中事件A 恰好发生k 次”,于是有定义3 设随机变量 X 具有分布律其中0p0为常数.则称 X 服从参数为 的泊松分布,记为 XP().泊松定理在n 重伯努利试验中,事件A 在一次试验中发生的概率为pn(与试验的次 数n 有关),如果 ,则对任意给定的非负整数k,有事实上,记npn=n,即 .因为第二章
5、随机变量及其分布因对固定的k 有 ,故又从而第二章 随机变量及其分布第三节 连续型随机变量第二章 随机变量及其分布一、连续型随机变量定义1 设随机变量 X 的分布函数为F(x),如果存在实数轴上的一个非负可积函数 f(x),使得对于任意给定的实数x 有则称 X 为连续型随机变量,并称f(x)为 X 的概率密度函数,简称为密度函数或者概率密度.概率密度函数的性质如下:(1)非负性 f(x)0;(2)规范性反之,满足上述两条性质的函数一定是某个连续型随机变量的概率密度.连续型随机变量的性质如下:(1)分布函数F(x)为连续函数,其图形是位于y=0与y=1之间的单调上升的连续 曲线.对于实数轴上任意
6、的集合D,有第二章 随机变量及其分布所以,对于连续型随机变量,知道了 X 的概率密度,即掌握了它在实数轴上的分布规 律,就能够算得它落在集合D 中的概率,即概率密度可以完全刻画连续型随机变量的概率 特征;(2)若概率密度f(x)在点x 处连续,则有F(x)=f(x);(3)(4)对任意常数a,有P(X=a)=0.连续型随机变量不能像离散型随机变量那样,用列举它所取到的所有 可能值的概率来描述它的分布规律,而必须用它在各个区间取值的概率来描述.分布律确 定了离散型随机变量的概率分布,而密度函数确定了连续型随机变量的概率分布.同时容 易得到,一个事件的概率等于零,此事件并不一定是不可能事件.同样地
7、,一个事件的概率 为1,此事件也不一定就是必然事件.另外,由P(X=a)=0可知,在计算连续型随机变量落在某一区间内的概率时,可以 不必区分是开区间还是闭区间,即对于任意的实数a0,t0,有第二章 随机变量及其分布第四节 二维随机变量及其分布第二章 随机变量及其分布一、二维随机变量1.定义设试验E 的样本空间S=,X=X(),Y=Y()是定义在S 上的随机变量,由它 们构成的向量(X,Y)称为二维随机变量或二维随机向量.2.联合分布函数对二维随机向量,将(X,Y)作为一个整体进行研究,不但能研究分量 X 和Y 的性质,还可以研究它们之间的相互联系.为了描述二维随机变量(X,Y)整体的统计规律性
8、,我们引入二 维随机变量的分布函数的概念.我们将事件XxYy简记为Xx,Yy.设(X,Y)为二维随机变量,对于任意实数x,y,称二元函数F(x,y)=P(Xx,Yy)为二维随机变量(X,Y)的分布函数,也称为随机变量 X 和Y 的联合分布函数.分布函数F(x,y)表示事件Xx和事件Yy同时发生的概率,如果用平面上的 点(x,y)表示二维随机变量(X,Y)的一组可能的取值,则F(x,y)表示(X,Y)的取值落 入以(x,y)为右上顶点的无穷矩形中的概率,如图2.4所示.第二章 随机变量及其分布如一维随机变量的分布函数一样,二维随机变量的分布函数F(x,y)也有如下的基本性质:(1)分布函数关于每
9、个变量单调不减,即若x1x2,则对任意固定的y,有F(x1,y)F(x2,y);若y1y2,则对任意固定的x,有F(x,y1)F(x,y2)(2)分布函数关于每个变量都是右连续的,即对任意给定的x 和y,有F(x+0,y)=F(x,y),F(x,y+0)=F(x,y).(3)有界,即对任意给定的x 和y,分布函数满足0F(x,y)1,且对任意给定的y,对任意给定的x,第二章 随机变量及其分布(4)对于任意实数x1x2,y1y2 有P(x1Xx2,y1Yy2)=F(x2,y2)-F(x2,y1)-F(x1,y2)+F(x1,y1)0二、二维离散型随机变量及其分布若二维随机变量(X,Y)所有可能的
10、取值为有限对或可列对,则称(X,Y)为二维离散 型随机变量.设(X,Y)的所有可能的取值为(xi,yj)(i,j=1,2,),则称概率P(X=xi,Y=yi)=pij,i,j=1,2,为二维随机变量(X,Y)的分布律,也称为随机变量 X 和Y 的联合分布律.(X,Y)的分布律也常用表格来表示,见表2.1.第二章 随机变量及其分布显然,二维离散型随机变量的联合分布律具有如下性质:(1)0pij1,i,j=1,2,3,;容易看出,二维离散型随机变量(X,Y)的联合分布函数为这里的和式表示对一切满足xi x,yj y 的i,j求和.反过来,由联合分布函数也 可以求出联合分布律.因此,联合分布函数和联
11、合分布律是相互唯一确定的,它们都可以完 全刻画二维离散型随机变量的概率特征.第二章 随机变量及其分布三、二维连续型随机变量及其概率分布设二维随机变量(X,Y)的分布函数为F(x,y),如果存在非负函数f(x,y),使得对 任意实数x,y,有则称(X,Y)为二维连续型随机变量,称f(x,y)为二维随机变量(X,Y)的联合概率密度,也简称为随机变量(X,Y)的概率密度.按定义,联合概率密度f(x,y)具有如下性质:(1)f(x,y)0;(2)(3)若f(x,y)在点(x,y)处连续,则有(4)若G 是xOy 平面上的一个区域,则随机点(X,Y)落在G 内的概率为第二章 随机变量及其分布四、边缘分布
12、二维随机变量(X,Y)作为一个整体,前面讨论了它的联合分布,而 X,Y 各自都是一 维随机变量,它们也有各自的分布函数,记为FX(x),FY(y).FX(x),FY(y)分别称为二 维随机变量(X,Y)关于 X 和关于Y 的边缘分布函数.事实上,(X,Y)的边缘分布函数为FX(x)=P(Xx)=P(Xx,Y+)=F(x,+)(2 11)FY(y)=P(Yy)=P(X0,称为在Y=yj 条件下,随机变量 X 的条件分布律.第二章 随机变量及其分布同样,对于固定的i,若pi=P(X=xi)0,称为在 X=xi 条件下,随机变量Y 的条件分布律.易知上述条件概率满足分布律的性质:2.连续型随机变量的
13、条件分布连续型随机变量(X,Y)的条件分布比离散型复杂,对于任意实数x,y,有P(X=x)=0,P(Y=y)=0,所以就不能直接用条件概率来计算条件分布函数.设(X,Y)为二维连续型随机变量,分布函数为F(x,y),概率密度为f(x,y),(X,Y)关 于Y 的边缘概率密度为fY(y),f(x,y)和fY(y)均连续,且fY(y)0.计算条件概率:第二章 随机变量及其分布由于从而第二章 随机变量及其分布至此,我们定义:对于一切fY(y)0,给定Y=y 条件下X 的条件分布函数和条件概 率密度函数分别为同理可以定义对于一切fX(x)0,给定 X=x 条件下Y 的条件分布函数和条件概率 密度函数分
14、别为六、随机变量的独立性1.二维随机变量的独立性定义2 设(X,Y)为二维随机变量,若对任意的实数x,y,均有F(x,y)=FX(x)FY(y)即 P(Xx,Yy)=P(Xx)P(Yy)(2-23)则称随机变量 X 与Y 相互独立.第二章 随机变量及其分布随机变量(X,Y)只要满足上述定义的条件,则任何只与 X 有关的事件和任何只与Y 有关的事件都相互独立.对于二维离散型随机变量,有下面更为简明的独立性定义.定义3 设(X,Y)为二维离散型随机变量,若对于一切i,j,有P(X=xi,Y=yj)=P(X=xi)P(Y=yj)即 pij=pi pj (2-24)则称随机变量 X 与Y 相互独立.定
15、义4 设(X,Y)为连续型随机变量,其概率密度为f(x,y),关于X 和Y 的边缘概 率密度分别为fX(x),fY(y),如果对于一切x,y,有f(x,y)=fX(x)fY(y)(2-25)则称随机变量 X 与Y 相互独立.第二章 随机变量及其分布2.n维随机变量的独立性关于二维随机变量的一些概念和结论,可以推广到n 维随机变量的情形.设随机变量 X1,X2,Xn 是定义在同一个样本空间上的随机变量,它们构成的向 量(X1,X2,Xn)称为n 维随机变量,n 元函数F(x1,x2,xn)=P(Xx1,Xx2,Xxn)称为n 维随机变量(X1,X2,Xn)的分布函数.设(X1,X2,Xn)关于
16、Xi 的边缘分布函数为FXi(xi),(i=1,2,n)有下面 的定义.定义5 设(X1,X2,Xn)为n 维 随 机 变 量,若 对 于 任 意 的 实 数 x1,x2,xn,有 对于离散型随机变量(X1,X2,Xn),X1,X2,Xn 相互独立的充要条件是对 一切x1,x2,xn,有第二章 随机变量及其分布对于连续型随机变量(X1,X2,Xn),X1,X2,Xn 相互独立的充要条件是对 一切x1,x2,xn,有f(x1,x2,xn)=fX1(x1)fX2(x2)fXn(xn)(2-28)这里f(x1,x2,xn)是(X1,X2,Xn)的概率密度,fXi(xi)(i=1,2,n)是(X1,X
17、2,Xn)关于 Xi 的边缘概率密度.下面的结论在数理统计中会经常用到:若 X1,X2,Xn 相互独立,则(1)其中任意r(rn)个随机变量也相互独立.(2)X1,X2,Xn 各自的函数g1(X1),g2(X2),gn(Xn)也相互独立.(3)设(X1,X2,Xn)与(Y1,Y2,Xm)相互独立,则g(X1,X2,Xn)与 h(Y1,Y2,Ym)也相互独立,其中h,g 是连续函数.第二章 随机变量及其分布第五节 随机变量函数的分布第二章 随机变量及其分布一、离散型随机变量函数的分布1.一维离散型随机变量函数的分布设 X 为离散型随机变量,则Y=g(X)也为离散型随机变量,它的分布律可以直接从
18、X 的分布律得到.方法是先确定Y 可能取的值,再求出它取每个值的概率.若 X 的分布律为则Y=g(X)的分布律为当g(x1),g(x2),g(xn),中有某些值相等时,应把相等的值分别合并,并把 对应的概率相加,作为Y 取该值的概率.第二章 随机变量及其分布2.二维离散型随机变量函数的分布当(X,Y)为离散型随机变量时,它的函数Z=g(X,Y)是(一维)离散型随机变量,其 分布律的求法与前面讨论过的一维离散型随机变量的情形是一样的.即先确定Z=g(X,Y)所 有可能取的值,再求出它取每个值的概率.设(X,Y)的分布律为P(X=xi,Y=yj)=pij i,j=1,2,3,则Z=g(X,Y)的分
19、布律为P(Z=g(xi,yj)=pij i,j=1,2,3,二、连续型随机变量函数的分布1.一维连续型随机变量函数的分布一般地,连续型随机变量的函数不一定是连续型随机变量.我们在此主要讨论连续型 随机变量的函数仍是连续型随机变量的情形.方法是先求出随机变量函数的分布函数,再 通过求导求出其概率密度函数.若 X 的密度函数为fX(x),则Y=g(X)的分布函数为因此,第二章 随机变量及其分布定理1 设 X 为连续型随机变量,其概率密度为f(x),Y=g(X)严格单调,反函数 X=h(Y)有连续导数,则Y=g(X)是一个连续型随机变量,其概率密度为2.二维连续型随机变量函数的分布下面我们要讨论的问
20、题是,已知二维连续型随机变量(X,Y)的概率密度函数为f(x,y),Z=g(X,Y)也为连续型随机变量,求Z=g(X,Y)的概率密度函数.求Z 的概率密度的 方法与一维随机变量函数的情形类似,即先求Z 的分布函数,再求它的概率密度.设(X,Y)的概率密度为f(x,y),记Z=g(X,Y)的分布函数为FZ(z),则Z 的概率密度为第二章 随机变量及其分布下面讨论几个具体的函数的分布.(1)和的分布:Z=X+Y设二维随机变量(X,Y)的概率密度函数为f(x,y),则随机变量Z=X+Y 的分布函 数为这里积分区域是直线x+y=z 左下方的半平面(如图2.8所示)第二章 随机变量及其分布固定z 和y,对积分 作变量代换,令x=u-y,可得再交换积分次序即可得由概率密度的定义,可得Z=X+Y 的概率密度为同理由可以得到第二章 随机变量及其分布式(2 29)、式(2 30)是计算两个连续型随机变量和的概率密度的一般公式.特别地,当 X,Y 相互独立时,f(x,y)=fX(x)fY(y),其中fX(x)和fY(y)分别 为(X,Y)关于 X 和Y 的边缘概率密度,式(2 29)、式(2 30)可化为这两个公式称为卷积公式,记作fZ=fX*fY,即