1、随机变量及其分布随机变量的数学期望随机变量的方差与标准差常用离散分布常用连续分布随机变量函数的分布分布的其他特征数 (1)掷一颗骰子,出现的点数 X1,2,6.(2)n个产品中的不合格品个数 Y 0,1,2,n (3)某商场一天内来的顾客数 Z 0,1,2,(4)某种型号电视机的寿命 T:0,+)定义2.1.1 设 =为某随机现象的样本空间,称定义在上的实值函数X=X()为随机变量.(1)随机变量X()是样本点的函数,其定义域为,其值域为R=(,)若 X 表示掷一颗骰子出现的点数,则 X=1.5 是不可能事件.(2)若 X 为随机变量,则 X=k、a X b、均为随机事件.即 a X b=;a
2、 X()b (3)注意以下一些表达式:X=k=X kX k;a b=X b.(4)同一样本空间可以定义不同的随机变量.若随机变量 X 可能取值的个数为有限个或 可列个,则称 X 为离散随机变量.若随机变量 X 的可能取值充满某个区间 a,b,则称 X 为连续随机变量.前例中的 X,Y,Z 为离散随机变量;而 T 为连续随机变量.定义2.1.2 设X为一个随机变量,对任意实数 x,称 F(x)=P(X x)为 X 的分布函数.基本性质:(1)F(x)单调不降;(2)有界:0F(x)1,F()=0,F(+)=1;(3)右连续.设离散随机变量 X 的可能取值为:x1,x2,xn,称 pi=P(X=x
3、i),i=1,2,为 X 的分布列.分布列也可用表格形式表示:X x1 x2 xn P p1 p2 pn (1)pi 0,(2)1.iip(正则性)(非负性)求离散随机变量的分布列应注意:(1)确定随机变量的所有可能取值;(2)计算每个取值点的概率.对离散随机变量的分布函数应注意:(1)F(x)是递增的阶梯函数;(2)其间断点均为右连续的;(3)其间断点即为X的可能取值点;(4)其间断点的跳跃高度是对应的概率值.例2.1.1已知 X 的分布列如下:X 0 1 2P 1/3 1/6 1/2求 X 的分布函数.0,01/3,01()1/2,121,2 xxF xxx解:X 0 1 2P 0.4 0
4、.4 0.2解:0,00.4,01()0.8,121,2xxF xxx 例2.1.2已知 X 的分布函数如下,求 X 的分布列.例2.1.3已知一袋中装有5只球,编号为1,2,3,4,5,在袋中同时取3球,以X表示取出3只球中的最大号码,写出X的分布律 连续随机变量X的可能取值充满某个区间(a,b).因为对连续随机变量X,有P(X=x)=0,所以无法仿离散随机变量用 P(X=x)来描述连续随机变量X的分布.注意离散随机变量与连续随机变量的差别.定义2.1.4设随机变量X 的分布函数为F(x),则称 X 为连续随机变量,()()xp t dtF x若存在非负可积函数 p(x),满足:称 p(x)
5、为概率密度函数,简称密度函数.密度函数的性质(2)(1)()0;()1.p xp x dx满足(1)(2)的函数都可以看成某个连续随机变量的概率密度函数.(非负性)(正则性).()()baP aXbp x dx注(1)(1)(2)F(x)是(,+)上的连续函数;(3)P(X=x)=F(x)F(x0)=0;(4)PaXb=PaXb =PaXb =PaXb =F(b)F(a).注(2)(5)当F(x)在x点可导时,p(x)=()F x当F(x)在x点不可导时,可令p(x)=0.连续型1.密度函数 X p(x)(不唯一)()()xF xp t dt2.4.P(X=a)=0离散型1.分布列:pn=P(
6、X=xn)(唯一)2.F(x)=()iixxP Xx 3.F(a+0)=F(a);P(a0,有()F(a)=1 F(a)=F(a)=F(a)F(a)=2F(a)10()ap x dx01()2ap x dxX2(2)41(),2xf xex (0,1)YaXbN2设随机变量的概率密度为,且,求a,b 0,1,()ln,1,1 .(1)px2,p0 x3,p2x5/2;xF xxxexe求2设随机变量X的分布函数为:(2)求概率密度函数?分赌本问题(17世纪)甲乙两赌徒赌技相同,各出赌注50元.无平局,谁先赢3局,则获全部赌注.当甲赢2局、乙赢1局时,中止了赌博.问如何分赌本?1.按已赌局数分:
7、则甲分总赌本的2/3、乙分总赌本的1/3 2.按已赌局数和再赌下去的“期望”分:因为再赌两局必分胜负,共四种情况:甲甲、甲乙、乙甲、乙乙所以甲分总赌本的3/4、乙分总赌本的1/4 若按已赌局数和再赌下去的“期望”分,则甲的所得 X 是一个可能取值为0 或100 的随机变量,其分布列为:X 0 100P 1/4 3/4甲的“期望”所得是:01/4+100 3/4=75.定义2.2.1 设离散随机变量X的分布列为P(X=xn)=pn,n=1,2,.若级数绝对收敛,则称该级数为X 的1iiix p数学期望,记为1()iiiE Xx p 定义2.2.2 设连续随机变量X的密度函数为p(x),若积分 绝
8、对收敛,则称该积分为X 的()xp x dx数学期望,记为()()E Xxp x dx例2.2.1则E(X)=100.2+00.1+100.4+200.3=8.X 10 0 10 20P 0.2 0.1 0.4 0.3 数学期望简称为期望.数学期望又称为均值.数学期望是一种加权平均.定理2.2.1 设 Y=g(X)是随机变量X的函数,若 E(g(X)存在,则1()()()()()iiig x P XxE g Xg x p x dx例2.2.2 设随机变量 X 的概率分布为求 E(X2+2).=(02+2)1/2+(12+2)1/4+(22+2)1/4=1+3/4+6/4=13/4解:E(X2+
9、2)X 0 1 2P 1/2 1/4 1/4数学期望的性质(1)E(c)=c(2)E(aX)=aE(X)(3)E(g1(X)+g2(X)=E(g1(X)+E(g2(X)例2.2.32,01()0,xxp x0,令则有 E(Y)=0,Var(Y)=1.()Var()XE XXY称 Y 为 X 的标准化.设随机变量X的方差存在(这时均值也存在),则 对任意正数,有下面不等式成立Var()|()|2XPXEX2Var()|()|1XPXE X 例2.3.2设 X0()!00nxxexp xnx证明(02(1)1nPXnn证明:E(X)=0d!nxxxexn=n+1E(X2)=20d!nxxxexn=
10、(n+1)(n+2)所以,Var(X)=E(X2)(EX)2=n+1,(02(1)(|1)PXnPXEXn211(1)nn 1nn(这里,=n+1)1(2)!nn1(3)!nn由此得 Var(X)=0P(X=a)=1 2.4.1 二项分布 记为 X b(n,p).X为n重伯努里试验中“成功”的次数,0,1,.,()(1).kn kknnP Xkppk当n=1时,称 b(1,p)为 0-1分布.试验次数为 n=4,“成功”即取得合格品的概率为 p=0.8,所以,X b(4,0.8)思考:若 Y 为不合格品件数,Y?Y b(4,0.2)一批产品的合格率为0.8,有放回地抽取4次,每次一件,则取得合
11、格品件数 X 服从二项分布.例2.4.1 设X b(2,p),Y b(4,p),已知 P(X1)=8/9,求 P(Y1).解:由 P(X1)=8/9,知 P(X=0)=1/9.由此得:P(Y1)=1 P(Y=0)所以 1/9=P(X=0)=(1p)2,从而解得:p=2/3.=1-(1p)4=80/81.若随机变量 X 的概率分布为(),0,1,2,!kP Xkekk则称 X 服从参数为 的泊松分布,记为 X P().泊松分布泊松定理定理2.4.1(1)!kkn knnnppekk (二项分布的泊松近似)在n重伯努里试验中,记 pn 为一次试验中成功的概率.若 npn,则记为 X h(n,N,M
12、).(),MNMknkP XkNn超几何分布对应于不返回抽样模型:N 个产品中有 M 个不合格品,从中抽取n个,不合格品的个数为X.2.4.3 超几何分布1()(1),1,2,kP Xkppk记为 X Ge(p)X 为独立重复的伯努里试验中,“首次成功”时的试验次数.几何分布具有无记忆性,即:P(X m+n|X m)=P(X n)2.4.4 几何分布负二项分布(巴斯卡分布)1()(1),1,1kk r rP Xkppkr rr记为X Nb(r,p).X 为独立重复的伯努里试验中,“第 r 次成功”时的试验次数.(1)二项随机变量是独立 0-1 随机变量之和.(2)负二项随机变量是独立几何随机变
13、量之和.几何分布Ge(p)的数学期望 =1/p 0-1 分布的数学期望 =p 二项分布 b(n,p)的数学期望 =np 泊松分布 P()的数学期望 =0-1 分布的方差 =p(1p)二项分布 b(n,p)的方差=np(1p)泊松分布 P()的方差=几何分布Ge(p)的方差=(1p)/p2正态分布、均匀分布、指数分布、伽玛分布、贝塔分布。记为X N(,2),2()1()exp,222xp xx其中 0,是任意实数.是位置参数.是尺度参数.2.5.1 正态分布yxO正态分布的性质(1)p(x)关于 是对称的.p(x)x0在 点 p(x)取得最大值.(2)若 固定,改变,(3)若 固定,改变,小大p
14、(x)左右移动,形状保持不变.越大曲线越平坦;越小曲线越陡峭.p(x)x01(1)(0),2xx)(x1()x标准正态分布N(0,1)密度函数记为(x),分布函数记为(x).(2)()1()xx (x)的计算(1)x 0 时,查标准正态分布函数表.(2)x a)=1(a);(3)P(aXb)=(b)(a);(4)若a 0,则 P(|X|a)=P(aX1.96),P(|X|1.96)P(|X|1/2,所以 b 0,反查表得:(1.66)=0.9515,故 b=1.66而(a)=0.0495 1/2,所以 a 0,(a)=0.9505,反查表得:(1.65)=0.9505,故 a=1.65例2.5
15、.2一般正态分布的标准化定理2.5.1 设 X N(,2),XY则 Y N(0,1).推论:若 X N(,2),则()xF x若 X N(,2),则 P(Xa)=a1a 设 X N(10,4),求 P(10X13),P(|X10|2).解:P(10X13)=(1.5)(0)=0.9332 0.5P(|X10|2)=P(8Xk=PXk,则 k=().练习(2)设 X N(,42),Y N(,52),记 p1=PX 4,p2=PY+5,则()对任意的 ,都有 p1=p2 对任意的 ,都有 p1 p2(3)设 X N(,2),则随 的增大,概率 P|X|()单调增大 单调减少 保持不变 增减不定(4
16、)设随机变量X的概率密度为 则求数学期望和方差?2,01,()0,xxf x其它,正态分布的 3 原则设 X N(,2),则 P(|X|)=0.6828.P(|X|2)=0.9545.P(|X|3,则 P(A)=P(X 3)=2/3设 Y 表示三次独立观测中 A 出现的次数,则 Y b(3,2/3),所求概率为 P(Y2)=P(Y=2)+P(Y=3)230233321213333CC =20/27例2.5.52.5.3 指数分布记为 X Exp(),0()0,0 xexp xx其中 0.1,0()0,0 xexF xx特别:指数分布具有无忆性,即:P(X s+t|X s)=P(X t)2.5.
17、4 伽玛分布记为 X Ga(,),1(),0()xp xxex其中 0,0.为伽玛函数.10()dxxex称注(1)(1)=1,(1/2)=(n+1)=n!(2)Ga(1,)=Exp()Ga(n/2,1/2)=2(n)2.5.5 贝塔分布记为 X Be(a,b),111()(1),01(,)abp xxxxB a b其中a 0,b 0.称1110(,)(1)dabB a bxxx为贝塔函数.注(1)(2)B(a,b)=B(b,a)B(a,b)=(a)(b)/(a+b)(3)Be(1,1)=U(0,1)均匀分布 U(a,b):E(X)=(a+b)/2 指数分布 Exp():E(X)=1/正态分布
18、 N(,2):E(X)=伽玛分布 Ga(,):E(X)=/贝塔分布 Be(a,b):E(X)=a/(a+b)均匀分布 U(a,b)的方差=(b a)2/12 指数分布 Exp()的方差=1/2 正态分布 N(,2)的方差=2例2.5.6 已知随机变量 X 服从二项分布,且 E(X)=2.4,Var(X)=1.44,则参数 n,p 的值为多少?例2.5.7 设 X 表示 10 次独立重复射击命中目标 的次数,每 次射中目标的概率为0.4,则 E(X2)的值为多少?解:从 2.4=np,1.44=np(1p)中解得解:因为 E(X)=np=4,Var(X)=2.4,所以n=6,p=0.4.E(X2
19、)=Var(X)+(E(X)2=2.4+16=18.4 设 E(X)=,Var(X)=2,则对任意常 数 C,必有().222222222(1)()()(2)()()(3)()()(4)()()E XCE XCE XCE XE XCE XE XCE X练习2.6 随机变量函数的分布问题:已知 X 的分布,求 Y=g(X)的分布。例如:Y1=4X+3;Y2=|X|;Y3=X2.当 X 为离散随机变量时,Y=g(X)为离散随机变量.将g(xi)一一列出,再将相等的值合并即可.2.6.1 离散随机变量函数的分布2.6.2 连续随机变量函数的分布定理2.6.1 设 X pX(x),y=g(x)是 x
20、的严格 单调函数,记 x=h(y)为 y=g(x)的反函数,且h(y)连续可导,则Y=g(X)的密度函数为:()|()|,()0,XYph yh yaybpy其它例2.6.1 设 X 21(),(1)Xpxx求 Y=eX 的分布.y=ex 单调可导,反函数 x=h(y)=lny,所以当 y 0 时,|)(|)()(yhyhpypXY,1)(yyhyypX1ln21(1 ln)yy由此得21,0(1 ln)()0,Yyyypy其它解:2X(0,1),Y Y2X1N设(1)求|X|的概率密度;(2)求 的概率密度?-xxXe,0f(x)=0,YYex设的 概 率 密 度 为:其 他(1)求|X|的
21、 概 率 密 度;(2)求的 概 率 密 度?正态变量的线性不变性定理2.6.2 设 X N(,2),则当a 0 时,Y=aX+b N(a+b,a22).由此得:若 X N(,2),则 Y=(X)/N(0,1).对数正态分布定理2.6.3 设 X N(,2),则 Y=e X 的服从22(ln)1()exp,0.22yp xyy伽玛分布的有用结论定理2.6.4 设 X Ga(,),则当k 0 时,Y=kX Ga(,/k).均匀分布的有用结论 定理2.6.5 设 X FX(x),若FX(x)为严格单调增的连 续函数,则Y=FX(X)U(0,1).矩、变异系数、分位数、中位数 k 阶原点矩:k=E(
22、Xk),k=1,2,.注意:1=E(X).k 阶中心矩:k=EXE(X)k,k=1,2,.注意:2=Var(X).定义2.7.1定义2.7.2 为 X 的变异系数.Var()()VXCE X作用:称CV 是无量纲的量,用于比较量纲不同的两个随机变量的波动大小.P(X xp)=F(xp)=p定义2.7.3 设 0 p 1,若 xp 满足则称 xp 为此分布 p-分位数,亦称 xp 为下侧 p-分位数.(1)因为 X 小于等于 xp 的可能性为 p,所以 X 大于 xp 的可能性为 1 p.(2)对离散分布不一定存在 p-分位数.(3)()()()dxpppP XxF xp x x若记 xp 为上侧 p-分位数,即则P(X xp)=p 11,ppppxxxx定义2.7.4 称 p=0.5 时的p 分位数 x0.5 为中位数.相同点:都是反映随机变量的位置特征.不同点:含义不同.(1)N(0,1):Z,U(2)2(n):2()n(3)t(n):()nt(4)F(n,m):(,)n mF