1、第第 2 章章 随机变量的概率分布和随机变量的概率分布和数字特征数字特征授课老师:授课老师:李芳凤李芳凤 email:随机变量(random variables)1.一次试验的结果的数值性描述2.事先不知道会出现什么结果投掷两枚硬币出现正面的数量3.一般用 X,Y,Z 来表示4.根据取值情况的不同分为离散型随机变量和连续型随机变量离散型随机变量(discrete random variables)1.随机变量 X 取有限个值或所有取值都可以逐个列举出来 X1,X2,2.以确定的概率取这些不同的值3.离散型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽查抽查100个个产品产品一
2、家餐馆营业一天一家餐馆营业一天电脑公司一个月的销售电脑公司一个月的销售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾客数顾客数销售量销售量顾客性别顾客性别0,1,2,1000,1,2,0,1,2,男性为男性为0,女性为女性为1离散型随机变量的概率分布概率分布1.列出离散型随机变量X的所有可能取值2.列出随机变量取这些值的概率3.通常用下面的表格来表示X=xix1,x2,xnP(X=xi)=pip1,p2,pnX=xi0 1 2 3P(X=xi)pi0.05 0.10 0.55 0.30X=xi0 1 2 P(X=xi)pi三种重要的离散型随机变量(01分布)n一个离散型随机变量X只取两
3、个可能的值q例如,男性用 1表示,女性用0表示;合格品用 1 表示,不合格品用0表示X=xi1 0P(X=xi)=pi0.05 0.95二项试验(贝努里试验)1.二项分布二项分布与贝努里试验有关2.n重贝努里试验具有如下属性q试验包含了n 个相同的试验q每次试验只有两个可能的结果,即“成功”和“失败”q出现“成功”的概率 p 对每次试验结果是相同的;“失败”的概率 q 也相同,且 p+q=1q试验是相互独立的q试验“成功”或“失败”可以计数二项分布(Binomial distribution)1.进行 n 次重复试验,出现“成功”的次数的概率分布称为二项分布2.设X为n次重复试验中事件A出现的
4、次数,X 取 x 的概率为二项分布显然满足 PX=x 0,x=1,2,n,当 n=1 时,二项分布化简为二项分布(例题分析)知识点回顾n全概公式:设事件A1,A2,An 为样本空间的一个划分,P(Ai)0(i=1,2,n),则对任意事件B,有知识点回顾1.一个事件的发生与否并不影响另一个事件发生的概率,则称两个事件独立2.若事件A与B独立,则 P(B|A)=P(B),P(A|B)=P(A)此时概率的乘法公式可简化为 P(AB)=P(A)P(B)推广到n个独立事件,有n P(A1 A2 An)=P(A1)P(A2)P(An)知识点回顾n离散型随机变量:随机变量 X 取有限个值或所有取值都可以逐个
5、列举出来 X1,X2,n离散型随机变量的概率分布概率分布X=xix1,x2,xnP(X=xi)=pip1,p2,pnn01分布:一个离散型随机变量X只取两个可能的值知识点回顾X=xi1 0P(X=xi)=pip 1-p知识点回顾1.n重贝努里试验具有如下属性q试验包含了n 个相同的试验q每次试验只有两个可能的结果,即“成功”和“失败”q出现“成功”的概率 p 对每次试验结果是相同的;“失败”的概率 q 也相同,且 p+q=1q试验是相互独立的q试验“成功”或“失败”可以计数知识点回顾1.进行 n 次重复试验,出现“成功”的次数的概率分布称为二项分布2.设X为n次重复试验中事件A出现的次数,X
6、取 x 的概率为二项分布(用Excel计算概率)n第第1步:步:在Excel表格界面,直接点击【fx】(插入函数)命令 n第第2步:步:在【选择类别选择类别】中点击【统计统计】,并在【选择函数选择函数】中点击【BINOMDIST】,然后单击【确定】n第第3步:步:在【Number_s】后填入试验成功次数,在【Trials】后填入总试验次数(本例为5),在【Probability_s】后填入试验的成功概率,在【Cumulative】后填入0(或FALSE),表示计算成功次数恰好等于指定数值的概率(填入1或TRUE表示 计算成功次数小于或等于指定数值的累积概率值)泊松分布(Poisson dist
7、ribution)1.用于描述在一指定时间范围内或在一定的长度、面积、体积之内某一事件出现次数的分布2.泊松分布的例子一个城市在一个月内发生的交通事故次数一定时间段内,某航空公司接到的订票电话数一定时间内,到车站等候公共汽车的人数一匹布上发现的疵点个数一定页数的书刊上出现的错别字个数消费者协会一个星期内收到的消费者投诉次数人寿保险公司每天收到的死亡声明的人数泊松概率分布函数 给定的时间间隔、长度、面积、体积内“成功”的平均数e=2.71828 k 给定的时间间隔、长度、面积、体积内“成功”的次数)(PX泊松分布(例题分析)泊松分布(用Excel计算概率)n第第1步:步:在Excel表格界面,直
8、接点击【fx】(插入函数)命令 n第第2步:步:在【选择类别选择类别】中点击【统计统计】,并在【选择函数选择函数】中点击【POISSON】,然后单击【确定】n第第3步:步:在【X】后填入事件出现的次数(本例为6)n 在【Means】后填入泊松分布的均值(本例为7)n在【Cumulative】后填入0(或FALSE),表示计算成功次数恰好等于指定数值的概率(填入1或TRUE表示计算成功次数小于或等于指定数值的累积概率值)泊松分布(作为二项分布的近似)1.当试验的次数 n 很大,成功的概率 p 很小时,可用泊松分布来近似地计算二项分布的概率,即这样计算比较麻烦,考虑用泊松分布计算。n因为p=0.0
9、01520,所以可以用泊松分布近似计算。n=np=1.5超几何分布(hypergeometric distribution)1.采用不重复抽样,各次试验并不独立,成功的概率也互不相等2.总体元素的数目N很小,或样本容量n相对于N来说较大时,样本中“成功”的次数则服从超几何概率分布3.设有N件产品,其中M件次品,从中抽取n件,则n件中含次品数X的概率分布函数为超几何分布(用Excel计算概率)n第第1步:步:在Excel表格界面,直接点击【fx】(插入函数)命令 n第第2步:步:在【选择类别选择类别】中点击【统计统计】,并在【选选择函数择函数中点击【HYPGEOMDIST】,然后单击【确定】n第
10、第3步:步:在【Sample_s】后填入样本中成功的次数x(本例为3)在【Number_sample】后填入样本容量n(本例为4)n在【Population_s】后填入总体中成功的次数M(本例为3)n在【Number_pop】后填入总体中的个体总数N(本例为10)连续型随机变量(continuous random variables)1.随机变量 X 取无限个值2.所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点3.连续型随机变量的一些例子试验试验随机变量随机变量可能的取可能的取值值抽查一批电子元件抽查一批电子元件新建一座住宅楼新建一座住宅楼测量一个产品的测量一个产品的长度长度使
11、用寿命使用寿命(小时小时)半年后工程完成的百分比半年后工程完成的百分比测量误差测量误差(cm)X 00 X 100X 0连续型随机变量的概率分布1.连续型随机变量可以取某一区间或整个实数轴上的任意一个值2.它取任何一个特定的值的概率都等于03.不能列出每一个值及其相应的概率4.通常研究它取某一区间值的概率5.用数学函数的形式和分布函数的形式来描述概率密度函数(probability density function)1.设X为一连续型随机变量,x为任意实数,X的概率密度函数记为f(x),它满足条件概率密度函数n在平面直角坐标系中画出f(x)的图形,则对于任何实数 a b,P(a X b)是该曲
12、线是该曲线下从下从a到到 b的面积的面积xab分布函数(distribution function)1.连续型随机变量的概率也可以用分布函数F(x)来表示2.分分布函数布函数定义为分布函数与密度函数的图示1.密度函数曲线下的面积等于12.分布函数F(x0)是曲线下x小于 x0 部分的面积正态分布(normal distribution)n1.描述连续型随机变量的最重要的分布n2.可用于近似离散型随机变量的分布q例如:二项分布n3.许多现象都可以由正态分布来描述n4.经典统计推断的基础概率密度函数nf(x)=随机变量 X 的频数 n=总体方差 n=3.14159;e=2.71828nx=随机变量
13、的取值(-x=0。2.正态曲线的最高点在均值,它也是分布的中位数和众数。3.正态分布是一个分布族,每一特定正态分布通过均值和标准差来区分。决定了图决定了图形的中心位置形的中心位置,决定曲线的平缓程度。决定曲线的平缓程度。正态分布函数的性质4.曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交5.正态曲线下的总面积等于1。6.随机变量的概率由曲线下的面积给出。和 对正态曲线的影响xCABU决定了图形的中心位决定了图形的中心位置,置,决定了图形中峰决定了图形中峰的陡峭程度。的陡峭程度。正态分布的概率标准正态分布(standard normal distribution)
14、1.一般的正态分布取决于均值和标准差 2.计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的3.若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表标准正态分布函数随机变量具有均值为0,标准差为1的正态分布任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布对于标准正态分布,即XN(0,1),有(-x)xP(a X b)b aP(|X|a)2 a 1 对于一般正态分布,即XN(,2),有(0.67)(0.67)2(0.67)10.4972 正态分布(用Excel计算正态分布的概率)n第第1步:步:在Excel表格界面中,点击“fx”(插入函数)命令
15、n第第2步:步:在【选择类别】中点击【统计】,并在【选择函数】中点击【NORMDIST】,然后单击【确定】n第第3步:步:在【X】后输入正态分布函数计算的区间点(即x值)n在【Mean】后输入正态分布的均值n在Standard_dev后输入正态分布的标准差n在【Cumulative】后输入1(或TRUE)表示计算事件出现次数小于或等于指定数值的累积概率,单击【确定】图图6.4 任何正态概率分布曲线下的面积任何正态概率分布曲线下的面积 3 3准则准则知识点回顾泊松分布用于描述在一指定时间范围内或在一定的长度、面积、体积之内某一事件出现次数的分布:给定的时间间隔、长度、面积、体积内“成功”的平均数
16、;e=2.71828 k:给定的时间间隔、长度、面积、体积内“成功”的次数)(PX知识点回顾超几何分布:设有N件产品,其中M件次品,从中抽取n件,则n件中含次品数X的概率分布函数为1.连续型随机变量可以取某一区间或整个实数轴上的任意一个值2.它取任何一个特定的值的概率都等于03.不能列出每一个值及其相应的概率4.通常研究它取某一区间值的概率知识点回顾1.连续型随机变量的概率也可以用分布函数F(x)来表示2.分分布函数布函数定义为知识点回顾知识点回顾nf(x)=随机变量 X 的频数 n=总体方差 n=3.14159;e=2.71828nx=随机变量的取值(-x +)n=总体均值),(2 NXn标
17、准正态分布N(0,1)n任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布知识点回顾对于标准正态分布,即XN(0,1),有(-x)xP(a X b)b aP(|X|a)2 a 1 对于一般正态分布,即XN(,2),有知识点回顾随堂测试n一副扑克牌有52张牌,其中有4张A。从中抽出5张,下列事件的概率是多少?(给出表达式即可,无需计算最终结果)n1)有一对An2)至少有一张A葛瑞尔轮胎公司的案例n葛瑞尔轮胎公司最新研发了一种钢丝子午线轮胎,将通过一家全国性连锁折扣商店出售。n通过对轮胎进行道路实测,估计出轮胎可行驶里程的均值为36500英里,标准差为5000.假设行驶里程数据服从正态
18、分布,那么一个轮胎的行驶里程x超过40000英里的概率是多少?2(36500,5000),xN解:已知则(40000)P x 1(40000)P x 3650040000365001()50005000 xP 1(0.7)P z 1 0.7580.242【统计分析】大约有24.2%的轮胎的可行驶里程将会超过40000英里。n葛瑞尔公司考虑实施一项质保政策:如果原装轮胎没有达到质保书中设定的额定里程,公司将优惠更换新轮胎。若该公司希望只有不超过10%的轮胎符合优惠更换的条件,那么质保里程应定为多少?,k设质保里程定为()0.1P xk则36500()0.15000kP z查表得z=-1.2836
19、5001.285000k 即30100k 解得根据这一信息,公司可能将质保里程定为30000英里。正态分布的上分位点n设随机变量XN(0,1),对给定的正数,0 u)=的点为标准正态分布的上分位点。计算标准正态分布的反函数值n第第1步:步:在Excel表格界面中,点击“fx”(插入函数)命令n第第2步:步:在【选择类别】中点击【统计】,并在【选择函数】中点击【NORMSINV】,然后单击【确定】n第第3步:步:在【Probability】后输入给定的概率值。单击【确定】随机变量的数字特征随机变量的数字特征 分布函数能够完整地描述随机变量的统计分布函数能够完整地描述随机变量的统计特性,但在一些实
20、际问题中,只需知道随机变特性,但在一些实际问题中,只需知道随机变量的某些特征,而不需要求出它的分布函数量的某些特征,而不需要求出它的分布函数.考察一射手的水平,既要看他的考察一射手的水平,既要看他的平均环数平均环数是否是否高,还要看他弹着点的范围是否小,即数据的高,还要看他弹着点的范围是否小,即数据的波动波动是否小是否小.例如例如:随机变量的数字特征随机变量的数字特征11,2,iikiiNnxiknN某班有 个人参加考试,其中有 个人为 分,求平均成绩。引例引例解:解:平均成绩为:平均成绩为:111kkiiiiiinx nxNN若用若用X表示成绩,则表示成绩,则iP Xx1kiiinxNNni
21、 1kiiix P Xx定义定义 设离散型随机变量设离散型随机变量X 的分布律为的分布律为,2,1,)(kpxXPkk若无穷级数若无穷级数 1kkkpx绝对收敛,则称和式为随机变量绝对收敛,则称和式为随机变量 X 的的数学期望数学期望记为记为1()kkkE Xx pu离散型离散型 数学期望数学期望X=xi1 2 3 4 5 6P(X=xi)=pi1/6 1/6 1/6 1/6 1/6 1/65.3616611)(61iiipxXE1()kkkE Xx p次品数X=xi0123概率P(X=xi)pi0.750.120.080.0543.005.0308.0212.0175.00E(X)iiipx
22、1()kkkE Xx p 设连续型随机变量设连续型随机变量X 的概率密度为的概率密度为 若积分若积分 绝对收敛,则称此积分的值为随机变量绝对收敛,则称此积分的值为随机变量 X 的的 数学期望数学期望,记为,记为 数学期望简称数学期望简称期望期望,又称,又称均值。均值。注意注意:数学期望反映了随机变量取值的平均值数学期望反映了随机变量取值的平均值,它是一种加权平均它是一种加权平均.u连续型连续型例例 设随机变量设随机变量 X N(0,1),即即X的概率密度的概率密度函数为函数为试求随机变量试求随机变量X的数学期望。的数学期望。随机变量函数的数学期望随机变量函数的数学期望定理定理:设设 Y=g(X
23、),g(x)是连续函数,是连续函数,,kkxXPp ,2,1k 2()()()Xf xg x f x dx若 的概率密度为,且绝对收敛,(1)若若 X 的分布律为的分布律为绝对收敛,绝对收敛,且且 1)(kkkxgp例例 设随机变量设随机变量 X 的分布律为的分布律为X 0 1 2 3 4 5 P(X=xi)1/12 1/6 1/3 1/12 2/9 1/9试求随机变量试求随机变量X和和Y=(X-2)2的数学期望的数学期望.数学期望的性质数学期望的性质,X Ya b c设是随机变量,是常数(以下设所遇到的随机变量的数学期望存在)1设随机变量设随机变量X、Y的数学期望分别为的数学期望分别为E(X
24、)=2,E(Y)=3,求求E(2X-3Y)。练习练习 方差方差引例引例 检验两批灯泡的质量检验两批灯泡的质量,从中分别随机抽样从中分别随机抽样5 5只只,测得使用寿命测得使用寿命(单位单位:小时小时)如下如下:A:2000 1500 1000 500 1000 A:2000 1500 1000 500 1000 B:1500 1500 1000 1000 1000 B:1500 1500 1000 1000 1000 试比较这两批灯泡质量的好坏试比较这两批灯泡质量的好坏计算得计算得:平均寿命平均寿命分别为分别为:A:1200 B:1200:A:1200 B:1200 观察得观察得:A:A中中使
25、用寿命偏离使用寿命偏离较大较大,B,B中使用寿命偏离中使用寿命偏离较小较小,所以所以,B,B产品质量较好产品质量较好数学期望数学期望方差方差 方差的定义方差的定义(X-EX)2 随机变量随机变量X 的取值偏离平均值的的取值偏离平均值的 情况情况,是是X的函数的函数,也是随机变量也是随机变量 E(X-EX)2 随机变量随机变量X的取值偏离平均值的的取值偏离平均值的平均偏离程度平均偏离程度 数数定义:定义:22,(),(),(),XE XEXE XEXXD X设是一个随机变量 若存在则称为的方差 记为即注注:方差反映了随机变量相对其均值的方差反映了随机变量相对其均值的偏离程度偏离程度若若 X 为离
26、散型随机变量,概率分布为为离散型随机变量,概率分布为若若 X 为连续型随机变量,概率密度为为连续型随机变量,概率密度为f(x)2()()D XxEXf x dx简化计算公式:简化计算公式:22()()()D XE XE X方差的计算公式方差的计算公式22()()().D XE XE X证明:证明:方差的简化公式方差的简化公式2()()D XE XE X222()()E XxE XE X22()2()()E XE xE XE X22()2()()()E XE X E XE X22()()E XE X现有股票现有股票A与股票与股票B在未来不同经济状态在未来不同经济状态下的可能报酬率如下下的可能报酬
27、率如下:经济状况各种状况发生的概率pi可能的报酬率(%)RA RB景气过热繁荣正常衰退萧条0.10.20.30.30.1 30 -45 20 -15 10 15 0 45 -10 75 试比较两种股票的预期报酬率和风险试比较两种股票的预期报酬率和风险.解:E(RA)=0.30.1+0.20.2+0.10.3 +00.3+(-0.1)0.1=0.09=9%E(RA2)=0.320.1+0.220.2+0.120.3 +020.3+(-0.1)2 0.1=0.021D(RA)=E(RA2)-E(RA)2=0.021-0.092=0.0129类似可计算出E(RB)=18%,D(RB)=0.1161
28、方差的性质方差的性质设X的分布律如下,求X的数学期望E(X)和方差D(X)。解 1()=10(1)kkkE Xx pppp 0-1分布的数学期望E(X)=p。0-1分布的方差D(X)=p(1-p)。X=xi1 0P(X=xi)=pip 1-p221()=10(1)kkkE Xx pppp 222()()()D XE XE Xpp(1)pp二项分布B(n,p)(期望值和方差)1.期望值期望值 =E(X)=np2.方差方差 2=D(X)=npq0.00.20.40.6012345XP(X)n=5 p=0.50.20.40.6012345XP(X)n=5 p=0.1)1(pq 二项分布二项分布 nk
29、knkknqpkX0C)(E nkknkqpknknk1)!(!nkknkqpknknnp1)1(11)!()!1()!1(1 ki令令 101)!1(!)!1(niiniqpininnp1)(nqpnp.np nkknkknqpkX022C)(E nkknkqpknknknp11)!()!1()!1(nkknknkknkqpknknqpknknknp1111)!()!1()!1()!()!1()!1()1(,1)1(pnnp所以所以.)1()()1()(D2pnpnppnpnpX 二项分布二项分布)1(pq npX)(E)1()(DpnpX,泊松分布(期望值和方差)1.期望值E(X)=2.方
30、差D(X)=0.00.20.40.6012345XP(X)0.00.20.40.60246810XP(X)0e!)(EkkkkX 1e)!1(kkk 0!eiii .ee 由无穷级数知识知,由无穷级数知识知,泊松分布泊松分布)(PX,e!PkkXk)0(,2,1,0k,!0ekkxkx),(x 泊松分布泊松分布 022e!)(kkkkXE 1e)!1(kkkk 12e)!1(e)!1()1(kkkkkkk ,2所以所以.)(22 XD)(PX,e!PkkXk)0(,2,1,0k)(E X)(D X,正态分布正态分布 xxxfXd)()(E xxfx e21)(222)(,xxxde21222)
31、(tttde)(2122 tttttde21de22222 .tx 令令)0(奇奇函函数数 正态分布正态分布2)(EE)(DXXX xxxde)(21222)(2 tx 令令 tttde22222 222de2tt ttttde2e2222222 .2 几几种种常常见见分分布布的的数数学学期期望望与与方方差差分布分布概率分布或概率密度概率分布或概率密度数学数学期望期望方差方差0-1分布二项分布泊松分布正态分布,kkqpkXP 11,0 k)1,10(pqp ppqknkknqpCkXP nk,2,1,0)1,10(pqp npnpq,e!kkXPk,2,1,0 k)0(,222)(e21)(x
32、xf x)0(2【练习练习】设随机变量设随机变量XB(10,0.2),YP(2),求求2X-Y+4的数学期望的数学期望E(2X-Y+4)。解解 E(2X-Y+4)=E(2X)-E(Y)+E(4)=2E(X)-E(Y)+E(4)=2*2-2+4=6E(X)=np=2E(Y)=2【练习练习】随机变量随机变量XN(0,1),YN(2,3),求求2X-Y+1的方差。的方差。解解 E(2X-Y+1)=D(2X)+D(-Y)+D(4)=4D(X)+D(Y)=4+3=7D(X)=1D(Y)=31(1)1(1)8P XP X 解:2130318xdx即2.解得2203()1.5.8xE Xxdx222203()1.50.15.8xD Xxdxn作业:P61-62n2n5(2)(3)n8