1、1.一次试验的结果的数值性描述2.一般用 X,Y,Z 来表示3.例如:投掷两枚硬币出现正面的数量4.根据取值情况的不同分为离散型随机变量和连续型随机变量随机变量(random variables)第1页/共78页1.随机变量 X 取有限个值或所有取值都可以逐个列举出来 x1,x2,2.以确定的概率取这些不同的值3.离散型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽查抽查100个个产品产品一家餐馆营业一天一家餐馆营业一天电脑公司一个月的销售电脑公司一个月的销售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾客数顾客数销售量销售量顾客性别顾客性别0,1,2,1000,1,
2、2,0,1,2,男性为男性为0,女性为女性为1离散型随机变量(discrete random variables)第2页/共78页1.可以取一个或多个区间中任何值 2.所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点3.连续型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽查一批电子元件抽查一批电子元件新建一座住宅楼新建一座住宅楼测量一个产品的测量一个产品的长度长度使用寿命使用寿命(小时小时)半年后工程完成的百分比半年后工程完成的百分比测量误差测量误差(cm)X 00 X 100X 0连续型随机变量(continuous random variables)第3页/
3、共78页离散型随机变量的概率分布第4页/共78页1.列出离散型随机变量X的所有可能取值2.列出随机变量取这些值的概率3.通常用下面的表格来表示X=xix1,x2,xnP(X=xi)=pip1,p2,pn离散型随机变量的概率分布第5页/共78页离散型随机变量的概率分布(例题分析)【例】如规定打靶中域得3分,中域得2分,中域得1分,中域外得0分。今某射手每100次射击,平均有30次中域,55次中域,10次中,5次中域外。则考察每次射击得分为0,1,2,3这一离散型随机变量,其概率分布为X=xi0 1 2 3P(X=xi)pi0.05 0.10 0.55 0.30第6页/共78页一部电梯在一周内发生
4、故障的次数X及相应的概率如下表:故障次数X=xi0123概率P(X=xi)pi0.100.250.35 一部电梯一周发生故障的次数及概率分布(1)确定的值 (2)求正好发生两次故障的概率 (3)求故障次数不超过2次的概率 (4)至少发生两次故障的概率 离散型随机变量的概率分布(例题分析)第7页/共78页离散型随机变量的概率分布(例题分析)第8页/共78页1.离散型随机变量X的所有可能取值xi与其取相对应的概率pi乘积之和2.描述离散型随机变量取值的集中程度3.记为 或E(X)4.计算公式为:离散型随机变量的数学期望(expected value)第9页/共78页1.随机变量X的每一个取值与期望
5、值的离差平方和的数学期望,记为 2 或D(X)2.描述离散型随机变量取值的分散程度 计算公式为:3.差的平方根称为标准差,记为 或 D(X)离散型随机变量的方差(variance)第10页/共78页次品数X=xi0123概率P(X=xi)pi0.750.120.080.05每100个配件中的次品数及概率分布 方差的性质第11页/共78页两两 点点 分分 布布 二二 项项 分分 布布 泊泊 松松 分分 布布离离 散散 型型 概概 率率 分分 布布常用离散型概率分布第12页/共78页1.一个离散型随机变量X只取0和1两个可能的值2.它们的概率分布为:或 也称0-1分布两点分布第13页/共78页已知
6、一批产品的次品率为p0.05,合格率为q=1-p=1-0.05=0.95。并指定废品用1表示,合格品用0表示。则任取一件为废品或合格品这一离散型随机变量,其概率分布为:X=xi0 1P(X=xi)=pi0.95 0.05两点分布(例题分析)第14页/共78页1.二项分布与伯努利试验有关2.二项分布满足下列条件一次试验只有两个可能结果,即“成功”和“失败”“成功”是指我们感兴趣的某种特征一次试验“成功”的概率为p,失败的概率为q=1-p,且概率p对每次试验都是相同的 试验是相互独立的,并可以重复进行n次 在n次试验中,“成功”的次数对应一个离散型随机变量X 二项分布(Binomial distr
7、ibution)第15页/共78页1.重复进行 n 次试验,出现“成功”的次数的概率分布称为二项分布,记为XB(n,p)2.设X为 n 次重复试验中出现成功的次数,X 取 x 的概率为:二项分布(Binomial distribution)第16页/共78页1.对于P(X=x)0,x=1,2,n,有2.同样有3.当 n=1 时,二项分布化简为二项分布(Binomial distribution)第17页/共78页1.1.数学期望 =E E(X X)=)=npnp2.2.方差2.2=D D(X X)=)=npqnpq0.00.20.40.6012345XP(X)n=5 p=0.50.20.40.
8、6012345XP(X)n=5 p=0.1二项分布(数学期望和方差)第18页/共78页已知一批产品的次品率为4%,从中任意有放回地抽 取5个。求5个产品中:(1)没有次品的概率是多少?(2)恰好有1个次品的概率是多少?(3)有3个以下次品的概率是多少?二项分布(例题分析)第19页/共78页1.1837年法国数学家泊松(D.Poisson,17811840)首次提出 2.用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布3.性质:在任意两个相等的区间上事件发生一次的概率是相等的;事件在某个区间上发生或者不发生与其他区间上的事件是否发生是无关的。4.泊松分布的例子一定时
9、间段内,某航空公司接到的订票电话数一定时间内,到车站等候公共汽车的人数一匹布上发现的疵点个数一定页数的书刊上出现的错别字个数 泊松分布(Poisson distribution)第20页/共78页 给定的时间间隔、长度、面积、体积内“成功”的平均数e=2.71828 x 给定的时间间隔、长度、面积、体积内“成功”的次数e(0,1,2,0)!xP Xxxx 泊松分布(概率分布函数)第21页/共78页1.数学期望 E(X)=2.方差 D(X)=0.00.20.40.6012345XP(X)0.00.20.40.60246810XP(X)泊松分布(数学期望和方差)第22页/共78页假定某航空公司预订
10、票处平均每小时接到42次订票电话,那么10分钟内恰好接到6次电话的概率是多少?解:设X=10分钟内航空公司预订票处接到的电话次数 泊松分布(例题分析)第23页/共78页泊松分布(例题分析)【例】假定某企业的职工中在周一请假的人数X服从泊松分布,且设周一请事假的平均人数为2.5人。求 (1)X 的均值及标准差 (2)在给定的某周一正好请事假是5人的概率 解:(1)E(X)=2.5,(2)581.15.2)(XD第24页/共78页k20151050概率.3.2.10.0Poisson 分 布P(10)P(6)P(3)参数为3 3、6 6、1010的PoissonPoisson分布(只标出了2020
11、之内的部分)这里点间的连线没有意义,仅仅为读者容易识别而画,因为PoissonPoisson变量仅取非负整数值第25页/共78页 例:假定我们关心的是高速公路在重新整修的一个月内内出现严重损坏的数目,假定任意两段相等长度的高速公路上出现损坏的概率相等,任意一段距离出现或不出现损坏与另一段距离出现损坏与否无关,已知一个月内平均每公里有两处损坏,求在3公里的公路上没有严重损坏的概率和至少有一次出现严重损坏的概率?课题练习第26页/共78页 依据过去一年的统计资料显示某电话公司市内电话交换机于周日晚间8:008:05时段内转接电话的平均数为10通,今日又恰逢周日。1)若以X表示今天晚上8:008:0
12、5时段内交换机转接电话的通数,则X的概率函数为?2)以上时段内电话少于3通的概率(包括3通)?3)若以Y表示今晚8:008:01时间段内交换机转接电话的通数,则Y的概率函数为?4)以上的时间段,电话通数多于4通的概率为?课题练习第27页/共78页v概率密度函数v正态分布v其他连续型概率分布连续型概率分布第28页/共78页正正 态态 分分 布布 卡卡 方方 分分 布布F F 分分 布布t t 分分 布布连连 续续 型型 概概 率率 分分 布布常用连续型概率分布第29页/共78页1.连续型随机变量可以取某一区间或整个实数轴上的任意一个值2.它取任何一个特定的值的概率都等于03.不能列出每一个值及其
13、相应的概率4.通常研究它取某一区间值的概率5.用概率密度函数的形式和分布函数的形式来描述连续型随机变量的概率分布第30页/共78页 想象连续变量观测值的直方图;如果其纵坐标为相对频数,那么所有这些矩形条的高度和为1;完全可以重新设置量纲,使得这些矩形条的面积和为1。不断增加观测值及直方图的矩形条的数目,直方图就会越来越像一条光滑曲线,其下面的面积和为1。该曲线即所谓概率密度函数(probability density function,pdf),简称密度函数或密度。下图为这样形成的密度曲线。概率密度函数(probability density function(probability dens
14、ity function,pdf)pdf)第31页/共78页(1)(2)(3)(4)-2020.00.10.20.30.4逐渐增加矩形条数目的直方图和一个形状类似的密度曲线第32页/共78页1.设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件2.f(x)不是概率 概率密度函数(probability density function)第33页/共78页 密度函数 f(x)表示X 的所有取值 x 及其频数f(x)概率密度函数第34页/共78页 在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1 x2,P(x1 X x2)是该曲线下从x1 到 x2的面积xa
15、b概率密度函数第35页/共78页1.连续型随机变量的概率可以用分布函数F(x)来表示2.分布函数定义为:3.根据分布函数,P(aXb)可以写为:分布函数(distribution function)第36页/共78页1.密度函数曲线下的面积等于12.分布函数是曲线下小于 x0 的面积分布函数与密度函数的图示第37页/共78页1.连续型随机变量的数学期望2.方差22()()()dD XxE Xf xx连续型随机变量的期望和方差第38页/共78页1.由C.F.高斯(Carl Friedrich Gauss,17771855)作为描述误差相对频数分布的模型而提出2.描述连续型随机变量的最重要的分布3
16、.许多现象都可以由正态分布来描述 4.可用于近似离散型随机变量的分布例如:二项分布5.经典统计推断的基础正态分布(normal distribution)第39页/共78页1.f(x)=随机变量 X 的频数 2.=正态随机变量X的均值3.=正态随机变量X的方差 4.=3.1415926;e=2.718285.x=随机变量的取值(-x )概率密度函数第40页/共78页正态分布的概率第41页/共78页1.图形是关于x=对称钟形曲线,且峰值在x=处2.均值和标准差一旦确定,分布的具体形式也惟一确定,不同参数正态分布构成一个完整的“正态分布族”3.均值可取实数轴上的任意数值,决定正态曲线的具体位置;标
17、准差决定曲线的“陡峭”或“扁平”程度。越大,正态曲线扁平;越小,正态曲线越高陡峭4.当X的取值向横轴左右两个方向无限延伸时,曲线的两个尾端也无限渐近横轴,理论上永远不会与之相交,表示可能得到的极值存在无限小的可能性。5.正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1 正态分布函数的性质第42页/共78页xCAB 和 对正态曲线的影响第43页/共78页2222(1)82(1)1(),()21(),()221(),()2xxxfxexfxexfxex 课堂练习第44页/共78页1.随机变量具有均值为0,标准差为1的正态分布2.任何一个一般的正态分布,可通过下面
18、的线性变换转化为标准正态分布221()e,2xf xx 标准正态分布(standardize the normal distribution)第45页/共78页一般正态分布标准正态分布标准正态分布第46页/共78页 设随机变量XN(0,1),其概率密度函数为f(x)。对于给定的数:01,称满足条件:P(XZ)=的数Z为标准正态分布上的分位点,其几何意义如图所示:对于给定的,Z的值这样求得:由 P(XZ)=Zdxxf)()(1)()()(ZfdxxfdxxfdxxfZZ标准正态分布上的分位点通过下图,学习、练习查分布表第47页/共78页()()1P ZZF Z 第48页/共78页1.对于标准正态
19、分布,即ZN(0,1),有P(a Zb)b aP(|Z|a)2 a 12.对于负的 z,可由F(-z)Fz得到3.对于一般正态分布,即XN(,),有标准正态分布表的使用第49页/共78页标准化的例子P(5 X 6.2)第50页/共78页标准化的例子P(2.9 X 7.1)第51页/共78页正态分布(例题分析)第52页/共78页【例】设XN(5,32),求以下概率 (1)P(X 10);(2)P(2X 10)解:(1)正态分布(例题分析)第53页/共78页已知随机变量XN(0,1),试求概率 P(0.5x1.5)=?课堂习题第54页/共78页定某公司职员每周的加班津贴服从均值为50元、标准差为1
20、0元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过70元,又有多少比例的职员每周的加班津贴在40元到60元之间呢?正态分布(例题分析)第55页/共78页【例4-8】某企业年销售额服从均值为75万元、标准差为12万元的正态分布。那么某年该企业销售额在75万元到90万元之间的概率应为多少?第56页/共78页 解:设X表示该企业的销售额,要计算的概率是P(75X90)。首先对X进行标准化:Z=将计算X的概率转化为计算Z的概率:P(75X90)=0.394 47512X 757575907501.25121212XPPZ第57页/共78页 1、已知某种水果的单个重量服从正态分布,平均值为
21、140g,标准差为12.2g,今随机抽出一个,试问其重量不小于130g的概率是多少?2、某地区成年男子身高服从正态分布,其均值是169cm,标准差为7cm。求满足满足以下条件的男子的比例:、155cm以下;、176cm以上;155cm176cm之间 3、某电视机厂某种型号电视机的销售价为2000元,成本为1200元。产品中有一部分可能会在保持期内损坏,因此厂家得免费维修,假设修理费平均而言每台500元。现假设电视机的使用寿命呈正态分布,均值为7年,标准差为3年。问:如果希望每台电视机的平均利润达到750元,厂家应承诺的保修期大概是几年?作 业第58页/共78页1.由阿贝(Abbe)于1863年
22、首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson)分别于1875年和1900年推导出来2.设 ,则3.令 ,则 Y 服从自由度为1的2分布,即 2分布(2 distribution)第59页/共78页 在反复抽取容量相同的独立同分布样本条件下,所得到的样本方差的概率分布称为样本方差的抽样分布。在服从正态分布的同分布总体中,样本方差与总体方差的比值服从于自由度n-1为的卡方分布。即 卡方分布仅在第一象限取值,所以分布的取值永远为正数。卡方分布一般为右偏态的偏峰分布,偏倚形态取决于其自由度的数值,自由度的数值越小,偏倚的程度越大,并且随着自由度的数值增大,分布的形态逐渐趋于对
23、称,正态分布是卡方分布的极限分布。11222212nsnxxnii样本方差的抽样分布第60页/共78页1.分布的变量值始终为正 2.分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 3.期望为:E(2)=v,方差为:D(2)=2v(v为自由度)4.可加性:若U和V为两个独立的2分布随机变量,U2(v1),V2(v2),则U+V这一随机变量服从自由度为v1+v2的2分布 2分布(性质和特点)第61页/共78页 c2分布(图示)第62页/共78页 分位点 若对于给定的 ,0 1,存在使得 则称点 为 分布的上 分位点,如图所示。)1(222)()1(ndxx
24、fnP)(2v2第63页/共78页 v=15,=0.050 v=20,=0.050 v=30,=0.100 v=25,=0.010 v=20,=0.950 v=26,=0.900 v=30,=0.990课堂练习第64页/共78页1.由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名2.设 若U为 服 从 自 由 度 为 v1的2分 布,即U2(v1),V为服从自由度为v2的2分布,即V2(v2),且U和V相互独立,则3.称F为服从自由度v1和v2的F分布,记为F分布(F distribution)第65页/共78页 假设总体X-N(),总体Y-N(),X,Y相互独立,x
25、1,x2,xn和y1,y2,yn分别是来自X和Y的样本。分别是它们的方差,则:),(/2122222121vvFss211,222,2221,ss第66页/共78页F 分布(图示)第67页/共78页 分位点对于给定的,0 1,称满足为F分布的分位点。),(2121)(),(nnFdxxfnnFFP),(1),(12211nnFnnF第68页/共78页 F0.10(15,12)F0.05(20,12)F0.01(15,12)F0.95(15,12)F0.90(20,12)F0.99(15,12)课堂练习第69页/共78页 t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特
26、定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布。T比Z分布更广,比正态分布更“平坦”,这是因为使用S不确定更强,使t比Z更“稀薄”。在小样本场合,不满足中心极限定理对于样本容量充分大的要求,样本均值不趋于正态分布,而是趋于t分布。统计学家戈斯特(W.S.Gosset 1876-1936)在1908年以 Student 的笔名发表的一篇论文中,首次提出了t分布,从而这一小样本分布理论被称为Student分布,简称为t分布。t分布的形状也是一左右对称的钟形图形,比正态分布扁平,并且受到自由度数值大小的约束,自由度的数值越小,t分布越趋于扁平;自由度的数值越大,t分布扁平
27、的程度越小,并且随着自由度的数值增大,t分布的形态逐渐趋于正态分布。t分布的应用条件是总体服从正态分布。在总体方差未知时,t分布是一种精确的估计方法,正态分布只是其近似的概率分布t分布第70页/共78页t 分布与标准正态分布的比较t 分布标准正态分布不同自由度的t分布标准正态分布t(df=13)t(df=5)t分布第71页/共78页 设XN(0,1),YXN(0,1),Y ,且X X与Y Y相互独立,则称随机变量nYXt 服从自由度为n n的t t分布,记为tt(n)tt(n)。)(2n t(n)t(n)分布的概率密度函数为 tntnnnthn )1()2()21()(212 t分布第72页/
28、共78页)1()1()1(/,)1(/)1()1(),1,0(/1:2222222ntnSnnXnSXtSnnXnSnNnX分布的定义知由相互独立与且的结论知由定理证2122 ,(,),(1)/nX XXNX SXt nSn 设为来自总体的样本(现实上是近似的)分别为样本均值与样本方差 则有定理2第73页/共78页关于y轴呈对称分布;当 时,近似于 N(0,1)分布。分位点对于给定的,0 1,称满足的点 为t分布的分位点。n)1()()1(ntdttfnttP)1(nt)1()1(1ntnt性 质第74页/共78页 t0.10(15)t0.05(18)t0.01(16)t0.90(17)t0.
29、95(15)t0.99(16)课堂练习第75页/共78页例:假定某一企业职工收入情况服从正态分布中,从该企业随机抽取了16个职工个人的收入状况数据构成样本,拟以此推断该企业职工平均月收入。要求 若该企业职工平均月收入的总体均值为2000元,样本标准差为为250元,试计算样本均值不小于1950元的近似概率。解 由于样本容量小于30,为小样本,此时的样本均值服从于t分布。并且,已知样本容量为16,因此本例的样本均值服从于自由度为15的t分布。有 即在样本容量仅为16的小样本条件下,该次调查的样本均值不小于1950元的概率为78.19%。781901.08.018.05.625016250200019501625020001950TPTPTPxPxP第76页/共78页1.随机变量2.离散型概率分布两点分布二项分布泊松分布3.连续型概率分布正态分布卡方分布 F分布 t分布本章小结第77页/共78页谢谢您的观看!第78页/共78页