1、第五章第五章 常见概率分布律常见概率分布律难度级:难度级:-Today:2023-8-16第一节二项分布第一节二项分布第二节泊松分布第二节泊松分布第三节正态分布第三节正态分布第四节其他概率分布律第四节其他概率分布律内容提要内容提要-Today:2023-8-16教学重点:教学重点:1.正态分布、二项分布、泊松分布的概率 计算方法及应用;2.正态分布标准化的方法3.正态分布表、t值表的用法教学要求:教学要求:掌握正态分布、二项分布、泊松分布的概率计算方法及应用-Today:2023-8-16一、贝努利试验及其概率公式一、贝努利试验及其概率公式(一)独立试验和贝努利试验(一)独立试验和贝努利试验
2、对于n次独立的试验,如果每次试验结果出现且只出现对立事件 与 之一;在每次试验中出现A的概率是常数p(0p0,q0,p+q=1),则称随机变量X服从参数为n和p的二项分布,记为n.,k,qp)k(PknkknnC210=n.,k,qp)k(P)kX(PknkknnnC210=)p,n(Bx-Today:2023-8-16(二)二项分布的性质(二)二项分布的性质 二项分布是一种离散型随机变量的概率分布,由n和p两个参数决定,参数n称为离散参数离散参数,只能取正整数;p是连续参数连续参数,取值为0与1之间的任何数值。二项分布具有概率分布的一切性质,即:(k=0,1,2,n)二项分布的概率之和等于1
3、,即:0(k)P=k)=P(Xn10=+=nnkknkkn)pq(qpC-Today:2023-8-16-Today:2023-8-16-Today:2023-8-16四、二项分布的概率计算及其应用条件四、二项分布的概率计算及其应用条件(一)概率计算(一)概率计算 直接利用二项概率公式 例例66有一批种蛋,其孵化率为0.85,今在该批种蛋中任选6枚进行孵化,试给出孵化出小鸡的各种可能情况的概率。这个问题属于贝努里模型(?),其中 ,孵化6枚种蛋孵出的小鸡数x服从二项分布 .其中x的可能取值为0,1,2,3,4,5,6。6=n0.15=0.85-1=q0.85,=p)85.0,6(B-Today
4、:2023-8-160000113901501508500660066.).().().(C)(P=0003872801508506150850151161166.).().().().(C)(P=00548648015085015150850242262266.).().().().(C)(P=04145344015085020150850333363366.).().().().(C)(P=17617711015085015150850424464466.).().().().(C)(P=3993347801508506150850515565566.).().().().(C)(P=37
5、714952085015085066066666.).().().(C)(P=思考:求 至少孵出3只小鸡的概率是多少?孵出的小鸡数在2-5只之间的概率是多大?其中:-Today:2023-8-16 【例例4.10】设在家畜中感染某种疾病的概率为设在家畜中感染某种疾病的概率为20,现有两种疫苗,用疫苗,现有两种疫苗,用疫苗A 注射了注射了15头家畜后头家畜后无一感染,用疫苗无一感染,用疫苗B 注射注射 15头家畜后有头家畜后有1头感染头感染。设各头家畜没有相互传染疾病的可能,问:应。设各头家畜没有相互传染疾病的可能,问:应该如何评价这两种疫苗该如何评价这两种疫苗?假设疫苗假设疫苗A完全无效,那么
6、注射后的家畜感染的完全无效,那么注射后的家畜感染的概率仍为概率仍为20,则,则15 头家畜中染病头数头家畜中染病头数x=0的概的概率为率为 0352.080.020.0)0(150015Cxp-Today:2023-8-16 同理,如果疫苗同理,如果疫苗B完全无效,则完全无效,则15头家畜中头家畜中最多有最多有1头感染的概率为头感染的概率为 由计算可知由计算可知,注射注射 A 疫苗无效的概率为疫苗无效的概率为0.0352,比,比B疫苗无效的概率疫苗无效的概率0.1671小得多。因小得多。因此,可以认为此,可以认为A疫苗是有效的,但不能认为疫苗是有效的,但不能认为B疫苗也是有效的。疫苗也是有效的
7、。1671.08.02.08.02.0)1(141115150015CCxp-Today:2023-8-16(二)应用条件(三个)(二)应用条件(三个)n个观察单位的观察结果互相独立观察结果互相独立;各观察单位只具有互相对立的一种结果只具有互相对立的一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料。已知发生某一结果已知发生某一结果(如死亡)的概率为的概率为p p,其对立结果的概率则为1-P=q,实际中要求p 是从大量观察中获得的比较稳定的数值。-Today:2023-8-16要观察到这类事件,样本含量n必须很大。在生物、医学研究中,服从泊松分布的随机变量是常见的。此外,由于泊松分布是描述
8、小概率事件的,因而二项分布中当p很小n很大时,可用泊松分布-Today:2023-8-16 泊松分布是用来描述和分析稀有事件稀有事件即小概率事件分布规律的函数。在生物、医学研究中,服从波松分布的随机变量是常见的。如,一定种群中某种患病率很低的非传染性疾病患病数或死亡数,种群中遗传的畸形怪胎数,每升饮水中大肠杆菌数,计数器小方格中血球数,单位空间中某些野生动物或昆虫数等,都是服从波松分布的。-Today:2023-8-16一、泊松分布的意义一、泊松分布的意义(一)定义(一)定义 若随机变量X(X=k)只取零和正整数值,且其概率分布为 则称X服从参数为的泊松分布,记为X XP()P()。(二)特征
9、(二)特征 =2 2=2.7182=e0;0,1,=k ek!=k)=P(Xk-Today:2023-8-16【例例4.13】调查某种猪场闭锁育种群仔猪畸形调查某种猪场闭锁育种群仔猪畸形数,共记录数,共记录200窝,窝,畸形仔猪数的分布情况如畸形仔猪数的分布情况如表表4-3所示。试判断畸形仔猪数是否服从波松所示。试判断畸形仔猪数是否服从波松分布。分布。-Today:2023-8-16 表表4-3 畸形仔猪数统计分布畸形仔猪数统计分布 样本均数和方差样本均数和方差S2计算结果如下:计算结果如下:=fk/n =(1200+621 +152+23+14)/200 S2=0.51 x-=0.51,S2
10、=0.52,这两个数是相当接近的这两个数是相当接近的,因此因此可以认为畸形仔猪数服从波松分布。可以认为畸形仔猪数服从波松分布。xx52.01200200/)10241322151620120(1/)(222222222nnfkfks-Today:2023-8-16 是波松分布所依赖的唯一参数。是波松分布所依赖的唯一参数。值愈小值愈小分布愈偏倚,随着分布愈偏倚,随着的增大的增大,分,分 布趋于对称。当布趋于对称。当=20时分布接近于正态分布;当时分布接近于正态分布;当=50时,时,可以可以认认 为波松分布呈正态分布。为波松分布呈正态分布。所以在实际工作中,所以在实际工作中,当当 20时就可以用正
11、态分布来近似地处理波松分时就可以用正态分布来近似地处理波松分布的问题。布的问题。-Today:2023-8-16 二、波松分布的概率计算二、波松分布的概率计算 由由(4-23)式可知,波松分布的概率计算,依式可知,波松分布的概率计算,依赖于参数赖于参数 的确定,只要参数的确定,只要参数确定了确定了,把,把k=0,1,2,代入代入(4-23)式即可求得各项的概率。式即可求得各项的概率。但是但是在大多数服从波松分布的实例中,分布参数在大多数服从波松分布的实例中,分布参数往往往往是未知的,只能从所观察的随机样本中计算出相是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为应的样本平均数作为
12、的的 估计值,将其代替估计值,将其代替(4-23)式中的式中的,计算出,计算出 k=0,1,2,时的各项时的各项概率。概率。-Today:2023-8-16 如如【例例4.13】中已判断畸形仔猪数服从波中已判断畸形仔猪数服从波松分布,并已算出样本平均数松分布,并已算出样本平均数=0.51。将。将0.51代代替公式(替公式(4-23)中的)中的得:得:(k=0,1,2,)因为因为e-0.51=1.6653,所以畸形仔猪数各项的,所以畸形仔猪数各项的概率为:概率为:P(x=0)=0.510(0!1.6653)=0.6005 P(x=1)=0.511(1!1.6653)=0.3063 P(x=2)=
13、0.512(2!1.6653)=0.0781 51.0!51.0)(ekkxPk-P(x=3)=0.513(3!1.6653)=0.0133P(x=4)=0.514(4!1.6653)=0.0017 把上面各项概率乘以总观察窝数把上面各项概率乘以总观察窝数(n=200)即得各即得各项按波松分布的理论窝数。项按波松分布的理论窝数。波松分布与相应的频波松分布与相应的频率分布列于表率分布列于表4-4中。中。0001.09999.01)(1)4(40kkxpxP-Today:2023-8-16 表表4-4 畸形仔猪数的波松分布畸形仔猪数的波松分布 将实际计算得的频率与根据将实际计算得的频率与根据=0.
14、51的泊松分的泊松分布计算的概率相比较布计算的概率相比较,发现畸形仔猪的频率,发现畸形仔猪的频率分布与分布与=0.51 的的 波松分布是吻合得很好的波松分布是吻合得很好的。这进一步说明了畸形仔猪数是服从波松分布的这进一步说明了畸形仔猪数是服从波松分布的。-【例例4.14】为监测饮用水的污染情况,为监测饮用水的污染情况,现检验某现检验某社区每毫升饮用水中细菌数社区每毫升饮用水中细菌数,共得共得400个记录如下个记录如下:试分析饮用水中细菌数的分布是否服从波松分布试分析饮用水中细菌数的分布是否服从波松分布。若服从,按波松分布计算每毫升水中细菌数的概。若服从,按波松分布计算每毫升水中细菌数的概率及理
15、论次数并将頻率分布与波松分布作直观比较率及理论次数并将頻率分布与波松分布作直观比较。-Today:2023-8-16 经计算得每毫升水中平均细菌数经计算得每毫升水中平均细菌数 =0.500,方差方差S2=0.496。两者很接近,。两者很接近,故可认为每毫升故可认为每毫升水中细菌数服从波松分布。以水中细菌数服从波松分布。以 =0.500代替(代替(4-23)式中的)式中的,得,得 (k=0,1,2)计算结果如表计算结果如表45所示。所示。x5.0!5.0)(ekkxPkxx-表表45 细菌数的波松分布细菌数的波松分布 可见细菌数的频率分布与可见细菌数的频率分布与=0.5的波松分布是相的波松分布是
16、相当吻合的当吻合的,进一步说明用波松分布描述单位容积进一步说明用波松分布描述单位容积(或面积或面积)中细菌数的分布是适宜的。中细菌数的分布是适宜的。-Today:2023-8-16 注意,二项分布的应用条件也是波松分布的注意,二项分布的应用条件也是波松分布的应用条件。比如二项分布要求应用条件。比如二项分布要求n 次试验是相互独次试验是相互独立的,这也是波松分布的要求。然而一些具有传立的,这也是波松分布的要求。然而一些具有传染性的罕见疾病的发病数,因为首例发生之后可染性的罕见疾病的发病数,因为首例发生之后可成为传染源,会影响到后续病例的发生,所以不成为传染源,会影响到后续病例的发生,所以不符合波
17、松分布的应用条件。对于在单位时间、单符合波松分布的应用条件。对于在单位时间、单位面积或单位容积内,所观察的事物由于某些原位面积或单位容积内,所观察的事物由于某些原因分布不随机时,如细菌在牛奶中成集落存在时因分布不随机时,如细菌在牛奶中成集落存在时,亦不呈波松分布。,亦不呈波松分布。-Today:2023-8-16一、正态分布的定义及其特征一、正态分布的定义及其特征(一)定义(一)定义 若连续性随机变量若连续性随机变量X X的概率分布密度的概率分布密度函数为:函数为:其中,其中,为平均数,为平均数,2 2 为方差,则称随机变为方差,则称随机变量量服从正态分布服从正态分布,记为记为(,2 2).)
18、.相应的概率相应的概率分布函数为分布函数为0,+x,e21=f(x)222)(xx2)(x22e21=F(x)-Today:2023-8-16(二)特征(二)特征正态分布密度曲线是以=为对称轴的单峰、对称单峰、对称的悬悬钟形;钟形;f(x)在=处达到极大值,极大值为f(x)是非负数,以x轴为渐进线;正态分布正态分布密度函数曲线密度函数曲线 21=f)(-Today:2023-8-16正态分布有两个参数,即平均数和标准差。是位置参位置参数数,是变异度参数变异度参数。分布密度曲线与横轴所夹的面积为1,即:正态分布正态分布密度函数曲线密度函数曲线 1=dxe21=)+xP222)(x+(-Today
19、:2023-8-16 相同而相同而不同的三个正态总体不同的三个正态总体 相同而相同而不同的三个正态总体不同的三个正态总体-Today:2023-8-16(一)定义(一)定义 称=0,=0,2 2=1=1的正态分布为标准正态分布标准正态分布。标准正态分布的概率密度函数及分布函数如下:若随机变量服从标准正态分布,记作(0,1)22de21=(),e21)(22二、标准正态分布二、标准正态分布standard normal distribution-Today:2023-8-16(二)标准化的方法(二)标准化的方法 对于任何一个服从正态分布(,2)的随机变量,都可以通过标准化变换:u=(-)/即减平
20、均数后再除以标准差减平均数后再除以标准差,将其变换为服从标准正态分布的随机变量。对不同的及P(Uu)值编成函数表,称为正态分布表,从中可以查到任意一个区间内曲线下的面积,即为概率。-Today:2023-8-16三、正态分布的概率计算三、正态分布的概率计算(一)标准正态分布的概率计(一)标准正态分布的概率计 设u服从标准正态分布,则落在1,2内的概率due21=)uuP(u212uu2u21due21-due21=1222u2uu2u)(u)(u=12可由附表查)(u与)(u而12-0.99=2.58)u2.58P(0.95=1.96)u1.96P(0.9973=3)u3P(0.9545=2)
21、u2P(0.6826=1)u1P(0.99=)2.58+x2.58P(0.95=)1.96+x1.96P(0.9973=)3+x3P(0.9545=)2+x2P(0.6826=)+xP(应熟记的几种标准正态分布概率应熟记的几种标准正态分布概率-Today:2023-8-16(二)一般正态分布的概率计算(二)一般正态分布的概率计算 将区间的上下限标准化将区间的上下限标准化:服从正态分布的随机变量落在1,2内的概率,等于服从标准正态分布的随机变量u落在 的概率。查标准正态分布表查标准正态分布表/x,/x21-Today:2023-8-16 【例例4.6】已知已知uN(0,1),试求:,试求:(1)
22、P(u-1.64)?(2)P(u2.58)=?(3)P(u2.56)=?(4)P(0.34u1.53)=?-Today:2023-8-16 利用利用(4-12)式,查附表式,查附表2得:得:(1)P(u-1.64)=0.05050 (2)P(u2.58)=(-2.58)=0.024940 (3)P(u2.56)=2(-2.56)=20.005234 =0.010468 (4)P(0.34u1.53)=(1.53)-(0.34)=0.93669-0.6331=0.30389-Today:2023-8-16 例例 若服从=30.26,2=5.102的正态分布,试求P(21.64x32.98)。令u
23、=(-30.26)/5.10,则u服从标准正态分布,故0.6564=1.69)(0.53)=0.53)91.6P(=)5.1030.2632.985.1030.26x5.1030.2621.64P(=32.98)xP(21.64-Today:2023-8-16 高梁品种三尺三的株高服从正态分布N(156.2,4.822),求:(1)X164cm的概率;(3)X在152162cm的概率。解:(1)根据P(X164)=-(164-156.2)/4.82=(-1.62)=0.05262 =1-(164-156.2)/4.82=1-0.94738 =0.05262(3)P(152XP(x=)1.96P
24、(x=)2.58P(x)k-P(x=)kP(x-Today:2023-8-16标准正态双侧分位数的查法:附表附表3 3 标准正态分布为双侧临界值 u为双侧概率,其中0u)uuP(=)1,0(Nu临界值下侧临界值上侧临界值侧的双 侧表示u或u的表示u的表示u)(双2正态分布正态分布密度函数曲线密度函数曲线-Today:2023-8-16 前面讨论的三个重要的概率分布中,前两个前面讨论的三个重要的概率分布中,前两个属离散型随机变量的概率分布,后一个属连续型属离散型随机变量的概率分布,后一个属连续型随机变量的概率分布随机变量的概率分布。三三 者间的关系如下:者间的关系如下:对于二项分布,在对于二项分
25、布,在n,p0,且且 n p=(较较小常数小常数)情况下情况下,二项分布,二项分布 趋于趋于 波波 松布。在这种松布。在这种场合,波松分布中的参数场合,波松分布中的参数 用二项分布的用二项分布的n p代之代之;在;在n,p0.5时时,二项分布趋于正态分布。二项分布趋于正态分布。在这种场合在这种场合,正态分布中的,正态分布中的、2用二项分布的用二项分布的n p、n p q代之。在实际计算中,当代之。在实际计算中,当p0.1且且n 很大很大时时,二项分布可由波松分布近似;当二项分布可由波松分布近似;当p0.1且且n很大时很大时,二项分布可由正态分布近似。,二项分布可由正态分布近似。-Today:2023-8-16 对于波松分布,当对于波松分布,当时时,波松分布以正,波松分布以正态分布为极限。在实际计算中,态分布为极限。在实际计算中,当当 20 (也也有人认为有人认为6)时,用波松分布中的时,用波松分布中的代替正态代替正态分布中的分布中的及及2,即可由后者对前者进行近似,即可由后者对前者进行近似计算。计算。-Today:2023-8-16中心极限定理中心极限定理 中心极限定理告诉我们:不论x变量是连续型还是离散型,也无论x服从何种分布,一般只要n30,就可认为 的分布是正态的。若x的分布不很偏倚,在n20时,x 的分布就近似于正态分布了。x-