生物统计学:几种常见的概率分布律课件.ppt

上传人(卖家):晟晟文业 文档编号:3620527 上传时间:2022-09-26 格式:PPT 页数:70 大小:1.08MB
下载 相关 举报
生物统计学:几种常见的概率分布律课件.ppt_第1页
第1页 / 共70页
生物统计学:几种常见的概率分布律课件.ppt_第2页
第2页 / 共70页
生物统计学:几种常见的概率分布律课件.ppt_第3页
第3页 / 共70页
生物统计学:几种常见的概率分布律课件.ppt_第4页
第4页 / 共70页
生物统计学:几种常见的概率分布律课件.ppt_第5页
第5页 / 共70页
点击查看更多>>
资源描述

1、3.1 二项分布3.2 泊松分布3.3 另外几种离散型概率分布3.4 正态分布3.5另外几种连续型概率分布3.6 中心极限定理3.1 3.1 二项分布二项分布 一、贝努利试验及其概率公式 将某随机试验重复进行n次,若各次试验结果互不影响,即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n次试验是独立的。对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与 之一,在每次试验中出现A的概率是常数p(0p1),因而出现对立事件 的概率是1-p=q,则称这一串重复的独立试验为n重贝努利试验,简称贝努利试验(Bernoulli trials)。AA 在生物学研究中,我们经常碰到的一类

2、离散型随机变量,如孵n枚种蛋的出雏数、n头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。在n重贝努利试验中,事件 A 可能发生0,1,2,n次,现在我们来求事件A恰好发生k(0kn)次的概率Pn(k)。()0,1,2,kkn knnPpkCnkq,二、二项分布的意义及性质 二项分布定义如下:设随机变量x所有可能取的值为零和正整数:0,1,2,,n,且有 k=0,1,2,n 其中p0,q0,p+q=1,则称随机变量x服从参数为n和p的二项分布(binomial distribution),记为 xB(n,p)。()kkn knnP kC p q二项分布具有概率分布的一切性质,即

3、:1.P(x=k)=Pn(k)(k=0,1,,n)2.二项分布的概率之和等于1,即0()1nkkn knnkC p qqp3.(3-2)4.(3-3)5.(m1=4 合计窝数f120621521200表表3-1 畸形仔猪数统计分布畸形仔猪数统计分布样本均数和方差样本均数和方差S2计算结果如下:计算结果如下:=0.51,S2=0.52,这两个数是相当接近的,这两个数是相当接近的,因此可以认为畸形仔猪数服从波松分布。因此可以认为畸形仔猪数服从波松分布。222222222()1(120 062 115 22 31 4102)/200200 10.52fkfknSn x 是波松分布所依赖的唯一参数。是

4、波松分布所依赖的唯一参数。值愈小分布愈值愈小分布愈偏倚,随着偏倚,随着的增大的增大,分,分 布趋于对称布趋于对称(如下图所示如下图所示)。当。当=20时分布接近于正态分布;当时分布接近于正态分布;当=50时,时,可以认可以认 为波为波松分布呈正态分布。松分布呈正态分布。所以在实际工作中,当所以在实际工作中,当20时就时就可以用正态分布来近似地处理波松分布的问题。可以用正态分布来近似地处理波松分布的问题。二、波松分布的概率计算二、波松分布的概率计算 由由(3-10)式可知,波松分布的概率计算,依赖式可知,波松分布的概率计算,依赖于参数于参数 的确定,只要参数的确定,只要参数确定了,把确定了,把k

5、=0,1,2,代入代入(3-10)式即可求得各项的概率。式即可求得各项的概率。但是在但是在大多数服从波松分布的实例中,分布参数大多数服从波松分布的实例中,分布参数往往往往是未知的,只能从所观察的随机样本中计算出相是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为应的样本平均数作为的估计值,将其代替的估计值,将其代替(3-10)式中的式中的,计算出,计算出 k=0,1,2,时的各项概率。时的各项概率。如如【例例3.6】中已判断畸形仔猪数服从波松分中已判断畸形仔猪数服从波松分布,并已算出样本平均数布,并已算出样本平均数=0.51。将。将0.51代替公代替公式(式(3-10)中的)中的得:

6、得:(k=0,1,2,)因为因为e-0.51=1.6653,所以畸形仔猪数各项的概,所以畸形仔猪数各项的概率为:率为:P(x=0)=0.510(0!1.6653)=0.6005P(x=1)=0.511(1!1.6653)=0.3063P(x=2)=0.512(2!1.6653)=0.0781 0.510.51()!kP xkekP(x=3)=0.513(3!1.6653)=0.0133P(x=4)=0.514(4!1.6653)=0.0017 把上面各项概率乘以总观察窝数把上面各项概率乘以总观察窝数(n=200)即得即得各项按波松分布的理论窝数。各项按波松分布的理论窝数。波松分布与相应波松分布

7、与相应的频率分布列于表的频率分布列于表3-2中。中。40(4)1()1 0.99990.0001kP xp xk 表表3-2 畸形仔猪数的波松分布畸形仔猪数的波松分布 将实际计算得的频率与根据将实际计算得的频率与根据=0.51的泊松分的泊松分布计算的概率相比较布计算的概率相比较,发现畸形仔猪的频率分,发现畸形仔猪的频率分布与布与=0.51 的的 波松分布是吻合得很好的波松分布是吻合得很好的。这进。这进一步说明了畸形仔猪数是服从波松分布的。一步说明了畸形仔猪数是服从波松分布的。【例例3.7】为监测饮用水的污染情况,为监测饮用水的污染情况,现检验现检验某社区每毫升饮用水中细菌数某社区每毫升饮用水中

8、细菌数,共得共得400个记录个记录如下:如下:试分析饮用水中细菌数的分布是否服从波松试分析饮用水中细菌数的分布是否服从波松分布。若服从,按波松分布计算每毫升水中细菌分布。若服从,按波松分布计算每毫升水中细菌数的概率及理论次数并将頻率分布与波松分布作数的概率及理论次数并将頻率分布与波松分布作直观比较。直观比较。1ml水中的细菌数012=3合计次数f243120316400 经计算得每毫升水中平均细菌数经计算得每毫升水中平均细菌数 =0.500,方差方差S2=0.496。两者很接近,故可认为每毫升水。两者很接近,故可认为每毫升水中细菌数服从波松分布。以中细菌数服从波松分布。以=0.500代替代替

9、(3-10)式中的式中的,得,得 (k=0,1,2,)计算结果如表计算结果如表3-3所示。所示。0.50.5()!kP xkekxx表表3-3 细菌数的波松分布细菌数的波松分布 可见细菌数的频率分布与可见细菌数的频率分布与=0.5的波松分布是的波松分布是相当吻合的相当吻合的,进一步说明用波松分布描述单位进一步说明用波松分布描述单位容积容积(或面积或面积)中细菌数的分布是适宜的。中细菌数的分布是适宜的。注意,二项分布的应用条件也是波松分布注意,二项分布的应用条件也是波松分布的应用条件。的应用条件。对于波松分布,当对于波松分布,当时时,波松分布以正态分,波松分布以正态分布为极限。在实际计算中,布为

10、极限。在实际计算中,当当 20 (也有人认为也有人认为6)时,用波松分布中的时,用波松分布中的代替正态分布中的代替正态分布中的及及2,即可由后者对前者进行近似计算。即可由后者对前者进行近似计算。3.3另外几种离散型概率分布 1、超几何分布 2、负二项分布1.超几何分布 从一个包含两种不同类型个体的有限总体中,做非放回式抽样。在n次抽样中,抽中某种类型个体数即为服从超几何分布的随机变量。概率函数:N:总体中个体数 K:两种类型中某一种类型的个体数 n:非放回式抽样的次数 x:在n次抽样中某一种类型的个体数(),0,1,2,.,xn xKN KnNC Cp xxnC 平均数:方差:NnK)1()(

11、22NNnNKNnK2.负二项分布 负二项分布所要求的条件与二项分布是一样的。不同的是负二项分布需要求出在第x次试验时,发生第k次事件A的概率。或者说,在x次试验中,共发生k次事件A,而且事件A的第k次试验恰恰是在第x次试验发生的。,.1,)1()(11kkxCxpkxkkx3.4 正态分布正态分布 正态分布是一种很重要的连续型随机变量正态分布是一种很重要的连续型随机变量的概率分布。生物现象中有许多变量是服从或的概率分布。生物现象中有许多变量是服从或近似服从正态分布的。许多统计分析方法都是近似服从正态分布的。许多统计分析方法都是以正态分布为基础的。此外,还有不少随机变以正态分布为基础的。此外,

12、还有不少随机变量的概率分布在一定条件下以正态分布为其极量的概率分布在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理限分布。因此在统计学中,正态分布无论在理论研究上还是实际应用中论研究上还是实际应用中 ,均占有重要的地均占有重要的地位。位。一、正态分布的定义及其特征一、正态分布的定义及其特征 (一)(一)正态分布的定义正态分布的定义 若连续型随机变量若连续型随机变量x的概率分布密度的概率分布密度函数为函数为 (3-6)其中其中为平均数,为平均数,2为方差,则称随机变量为方差,则称随机变量x服从正态分布服从正态分布(normal distribution),记为记为xN(,2)

13、。相应的概率分布函数为。相应的概率分布函数为 (3-7)22()21()2xf xe22()21()2xxF xedx (二二)正态分布的特征正态分布的特征 1、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x=;2、f(x)在在 x=处达到极大处达到极大,极大值,极大值 ;3、f(x)是非负函数,以是非负函数,以x轴为渐近线,分布从轴为渐近线,分布从-至至+;4、曲线在、曲线在x=处各有一个拐点,即曲线在处各有一个拐点,即曲线在(-,-)和和(+,+)区间上是下凸的,在区间上是下凸的,在-,+区间内是上凸的;区间内是上凸的;5、正态分布

14、有两个参数,即平均数、正态分布有两个参数,即平均数和标准差和标准差。6、分布密度曲线与横轴所夹的面积为、分布密度曲线与横轴所夹的面积为1,即:,即:1()2f22()21()12xPxedx 是位置参数,如图所示。是位置参数,如图所示。当当恒定时,恒定时,愈大,则曲线沿愈大,则曲线沿x轴愈向轴愈向右移动;反之,右移动;反之,愈小,曲线沿愈小,曲线沿x轴愈向左移动。轴愈向左移动。是变异度参数,是变异度参数,如图所示如图所示。当当恒定时,恒定时,愈大,表示愈大,表示 x 的取值愈分的取值愈分散,散,曲线愈曲线愈“胖胖”;愈小,愈小,x的取值愈集中在的取值愈集中在附近,曲线愈附近,曲线愈“瘦瘦”。二

15、、标准正态分布二、标准正态分布 由上述正态分布的特征可知由上述正态分布的特征可知,正态分布,正态分布是依赖于参数是依赖于参数和和2 (或或)的一簇的一簇 分布,正态分布,正态曲线之位置及形态随曲线之位置及形态随和和2的不同而不同。的不同而不同。这这就给研究具体的正态总体带来困难,需将一就给研究具体的正态总体带来困难,需将一般的般的N(,2)转换为转换为=0,2=1的正态分布。的正态分布。我们称我们称=0,2=1的正态分布为标准正态分布的正态分布为标准正态分布(standard normal distribution)。标准正态分布的概率密度函数及分布函数分标准正态分布的概率密度函数及分布函数分

16、别记作别记作(u)(Psi)和和(Phi)(u),由,由(3-6)及及(3-7)式得:式得:(3-8)(3-9)221()2uue2121()2uuuedu随机变量随机变量u服从标准正态分布,记作服从标准正态分布,记作uN(0,1),分布,分布密度曲线如图所示。密度曲线如图所示。对于任何一个服从正态分布对于任何一个服从正态分布N(,2)的随机变量的随机变量x,都可以通过标准化变换:都可以通过标准化变换:u=(x-)(3-10)将其变换为服从标准正态分布的随机变量将其变换为服从标准正态分布的随机变量u。u称为标准正态变量或标准正态离差称为标准正态变量或标准正态离差(standard normal

17、 deviate)。三、正态分布的概率计算三、正态分布的概率计算 (一)标准正态分布的概率计算(一)标准正态分布的概率计算 设设u服从标准正态分布,则服从标准正态分布,则 u 在在u1,u2)何内)何内取值的概率为:取值的概率为:(u2)(u1)(3-11)而而(u1)与与(u2)可由附表可由附表1查得。查得。222221111122212111()222uuuuuuuP uuuedueduedu 例如,例如,u=1.75,1.7放在第一列放在第一列0.05放在第一行。在附放在第一行。在附表表1中,中,1.7所在行与所在行与 0.05所在列相交处的数值为所在列相交处的数值为0.95994,即即

18、 (1.75)=0.95994 有时会遇到给定有时会遇到给定(u)值值,例如,例如(u)=0.284,反过来查,反过来查u值。这只要在附表值。这只要在附表1中找到与中找到与 0.284 最接近的值最接近的值0.2843,对,对应行的第一列数应行的第一列数-0.5,对应列的第一行数对应列的第一行数 值值 0.07,即相,即相应的应的u值为值为 u=-0.57,即,即 (-0.57)=0.284 如果要求更精确的如果要求更精确的u值,可用线性插值法计算。值,可用线性插值法计算。由由(3-11)式及正态分布的对称性可推出下列式及正态分布的对称性可推出下列关系式,关系式,再借助附表再借助附表1,便能很

19、方便地计算有便能很方便地计算有关概率:关概率:P(0uu1)(u1)-0.5 P(uu1)=(-u1)P(|u|u1)=2(-u1)(3-12)P(|u|u11-2(-u1)P(u1uu2)(u2)-(u1)【例例3.7】已知已知uN(0,1),试求:,试求:(1)P(u-1.64)?(2)P(u2.58)=?(3)P(|u|2.56)=?(4)P(0.34u1.53)=?利用利用(2-12)式,查附表式,查附表1得:得:(1)P(u-1.64)=0.05050 (2)P(u2.58)=(-2.58)=0.024940 (3)P(|u|2.56)=2(-2.56)=20.005234 =0.0

20、10468 (4)P(0.34u0(n)=(n-1)!,n为整整数(1/2)=1/2l特征数:lplp1/2l12/p1/2l26/p=1.5 123.6 中心极限定理中心极限定理:假设被研究的随机变量X,可以表示为许多相互独立的随机变量Xi的和。如果Xi的数量很大,而且每一个别Xi对于X所起的作用又很小,则X可以被认为服从或近似地服从正态分布。1.若随机变量x 服从正态分布,则统计量 也服从正态分布,且:x/xn2.若随机变量x服从平均数是,方差是2的分布(不是正态分布),当n相当大时,也逼近正态分布N(,2n)。xx这就是中心极限定理中心极限定理告诉我们:不论中心极限定理告诉我们:不论x变量是连续型还变量是连续型还是离散型,也无论是离散型,也无论x服从何种分布,一般只要服从何种分布,一般只要n30,就可认为,就可认为 的分布是正态的。若的分布是正态的。若x的分的分布不很偏倚,在布不很偏倚,在n20时,就近似于正态分布了。时,就近似于正态分布了。x

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(生物统计学:几种常见的概率分布律课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|