第三章-概率与概率分布-生物统计学讲义课件.ppt

上传人(卖家):晟晟文业 文档编号:5108087 上传时间:2023-02-12 格式:PPT 页数:92 大小:1.33MB
下载 相关 举报
第三章-概率与概率分布-生物统计学讲义课件.ppt_第1页
第1页 / 共92页
第三章-概率与概率分布-生物统计学讲义课件.ppt_第2页
第2页 / 共92页
第三章-概率与概率分布-生物统计学讲义课件.ppt_第3页
第3页 / 共92页
第三章-概率与概率分布-生物统计学讲义课件.ppt_第4页
第4页 / 共92页
第三章-概率与概率分布-生物统计学讲义课件.ppt_第5页
第5页 / 共92页
点击查看更多>>
资源描述

1、概 率概率分布与第三章第一节:概率基础知识一、概率的概念一、概率的概念二、概率的计算二、概率的计算三、概率的分布三、概率的分布四、大数定律四、大数定律一、概率基本概念(一)事件(一)事件定义:在一定条件下,某种事物出现与否定义:在一定条件下,某种事物出现与否就称为是事件。就称为是事件。自然界和社会生活上发生的现象是各自然界和社会生活上发生的现象是各种各样的,常见的有两类种各样的,常见的有两类:1、在一定条件下必然出现某种结果、在一定条件下必然出现某种结果或必然不出现某种结果。或必然不出现某种结果。2、在一定条件下可能发生也可能不、在一定条件下可能发生也可能不发生。发生。一、概率基本概念(二)频

2、率(二)频率(frequency)若在相同的条件下,进行了若在相同的条件下,进行了n次试验,在这次试验,在这n次试验中,事件次试验中,事件A出现的次数出现的次数m称为事件称为事件A出现的出现的频数,比值频数,比值m/n称为事件称为事件A出现的频率出现的频率(frequency),记为记为W(A)=m/n。一、概率基本概念 表表3-1 玉米种子发芽试验结果玉米种子发芽试验结果种子总数种子总数(n)10 20 50 100 200 500 1000发芽种子数发芽种子数(m)9 19 47 91 186 458 920种子发芽率种子发芽率(m/n)0.900 0.950 0.940 0.910 0.

3、930 0.918 0.920种子发芽与否是不能事先确定的,但从表中可以看出,种子发芽与否是不能事先确定的,但从表中可以看出,试验随着试验随着n值的不同,种子发芽率也不相同,当值的不同,种子发芽率也不相同,当n充分大充分大时,发芽率在时,发芽率在0.92附近摆动。附近摆动。例:例:一、概率基本概念频率表明了事件频繁出现的程度,因而其稳定性说频率表明了事件频繁出现的程度,因而其稳定性说明了随机事件发生的可能性大小,是其本身固有的明了随机事件发生的可能性大小,是其本身固有的客观属性,提示了隐藏在随机现象中的规律性。客观属性,提示了隐藏在随机现象中的规律性。概概 率率一、概率基本概念(三)概率(三)

4、概率(probability,P)概率的统计定义:设在相同的条件下,进行大量概率的统计定义:设在相同的条件下,进行大量重复试验,若事件重复试验,若事件A的频率稳定地在某一确定值的频率稳定地在某一确定值p的附近摆动,则称的附近摆动,则称p为事件为事件A出现的概率。出现的概率。P(A)=p P(A)=p=lim mnmn在一般情况下,随机事件的概率在一般情况下,随机事件的概率P是不可能准确得到是不可能准确得到的。通常以试验次数的。通常以试验次数n充分大时,随机事件充分大时,随机事件A的频率的频率作为该随机事件概率的作为该随机事件概率的近似值近似值。1 统计概率一、概率基本概念 抛掷一枚硬币发生正面

5、朝上的试验记录抛掷一枚硬币发生正面朝上的试验记录实验者实验者 投掷次数投掷次数 发生正面朝上的次数发生正面朝上的次数 频率频率(m/n)蒲丰蒲丰 4040 2048 0.5069K 皮尔逊皮尔逊 12000 6019 0.5016K 皮尔逊皮尔逊 24000 12012 0.5005随着实验次数的增多,正面朝上这个事件发生的频率稳定随着实验次数的增多,正面朝上这个事件发生的频率稳定接近接近0.5,我们称,我们称0.5作为这个事件的概率。作为这个事件的概率。2 古典概率古典概率一、概率基本概念一、概率基本概念对于某些随机事件,不用进行多次重复试验来确定其概对于某些随机事件,不用进行多次重复试验来

6、确定其概率,而是根据随机事件本身的特性直接计算其概率。率,而是根据随机事件本身的特性直接计算其概率。随随机机事事件件(1)试验的所有可能结果只有有限个,即样本试验的所有可能结果只有有限个,即样本空间中的基本事件只有有限个空间中的基本事件只有有限个;(2)各个试验的可能结果出现的可能性相等,各个试验的可能结果出现的可能性相等,即所有基本事件的发生是等可能的即所有基本事件的发生是等可能的;(3)试验的所有可能结果两两互不相容。试验的所有可能结果两两互不相容。2 古典概率古典概率一、概率基本概念一、概率基本概念具有上述特征的随机试验,称为古典概型(具有上述特征的随机试验,称为古典概型(classic

7、al model).设样本空间有设样本空间有n个等可能的基本事件所构成,其中事件个等可能的基本事件所构成,其中事件A包含包含有有m个基本事件,则事件个基本事件,则事件A的概率为的概率为m/n,即,即P(A)=m/n。古典概率古典概率(classical probability)先验概率先验概率(prior probability)一、概率基本概念一、概率基本概念12345678910随机抽取一个球,求下列事件的概率随机抽取一个球,求下列事件的概率;(1)事件事件A抽得一个编号抽得一个编号 4 (2)事件事件B=抽得一个编号是抽得一个编号是2的倍数的倍数 该试验样本空间由该试验样本空间由10个等

8、可能的基本事件构成,即个等可能的基本事件构成,即n=10,而事,而事件件A所包含的基本事件有所包含的基本事件有3个,即抽得编号为个,即抽得编号为1、2、3中的任何一中的任何一个,事件个,事件A便发生。便发生。P(A)=3/10=0.3P(B)=5/10=0.5一、概率基本概念一、概率基本概念12345678910A“一次取一个球,取得红球的概率一次取一个球,取得红球的概率”10个球中取一个球,其可能结果有个球中取一个球,其可能结果有10个基本事件(即每个球个基本事件(即每个球被取到的可能性是相等的),即被取到的可能性是相等的),即n=10事件事件A:取得红球,则:取得红球,则A事件包含事件包含

9、3个基本事件,即个基本事件,即m=3P(A)=3/10=0.3一、概率基本概念一、概率基本概念12345678910B“一次取一次取5个球,其中有个球,其中有2个红球的概率个红球的概率”10个球中任意取个球中任意取5个,其可能结果有个,其可能结果有C105个基本事件,即个基本事件,即n=C105事件事件B=5个球中有个球中有2个红球,则个红球,则B包含的基本事件数包含的基本事件数m=C32 C73P(B)=C32 C73/C105=0.417().AAP A 所含基本事件的测度的概率为所包含的基本事件的测度 几何概型考虑的是有无限多个等可能的基本事件的随机试验。3 几何概率几何概率 例例 2(

10、会面问题)甲、乙二人约定在 12 点到 5 点之间在某地会面,先到者等一个小时后即离去。设二人在这段时间内的各时刻到达是等可能的,且二人互不影响。求二人能会面的概率。解:解:以 X,Y 分别表示甲乙二人到达的时刻,于是 即 点 M 落在图中的阴影部分。所有的点构成一个正方形,即有无穷多个结果。由于每人在任一时刻到达都是等可能的,所以落在正方形内各点是等可能的。.50,50YXy54321.M(X,Y)0 1 2 3 4 5x二人会面的条件是:|,X Y 10 1 2 3 4 5yx54321.259254212252正方形的面积阴影部分的面积py-x=1y-x=-11P(A)01 )公理(公理

11、(且且的子集,的子集,的定义域是样本空间的定义域是样本空间若函数若函数)(AP 1)P(,0)(2 P)公理(公理(互不相容,则有互不相容,则有)公理(公理(.,.,A321nAA的概率。的概率。为事件为事件则称函数则称函数A)(AP.)(.)(.).(nnAPAPAAP114 概率的公理化概率的公理化定义定义1 和事件和事件事件事件A和事件和事件B中至少有一个发生而构成的新中至少有一个发生而构成的新事件称为事件事件称为事件A和事件和事件B的和事件,记作的和事件,记作A+B。n个事件的和,可表示为个事件的和,可表示为A1+A2+An二、概率的计算二、概率的计算2 积事件积事件事件事件A和事件和

12、事件B中同时发生而构成的新事件称中同时发生而构成的新事件称为事件为事件A和事件和事件B的积事件,记作的积事件,记作AB。n个事件的积,可表示为个事件的积,可表示为A1 A2 An3 互斥事件(互不相容事件)互斥事件(互不相容事件)事件事件A和事件和事件B不能同时发生,则称这两个事不能同时发生,则称这两个事件件A和和B互不相容或互斥。互不相容或互斥。n个事件两两互不相容,则称这个事件两两互不相容,则称这n个事件互斥。个事件互斥。4 对立事件对立事件事件事件A和事件和事件B必有一个发生,但不能同时发生,必有一个发生,但不能同时发生,且且A和和B的和事件组成整个样本空间,则称事件的和事件组成整个样本

13、空间,则称事件B为事件为事件A的对立事件。的对立事件。B=A5 独立事件独立事件事件事件A和事件和事件B的发生无关,事件的发生无关,事件B的发生与的发生与事件事件A的发生无关,则事件的发生无关,则事件A和事件和事件B为独立为独立事件。事件。6 完全事件系完全事件系如果多个事件如果多个事件A1、A2、A3、An两两互斥,两两互斥,且每次试验结果必然发生其一,则称事件且每次试验结果必然发生其一,则称事件A1、A2、A3、An为完全事件系。为完全事件系。完全事件系的和事件概率为,任何一个事完全事件系的和事件概率为,任何一个事件发生的概率为件发生的概率为1/n。即:。即:P(A1A2An)二、概率的计

14、算二、概率的计算(二)概率的计算法则(二)概率的计算法则1 互斥事件加法定理互斥事件加法定理定理定理:若事件若事件A与与B互斥,则互斥,则 P(A+B)=P(A)+P(B)试验的全部结果包含试验的全部结果包含n个基本事件,事件个基本事件,事件A包含其中包含其中m1个个基本事件,事件基本事件,事件B包含其中包含其中m2个基本事件。由于个基本事件。由于A和和B互斥,互斥,因而它们各包含的基本事件应该完全不同。所以事件因而它们各包含的基本事件应该完全不同。所以事件AB所所包含的基本事件数为包含的基本事件数为m1+m2。P(A+B)=m1+m2/n=m1/n+m2/n=P(A)+P(B)二、概率的计算

15、二、概率的计算1 互斥事件加法定理互斥事件加法定理推理推理1 P(A1+A2+An)=P(A1)+P(A2)+P(An)推理推理2 P(A)=1-P(A)推理推理3 完全事件系的和事件的概率为完全事件系的和事件的概率为1。二、概率的计算二、概率的计算1 互斥事件加法定理互斥事件加法定理例:玉米田中,一穗株(A)占67.2%,双穗株(B)占30.7%,空 穗株(C)占2.1%,试计算一穗株和双穗株的概率。P(A+B)=P(A)+P(B)=0.672+0.307=0.979因为P(A)+P(B)+P(C)=1 P(A+B)=1-P(C)=1-0.021=0.979或二、概率的计算2 独立事件乘法定

16、理独立事件乘法定理定理定理:事件事件A和事件和事件B为独立事件,则事件为独立事件,则事件A与事与事件件B同时发生的概率为各自概率的乘积。同时发生的概率为各自概率的乘积。P(AB)=P(A)P(B)推理:推理:A1、A2、An彼此独立,则彼此独立,则 P(A1A2A3An)=P(A1)P(A2)P(A3)P(An)二、概率的计算二、概率的计算2 独立事件乘法定理独立事件乘法定理例例:播种玉米,种子的发芽率为播种玉米,种子的发芽率为90%,每穴两粒,则:,每穴两粒,则:A:第一粒种子发芽,第一粒种子发芽,P(A)=0.9,P(A)=0.1B:第二粒种子发芽,第二粒种子发芽,P(B)=0.9,P(B

17、)=0.1C:两粒种子均发芽:两粒种子均发芽:C=AB,P(C)=P(A)P(B)=0.81D=AB+AB,P(D)0.9*0.1+0.1*0.9=0.18E:两粒种子均不发芽:两粒种子均不发芽:求:求:D:一粒种子发芽:一粒种子发芽:E=A B,P(E)P(A)P(B)=0.1*0.1=0.01(一)离散型变量的概率分布(一)离散型变量的概率分布对离散型变量对离散型变量x的一切可能值的一切可能值xi(i=1,2,3),及其及其对应的概率对应的概率piP(x=xi)=pi,i=1,2,3用随机变量的可能取值及取相应值的概率来表用随机变量的可能取值及取相应值的概率来表示随机试验的规律称为随机变量

18、的分布律或概率示随机试验的规律称为随机变量的分布律或概率函数。函数。三、概率分布三、概率分布概率分布特点概率分布特点Pi 0 (i=1,2,)1iPi=1 表3-1 离散型变量的概率分布变量(x)x1 x2 x3 x4 .xn概率(P)p1 p2 p3 p4 .pnP(x=xi)=pi,i=1,2,3设离散型变量x的所有一切可能值xi(i=1,2,3),取相应值的概率为pi,则P(x=xi)称为离散型随机变量x的概率函数。(二)连续型变量的概率分布(二)连续型变量的概率分布当试验资料为连续型变量,一般通过分组当试验资料为连续型变量,一般通过分组整理成频率分布表。如果从总体中抽取样本的整理成频率

19、分布表。如果从总体中抽取样本的容量容量n相当大,则频率分布就趋于稳定,我们将相当大,则频率分布就趋于稳定,我们将它近似地看成总体概率分布。它近似地看成总体概率分布。1、直方图中每一矩形的面积就表示该组的频率。、直方图中每一矩形的面积就表示该组的频率。2、当、当n无限大时,频率转化为概率,频率密度也转无限大时,频率转化为概率,频率密度也转化为概率密度,阶梯形曲线也就转化为一条光滑的化为概率密度,阶梯形曲线也就转化为一条光滑的连续曲线,此曲线为总体的概率密度曲线,曲线函连续曲线,此曲线为总体的概率密度曲线,曲线函数数f(x)称为概率密度函数。称为概率密度函数。三、概率分布对于一个连续型随机变量对于

20、一个连续型随机变量x,取值于区间,取值于区间a,b内的概内的概率为函数率为函数f(x)从从a到到b的积分,即:的积分,即:badxxfbxaP)()(连续型随机变量的概率由概率分布密度函数所确定。连续型随机变量的概率由概率分布密度函数所确定。ab(0)0)切比雪夫不等式切比雪夫不等式设随机变量X具有数学期望E(X)=,方差D(X)=2,则对于任意整数,有下列不等式成立:22XP或221XP四、大数定律四、大数定律证(只就连续性随机变量进行证明):设X的概率密度函数为f(x),则有XdxxfXP)(dxxfxx)(22dxxfx)()(12222(1)1)伯努里大数定律伯努里大数定律设m是n次独

21、立试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则对于任意的正数,有如下关系:pnm=1=1 lim Plim Pn提示:nppnmVarpnmE)1()(,)(),(pnbm意义:频率稳定于概率;适用于独立的二点分布(2 2)辛钦大数定律)辛钦大数定律设随机变量x1,x2,x3,xn相互独立,服从同一分布,且具有数学期望E(xk)=(k=1,2,),则对于任意正数,有:11lim1nkknXnP意义:提供了求随机变量数学期望E(X)的近似方法设对随机变量X独立重复地观察n次,第k次观察值为Xk,则X1,X2,Xn应该是相互独立的,且与X分布相同。所以,若E(X)存在,当n足够大

22、时niiXnXE11)(几种常见的理论分布几种常见的理论分布随机变量的概率分布 (probability distribution)离散型变量(discrete random variable)连续型变量(continuous random variable)二项分布泊松分布正态分布变量第二节:几种常见的理论分布离散型随机变量的分布哺乳动物种子生物个体雄性雌性发芽不发芽成活死亡对立事件一、二项分布一、二项分布设有一随机试验设有一随机试验,,这两种结果是,这两种结果是互不相容的,互不相容的,AA4321AAAA4321AAAA4321AAAA4321AAAA4321AAAA4321AAAA24C

23、4321AAAA4321AAAA4321AAAA1A2A3A4A242qp 由于试验是独立的,按由于试验是独立的,按概率的乘法法则概率的乘法法则,于是,于是有:有:P()=P()=P()=P()P()P()P()=其中其中Ax(x=1,2,3,4)表示第表示第x粒种子发芽,粒种子发芽,p为为种子发芽的概率;种子发芽的概率;(x=1,2,3,4)表示第表示第x粒种粒种子不发芽,子不发芽,q为种子不发芽的概率,所以为种子不发芽的概率,所以q=1-p。xA 又由于以上各种方式中,任何二种方式又由于以上各种方式中,任何二种方式都是互不相容的,按都是互不相容的,按概率的加法法则概率的加法法则,在,在4

24、粒粒种子中正好有种子中正好有2粒种子发芽的概率为:粒种子发芽的概率为:P4(2)=P()+P()+P()=4321AAAA4321AAAA4321AAAA24224qpC 一般,在一般,在n重贝努利试验中,事件重贝努利试验中,事件A恰好发生恰好发生x(0 xn)次的概率为次的概率为 x=0,1,2,nknkkknqpCkP)(若把上式与二项展开式若把上式与二项展开式相比较就可以发现,在相比较就可以发现,在n重贝努里试验中,事件重贝努里试验中,事件A发生发生x次的概率恰好等于展开式中的第次的概率恰好等于展开式中的第x+1项,所以把项,所以把P(x)称为随机变量称为随机变量x服从参数为服从参数为n

25、和和p的的二项分布二项分布(binomial distribution),也称为贝努里分布,记作,也称为贝努里分布,记作B(n,p)。这种。这种“非此即彼非此即彼”的事件所构成的总体称为的事件所构成的总体称为二项总体二项总体。nkknkknnqpCpq0)(二项总体试验只有两个对立结果,记为A和A,出现概率分别为p和q=1-p。重复性:每次试验条件不变时,事件A出现为恒定概率p;独立性:任何一次试验中事件A的出现与其余各次试验结果无关。一、二项分布二项分布的条件:二项分布的条件:例:某小麦品种在田间出现自然变异的概率为例:某小麦品种在田间出现自然变异的概率为0.0045,(1)调查调查100株

26、,获得两株或两株以上变异植株的概率是多少?株,获得两株或两株以上变异植株的概率是多少?(2)期望有期望有0.99的概率获得的概率获得1株或株或1株以上的变异植株,至少应株以上的变异植株,至少应调查多少株?调查多少株?n=100,p=0.0045P(k2)=1-P(0)-P(1)=0.07512)=1-P(0)-P(1)=0.0751 P(k1)=1-P(0)=0.991)=1-P(0)=0.99 nnnpppCP)1()1()0(00n=1021(株)株)n9955.0一、二项分布(三)二项分布的形状和参数(三)二项分布的形状和参数(1)(1)当当p p值较小且值较小且n n不大不大时,分布是

27、偏倚的。时,分布是偏倚的。随随n n的增大,分布趋于的增大,分布趋于对称;对称;二项分布的二项分布的形状形状由由n n和和p p两个参数决定。两个参数决定。B(n,p)B(n,p)一、二项分布(三)二项分布的形状和参数(三)二项分布的形状和参数(2 2)当)当p p值趋于值趋于0.50.5时,分布趋于对称。时,分布趋于对称。统计学证明,服从二项分布B(n,p)的随机变量所构成的总体的平均数、标准差与n、p这两个参数有关。一、二项分布(三)二项分布的形状和参数(三)二项分布的形状和参数n p)1(pnp泊松分布泊松分布(Poisson distribution)是一种可是一种可以用来描述和分析随

28、机地发生在单位空以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布,也间或时间里的稀有事件的概率分布,也是一种离散型随机变量的分布。是一种离散型随机变量的分布。泊松分布是二项分布的一种特殊类型。泊松分布是二项分布的一种特殊类型。二、泊松分布1)(kp为参数,为参数,=np=np,k=0,1,2,!)(kekPkp(k)Cnkpk(1-p)n-k n p 2 2=np(1-p)=np(1-p)=np=np=)1(pnp!)(kekPk泊松分布的概率函数泊松分布的概率函数可由二项分布概率可由二项分布概率函数推导出来函数推导出来knknnnknknkXP1)!(!lim)(knnnkn

29、knnnknnk1lim1lim)1(lim!kekxxxe11lim二、泊松分布二、泊松分布P()的形状由的形状由确定确定 较小时,泊松分布偏倚。较小时,泊松分布偏倚。增大时,泊松分布趋于对称。增大时,泊松分布趋于对称。无限增大时,泊松分布接近正态分布。无限增大时,泊松分布接近正态分布。二、泊松分布二、泊松分布对于小概率事件,可用泊松分布对于小概率事件,可用泊松分布描述其概率分布。描述其概率分布。二项分布当二项分布当p0.1和和np5时,可用时,可用泊松分布来近似。泊松分布来近似。21!)(kekPk例:某小麦品种在田间出现自然变异的概率为例:某小麦品种在田间出现自然变异的概率为0.0045

30、,(1)调查调查100株,获得两株或两株以上变异植株的概率株,获得两株或两株以上变异植株的概率是多少?是多少?45.00045.0100 npn=100,p=0.00456376.0!045.0)0(45.00eP2869.0!145.0)1(45.01eP0755.0)1()0(1)2(PPkP例:某良种猪场进行闭锁育种群仔猪畸形的调例:某良种猪场进行闭锁育种群仔猪畸形的调查,共记录查,共记录200窝,每窝畸形仔猪为窝,每窝畸形仔猪为0,1,2,3,4只只的窝数分别为的窝数分别为120,62,15,2,1.试计算畸形仔猪数试计算畸形仔猪数为为5的概率。的概率。51.0200413221516

31、2012000017.0!551.0)5(551.0eP三、正态分布三、正态分布(一)正态分布(一)正态分布)(2)(21)(22xxexff(x)为正态分布的概率密度函数,表示某一定为正态分布的概率密度函数,表示某一定x值出现的概率密度函数值。通常记为值出现的概率密度函数值。通常记为N(,)总体平均数总体平均数总体标准差总体标准差圆周率圆周率e为自然对数底数为自然对数底数正态分布曲线由参数正态分布曲线由参数,决定,决定,确定正态分确定正态分布曲线在布曲线在x轴上的中心位置,轴上的中心位置,确定正态分布确定正态分布的变异度。的变异度。三、正态分布三、正态分布(二)正态分布的特征(二)正态分布的

32、特征三、正态分布三、正态分布)()(21)(222xxxfe若一个连续型随机若一个连续型随机变量变量x取值于区间取值于区间a,b,其概率为,其概率为badxxfbxaP)()(ab)1,0(),(2NXZNX,则若xXPxXPxZP证:xtdte222)(21,得令tuxuxduexZP)(2122且相互独立若),2,1(),(2niNXiii仍然服从正态分布则niiXZ1),(121niiniiNZ且三、正态分布三、正态分布(四)正态分布的概率计算(四)正态分布的概率计算一般正态分布的概率计算一般正态分布的概率计算服从正态分布服从正态分布N(,N(,2 2)的随机变量,的随机变量,x x的的

33、取值落在区间取值落在区间xx1 1,x,x2 2 的概率,记作的概率,记作P(xP(x1 1xxxx2 2),等于服从标准正态分布的,等于服从标准正态分布的随机变量随机变量u u在在(x(x1 1-)/,(x-)/,(x2 2-)/-)/内取值的概率。内取值的概率。)()()(2121121uuuPxxxPxxxP三、正态分布三、正态分布21222)(2121)(xxxdxexxxPxududx)()(211221212uFuFdueuuu三、正态分布三、正态分布P(-1u1)=0.6826u1)=0.6826P(-2u2)=0.9545u2)=0.9545P(-3u3)=0.9973u3)=

34、0.9973P(-1.96u1.96)=0.95u1.96)=0.95P(-2.58u2.58)=0.99u2.58)=0.99标准正态分布的概率计算标准正态分布的概率计算三、正态分布三、正态分布P(-x+)P(-x+)P(-2x+2)P(-2x+2)P(-3x+3)P(-330时,卡方分布已接近正态分布。时,卡方分布已接近正态分布。67 ,),(),1,0(2称随机变量称随机变量独立,则独立,则YXnYNX,称称满满足足条条件件:对对于于给给定定的的)10()(nt)(1nt ).(ntttn分分布布,记记作作的的是是所所服服从从的的分分布布为为自自由由度度 nYXt (七)t分布()tn(

35、)P ttn 的为()t n分布的 分位数t分布是英国统计学家分布是英国统计学家Gosset 1908年以笔名年以笔名“student”所发表的论文提出的,因此又称为所发表的论文提出的,因此又称为学生氏学生氏t分布。分布。212)1()2()21()(nntnnntft分布概率密度函数分布概率密度函数t分布的平均数分布的平均数t t和方差和方差t t2 2)1(0nt)2(22nnnt()()t分布曲线是左右对称的,围绕平均数分布曲线是左右对称的,围绕平均数t =0 向两侧递降。向两侧递降。(2)t分布受自由度制约,每个自由度都有一条分布受自由度制约,每个自由度都有一条t分布曲线。分布曲线。(

36、3)和正态分布相比,)和正态分布相比,t分布顶端偏低,尾部偏高,分布顶端偏低,尾部偏高,自由度自由度df30时,其曲线接近正态分布曲线,时,其曲线接近正态分布曲线,n时则和正态分布曲线重合。时则和正态分布曲线重合。),(21nnFF若若称称随随机机变变量量则则 独立,独立,若若YXnYnX,),(),(2212 ).,(,2121nnFFFnn分分布布,记记作作的的是是 21/nYnXF 所所服服从从的的分分布布为为自自由由度度定理:).,(/112nnFF则则(八)F分布221122221212121121)()2()2()2()(nnnnnnFnFnnnnnnFf分布的平均数分布的平均数F

37、 F=1=1,的取值区间为,的取值区间为0,+0,+)分布曲线的形状仅决定于分布曲线的形状仅决定于n n1 1和和n n2 2。在。在n n1 11 1或或2 2时,时,分布曲线呈严重倾斜的反向型,当分布曲线呈严重倾斜的反向型,当n n1 1 3 3时,转时,转为左偏曲线。为左偏曲线。12统计数的分布统计数的分布 根据样本对总体做出估计和推断,并不是根据样本对总体做出估计和推断,并不是直接用样本本身,而是用样本的统计量来对总直接用样本本身,而是用样本的统计量来对总体做出估计和判断。但由于从总体中抽取的样体做出估计和判断。但由于从总体中抽取的样本提供的信息仅是总体的一部分,因此它不能本提供的信息

38、仅是总体的一部分,因此它不能提供完全准确的信息,必然存在着一定的误差。提供完全准确的信息,必然存在着一定的误差。即,对于样本容量相同的多次随机抽样,得到即,对于样本容量相同的多次随机抽样,得到样本函数的观察值也是不同的,且其取值有一样本函数的观察值也是不同的,且其取值有一定的概率,即统计量也是一个随机变量,因而定的概率,即统计量也是一个随机变量,因而也有它的分布,称为抽样分布也有它的分布,称为抽样分布(sampling distribution)。一、抽样试验与无偏估计现有一N=3的近似正态总体,具有变量3,4,5,可以求出=4,20.6667,0.8165。现以n=2作独立的有放回式抽样。一

39、、抽样试验与无偏估计一、抽样试验与无偏估计总共可得到Nn329个样本样本编号 样本值 x s2 s 1 3,3 3.0 0.0 0.0000 2 3,4 3.5 0.5 0.7071 3 3,5 4.0 2.0 1.4142 4 4,3 3.5 0.5 0.7071 5 4,4 4.0 0.0 0.0000 6 4,5 4.5 0.5 0.7071 7 5,3 4.0 2.0 1.4142 8 5,4 4.5 0.5 0.7071 9 5,5 5.0 0.0 0.0000 36.0 6.0 5.6568 平均 4.0 0.6667 0.6258 x22ss=4=4 20.6667 0.8165

40、x22ss如果所有可能样本的某一统计数的平均数等于总体的相如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的应参数,则称该统计数为总体相应参数的无偏估计值无偏估计值。样本平均数是总体平均数样本平均数是总体平均数的无偏估计值。的无偏估计值。样本方差是总体方差的无偏估计值。样本方差是总体方差的无偏估计值。样本标准差样本标准差s不是总体标准差不是总体标准差的无偏估计值。的无偏估计值。一、抽样试验与无偏估计 由于从总体中抽出的样本为每一个可能样本,且由于从总体中抽出的样本为每一个可能样本,且每个样本中的变量均为随机变量,所以其样本平均数每个样本中的变量均为随机变量,所

41、以其样本平均数也为随机变量,也形成一定的理论分布,这种理论分也为随机变量,也形成一定的理论分布,这种理论分布称为样本平均数的概率分布,或称样本平均数的分布称为样本平均数的概率分布,或称样本平均数的分布。布。样本平均数的平均数:样本平均数的平均数:样本平均数的方差:样本平均数的方差:x2x二、样本平均数的分布(1)样本平均数分布的平均数总体平均数。)样本平均数分布的平均数总体平均数。x(2)样本平均数分布的方差总体方差除以样本容量。)样本平均数分布的方差总体方差除以样本容量。nx22(3)如果从正态分布总体)如果从正态分布总体N(,2 2)进行抽样,其样本平均数进行抽样,其样本平均数x是一具有平

42、是一具有平均数均数,方差方差2 2/n/n的的正态分布,记作正态分布,记作N(,2 2/n/n)。中心极限定理中心极限定理(central limit theorem)(4)设随机变量)设随机变量 相互独立,相互独立,服从同一分布,且具有数学期望和方差:服从同一分布,且具有数学期望和方差:那么当那么当n充分大时,随机变量充分大时,随机变量 近似近似服从正态分布服从正态分布,21nXXX),2,1(0)(,)(2kXDXEkk),(2nNnXXnkk1(李雅普诺夫(李雅普诺夫(Liapunov)定理)定理)设随机变量设随机变量 相互独立,它们相互独立,它们具有数学期望和方差:具有数学期望和方差:

43、,21nXXX),2,1(0)(,)(2kXDXEkk时,使得当,若存在正数记nBnkkn,122nkkknXEB122,01的标准化变量:则随机变量之和nkkX1)1,0()()(11111NBXXDXEXZnnkknkknkknkknkkn近似不论总体为何种分布,只要是大样本,不论总体为何种分布,只要是大样本,并且并且样本之间相互独立样本之间相互独立,就可运用中心,就可运用中心极限定理,认为样本平均数的分布是正极限定理,认为样本平均数的分布是正态分布,在计算样本平均数出现的概率态分布,在计算样本平均数出现的概率时,样本平均数可按下式进行标准化。时,样本平均数可按下式进行标准化。nxxuxx

44、/(1)样本平均数差数的平均数样本平均数差数的平均数=总体平均数的差数总体平均数的差数.212121xxxx(2)样本平均数差数的方差样本平均数差数的方差=两样本平均数方差之和两样本平均数方差之和.2222212122121xxxxnn22212121nnxx样本平均数差数的标准误样本平均数差数的标准误222121221nnxx)11(212221nnxxnxx2221221nxx222211 12 2=2 22 2=n n1 1=n=n2 2=n=n 1 12 2=2 22 2=n n1 1=n=n2 2=n=n (3)从两个独立正态分布总体中抽出的样本平均数差从两个独立正态分布总体中抽出的

45、样本平均数差数的分布数的分布,也是正态分布。也是正态分布。),(22121xxN一个正态总体的常用统计量及其分布),(,221NXXXXn是来自正态总体设2SX和样本方差分别为的样本,其样本均值和结论1).,(nNXnXnii211结论2),1()1(222nSn统计量.2相互独立与且XS结论3).1(ntnSX统计量两个正态总体的常用统计量及其分布两个正态总体的常用统计量及其分布分别是来自与设21,2121nnYYYXXX的样本和正态总体),(),(222211NNX本均值,分别是这两个样本的样和设YX本方差,分别是这两个样本的样和22YXSS结论4).,()()(10222121NmnYX统统计计量量结论5)1,1(21222212nnFSSYX统计量结论6,当当22221).2(11)()(2121nntmnSYXW统计量2)1()1(2122212nnSnSnSYXw其中

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第三章-概率与概率分布-生物统计学讲义课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|