第四章概率分布《试验设计与统计分析》PPT课件.ppt

上传人(卖家):三亚风情 文档编号:2781035 上传时间:2022-05-25 格式:PPT 页数:102 大小:1.56MB
下载 相关 举报
第四章概率分布《试验设计与统计分析》PPT课件.ppt_第1页
第1页 / 共102页
第四章概率分布《试验设计与统计分析》PPT课件.ppt_第2页
第2页 / 共102页
第四章概率分布《试验设计与统计分析》PPT课件.ppt_第3页
第3页 / 共102页
第四章概率分布《试验设计与统计分析》PPT课件.ppt_第4页
第4页 / 共102页
第四章概率分布《试验设计与统计分析》PPT课件.ppt_第5页
第5页 / 共102页
点击查看更多>>
资源描述

1、第四章第四章 概率分布概率分布 在自然界或人类社会中发生的各种现象通常可划分为两类:在自然界或人类社会中发生的各种现象通常可划分为两类: 确定性现象(确定性现象(definite phenomena)一定条件下必然一定条件下必然发生的现象;发生的现象; 随机现象(随机现象(random phenomena)一定条件下可能发一定条件下可能发生、但结果不止一个、哪个结果发生预先并不知道的。比生、但结果不止一个、哪个结果发生预先并不知道的。比如,抛掷一枚硬币如,抛掷一枚硬币. 随机现象的统计规律随机现象的统计规律随机现象虽然表现为不确定性,随机现象虽然表现为不确定性,但在大量重复试验观测下,其结果会

2、呈现出某种特定的规但在大量重复试验观测下,其结果会呈现出某种特定的规律,称作律,称作随机现象的统计规律随机现象的统计规律。如。如:掷一枚硬币,正面掷一枚硬币,正面朝上的频率接近朝上的频率接近0.5。 概率分布就是描述随机现象的统计规律。概率分布就是描述随机现象的统计规律。 本章主要介绍:本章主要介绍:事件和概率事件和概率 二项分布和泊松分布二项分布和泊松分布 正态分布正态分布 抽样分布抽样分布 第一节第一节 事件和概率事件和概率 一、事件一、事件 1、随机试验、随机试验 满足下述三个条件的试验称为随机试验(满足下述三个条件的试验称为随机试验(random experiment):): 试验可在

3、相同条件下重复进行;试验可在相同条件下重复进行; 试验的所有可能结果是明确可知的,并且不止一个;试验的所有可能结果是明确可知的,并且不止一个; 每次试验总是恰好出现这些可能结果中的一个,但在每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。试验之前却不能肯定会出现哪一个结果。 在统计学里随机试验可在统计学里随机试验可简称为试验简称为试验。 2、事件、事件 (event)试验中所观察到的结果。试验中所观察到的结果。 3、 基本事件基本事件 随机试验的每一个可能随机试验的每一个可能结果结果,称为基本事件(,称为基本事件(elementary event)或简单事件(

4、)或简单事件(simple event),不可再分。),不可再分。 4、复合事件、复合事件 由若干个基本事件组合而成的事件,称复合事件由若干个基本事件组合而成的事件,称复合事件(compound event),也称作复杂事件),也称作复杂事件 5、必然事件、必然事件每次试验中一定发生的结果称作必然每次试验中一定发生的结果称作必然事件(事件(certain event) ,用,用表示。表示。 6、不可能性事件、不可能性事件在任何一次试验中都不可能发在任何一次试验中都不可能发生的结果称作不可能事件(生的结果称作不可能事件(impossible event)。用)。用表示。表示。 7、随机事件、随机

5、事件每次试验中可能发生也可能不发生的每次试验中可能发生也可能不发生的结果称作随机事件(结果称作随机事件(random event)。用)。用A、B、C等表示。等表示。根据复杂性分根据复杂性分根据发生的可能性分根据发生的可能性分二、二、 事件之间的关系和运算事件之间的关系和运算 1、包含、包含 若事件若事件A的发生必导致事件的发生必导致事件B发生,则称事件发生,则称事件B包包含事件含事件A, 。 2、相等、相等 则称事件则称事件A等于事件等于事件B,记作,记作A=B。 3、和、和 若事件若事件A与事件与事件B至少一个发生某事件就发生,则至少一个发生某事件就发生,则某事件称作某事件称作A与与B的和

6、事件,简称为和,记作的和事件,简称为和,记作 (读作读作A并并B),或),或A+B(读作(读作A加加B)。)。ABBA 或或记记作作:BAABBA 且且若若 推广到推广到n个事件的和:个事件的和: 4、积、积 若事件若事件A与事件与事件B同时发生某事件才发生,同时发生某事件才发生,则称某事件为则称某事件为A与与B的积事件,简称为积,的积事件,简称为积,记作记作 ,读作读作A交交B)或)或AB(读作(读作A乘乘B)。)。 推广到个推广到个n个事件的积:个事件的积: 中中至至少少有有一一个个发发生生nnniiAAAAAAA,21211 BA 同同时时发发生生nnniiAAAAAAA,21211 5

7、、差、差 称事件称事件A发生但事件发生但事件B不发生的事件为不发生的事件为A减减B的的差事件,简称为差,记为差事件,简称为差,记为A-B。 6、互斥、互斥 若事件若事件A与事件与事件B不能同时发生,则称不能同时发生,则称A与与B互互斥或互不相容。互斥包括非此即彼的情形,但斥或互不相容。互斥包括非此即彼的情形,但互斥不一定是非此即彼,事件关系满互斥不一定是非此即彼,事件关系满足足 。 7、对立、对立 称事件称事件A不发生就发生的事件为不发生就发生的事件为A的对立事件,的对立事件,记为记为 。事件的发生非此即彼,显然。事件的发生非此即彼,显然 BAA BAAA; 8、独立、独立 若事件若事件A发生

8、的概率不影响事件发生的概率不影响事件B发生的概率,则发生的概率,则称事件称事件A与事件与事件B相互独立,反之亦然,相互独立,反之亦然,A与与B是是一对彼此独立的事件。一对彼此独立的事件。 注意独立与互斥、对立的区别,互斥指两事件不注意独立与互斥、对立的区别,互斥指两事件不能同时发生,满足能同时发生,满足 ;独立指一事件发生;独立指一事件发生的概率与另一事件发生的概率无关的概率与另一事件发生的概率无关 ,对立事件互斥但不独立,因为它们满足对立事件互斥但不独立,因为它们满足 9、完备事件系、完备事件系若若n个个A1、 A2、 An事件两两互斥,且满足下式:事件两两互斥,且满足下式: BABA和和

9、BA 12121 nnAPAPAPAAAP BA 则称该个事件为一个完备事件系。注意,概率之则称该个事件为一个完备事件系。注意,概率之和等于和等于1并且两两互斥的事件系才是完备事件系,并且两两互斥的事件系才是完备事件系,两个条件缺一不可。两个条件缺一不可。 例例4.1用用“集合图集合图”描述事件之间的关系和运描述事件之间的关系和运算,并理解和掌握它们的实际意义。算,并理解和掌握它们的实际意义。 图图4.1 事件之间的关系和运算事件之间的关系和运算ABA=(A-B)+ABB=(B-A)+ABB-AA-BA+BAABB三、三、 概率概率 用于度量事件发生用于度量事件发生可能性可能性大小的数值称大小

10、的数值称作事件的概率(作事件的概率(probability)。通常用)。通常用P(A)、 P(B)等表示。事件的概率具有下等表示。事件的概率具有下述性质:述性质: 设设A为任一事件,则为任一事件,则0 P(A) 1; 必然事件的概率为必然事件的概率为1,P( )=1 ; 不可能事件的概率为不可能事件的概率为0,P( )=0 。 2、概率的统计定义、概率的统计定义 若在相同条件下将试验重复若在相同条件下将试验重复n 次,且事件次,且事件A出现了出现了nA次,次,则事件的则事件的频率(频率(frequency)定义为定义为 如果随着试验重复次数如果随着试验重复次数n的增大,事件的增大,事件A的频率

11、越来越稳的频率越来越稳定地在某一常数附近摆动,则称常数为事件定地在某一常数附近摆动,则称常数为事件A的的概率概率(probability),),即即 这就是这就是统计意义上的概率统计意义上的概率定义定义(statistical probability)。 历史上曾有几个著名的抛一枚均质硬币试验历史上曾有几个著名的抛一枚均质硬币试验 (见教材见教材) 许多情况下许多情况下p很难准确获得。通常以很难准确获得。通常以n充分大时事件充分大时事件A出现出现的频率作为它的概率的估计值,即:的频率作为它的概率的估计值,即:nnAfAn )(pnnAPAn lim)(nnpA 四、四、 概率计算法则概率计算法

12、则 1、对立事件和互斥事件的加法公式、对立事件和互斥事件的加法公式 若若A和和 为对立事件:为对立事件: 若若A和和B为互斥事件:为互斥事件:P(A+B) = P(A)+ P(B) 2、独立事件的乘法、独立事件的乘法若若A、B为相互独立事件:为相互独立事件: P(AB) = P(B)P(A) 若若A1、 A2、 An为独立事件系:为独立事件系: P(A1、 A2、 An) =P(A1)( A2) P(An)A APAPAPAPAAP 11于是于是第二节第二节 随机变量及其分布随机变量及其分布 一、一、 随机变量随机变量 在随机试验中,被测定的量是可取不同值的变在随机试验中,被测定的量是可取不同

13、值的变量,且其取值具有随机性,这样的变量称为随机量,且其取值具有随机性,这样的变量称为随机变量,用变量,用X表示。表示。 X的某次取值记作小写的的某次取值记作小写的x,此,此时就称时就称X作作随机变量(随机变量(random variable),),就称就称x作随机变量的一个作随机变量的一个观察值(观察值(observed value)或或简称简称观测(观测(observation)。 间断性(间断性(internal variable )或)或称为离散称为离散 (discrete variable)随机变量随机变量如果随机变数如果随机变数只有有限个可能的取值,并在试验中以确定的概只有有限个可

14、能的取值,并在试验中以确定的概率来取这些数值,就称它为率来取这些数值,就称它为间断性间断性(或或离散离散)随机随机变量变量 。质量性状和计数的数量性状的试验结果常。质量性状和计数的数量性状的试验结果常常是间断性随机变量。常是间断性随机变量。 连续性随机变量(连续性随机变量(continuous variable )如如果随机变数可能的取值充满一个区间,并且试验果随机变数可能的取值充满一个区间,并且试验结果落在任意区间内的概率是确定的,就称它为结果落在任意区间内的概率是确定的,就称它为连续性随机变量连续性随机变量。计量性状的试验结果通常是连。计量性状的试验结果通常是连续性随机变量。续性随机变量。

15、 二、二、 随机变量的概率分布随机变量的概率分布 随机变数可能的取值或取值区间的概率反映了随机变数的统随机变数可能的取值或取值区间的概率反映了随机变数的统计规律性,称为计规律性,称为概率分布概率分布。 1、离散、离散(间断性间断性)随机变量的概率分布随机变量的概率分布 所谓离散随机变量的概率分布,就是指概率函数所谓离散随机变量的概率分布,就是指概率函数f(x)和分布和分布函数函数F(x)两个基本函数,它们提供了概率分布规律的完整信两个基本函数,它们提供了概率分布规律的完整信息。息。 概率函数概率函数(probability function) f(x) 设随机变数设随机变数X可能的取值为可能的

16、取值为x1,x2,xk,每个取值对应,每个取值对应的概率的概率P(Xxi)为为p1,p2,pk, 为离散为离散(间断性间断性)随机变量的随机变量的概率函数概率函数iiipxXPxf )()(表表4.1 间断性随机变量的概率分布列间断性随机变量的概率分布列Xix1x2xkf(x)=P(Xxi)p1p2pkF(xi)p1p1p21分布函数分布函数(cumulative distribution function)F(x) 为分布函数亦称作为分布函数亦称作概率累积函数概率累积函数间断性随机变量一般用概率分布列来表示这种规律性。间断性随机变量一般用概率分布列来表示这种规律性。其概率分布列见表其概率分布

17、列见表4.1。 ikkikkiixfpxXPxF11)()()( 例例4.2转基因桑树植株抗病性检验(邱健转基因桑树植株抗病性检验(邱健德,德,2006),参试植株分两组,即转基因组和),参试植株分两组,即转基因组和一般桑树组,将病级分为一般桑树组,将病级分为,级,级,观测发病的植株数。由于观测数量足够多,故观测发病的植株数。由于观测数量足够多,故发病的概率近似等于频率,试以此概率为基础发病的概率近似等于频率,试以此概率为基础求解随机变量的概率函数和分布函数。求解随机变量的概率函数和分布函数。表表4.2 桑树植株发病级的概率函数和分布函数桑树植株发病级的概率函数和分布函数病级观察值病级观察值x

18、 012345合计合计f1(x)10/2320/6910/69 5/69 1/230 1/691F1(x)10/2350/6920/2365/6968/691f2(x)25/32 1/83/64 1/32 1/6401F2(x)25/3229/3261/6463/64112、连续随机变量的分布、连续随机变量的分布 连续性随机变量一般用连续性随机变量一般用分布函数分布函数F(x)和和概率密度函数概率密度函数f(x) 来来表示其概率分布规律表示其概率分布规律 分布函数分布函数(概率累积函数概率累积函数) F(X)若若X为一连续随机变量,为一连续随机变量, x (-,+)为任意实数,则为任意实数,则

19、X的分布函数或的分布函数或概率累积函数为:概率累积函数为:F(X)=P(Xx) 分布函数分布函数F(x)的直观意义就是随机点的直观意义就是随机点X落在区间落在区间(-,x上上的概率。的概率。概率密度函数概率密度函数f(x) 如果存在非负函数如果存在非负函数f(x) ,使,使则称则称f(x)为连续随机变量的概率为连续随机变量的概率密度密度函数,简称函数,简称概率密度概率密度(probability density),亦称密度函数(),亦称密度函数(density function)或)或分布密度(分布密度(distribution density)。)。 xdttfxF)()(图图4.2 连续随

20、机变量的连续随机变量的 概率密度曲线概率密度曲线图图4.3 连续随机变量的连续随机变量的 分布函数曲线分布函数曲线)()()()(xfxFdttfxFx 连续随机变量在给定区间取值的概率连续随机变量在给定区间取值的概率 对于连续随机变量对于连续随机变量x,若已知它的分布函数,若已知它的分布函数F(X),则则x的观察值属于任一区间的观察值属于任一区间(x1,x2的概率可由下的概率可由下式求得:式求得:)()()()()(121221xFxFxXPxXPxXxP 1、大数定律、大数定律 相同条件下大量重复的试验,事件发生的频率相同条件下大量重复的试验,事件发生的频率随试验次数的无限增大而趋于事件的

21、概率,这是随试验次数的无限增大而趋于事件的概率,这是最早的一个大数定律(最早的一个大数定律(law of large number)。)。一般的大数定律,研究随机变量一般的大数定律,研究随机变量n次观测的次观测的平均平均数数随随n无限增大是否趋向某定值的问题,称作无限增大是否趋向某定值的问题,称作平平均数的稳定性均数的稳定性。如果。如果“n无限增大平均数就趋于无限增大平均数就趋于一个定值一个定值”,此时称平均数具有稳定性。,此时称平均数具有稳定性。 三、大数定律及小概率事件原理三、大数定律及小概率事件原理 大数定律是许多统计方法赖以成立的理论依大数定律是许多统计方法赖以成立的理论依据。据。 称

22、其为统计估计。称其为统计估计。“大数大数”就是所谓的就是所谓的“足足够多够多”。 频频 率率样本平均数样本平均数样本均方样本均方足够多的独立重复试验足够多的独立重复试验大数定律大数定律概率概率期望期望方差方差2、小概率事件原理、小概率事件原理 依据大数定律,概率很小的事件其频率也很依据大数定律,概率很小的事件其频率也很小,若只做一次试验,该事件小,若只做一次试验,该事件实际上实际上应当不会发应当不会发生。因此,人们常常认为那些概率很小的事件生。因此,人们常常认为那些概率很小的事件实实际上际上是不可能发生的,此原理称之为是不可能发生的,此原理称之为“小概率事小概率事件的实际不可能原理件的实际不可

23、能原理”,简称作,简称作“小概率事件原小概率事件原理理” .一般认为概率小于一般认为概率小于0.05或小于或小于0.01的事件为的事件为小概率事件,小概率事件,0.05和和0.01称为小概率事件的临界概称为小概率事件的临界概率率。对于其它特殊场合,规定的临界概率值可根。对于其它特殊场合,规定的临界概率值可根据事件的性质合理确定。据事件的性质合理确定。 第三节第三节 二项分布和泊松分布二项分布和泊松分布 一、一、 0-1分布分布(二项总体分布二项总体分布) 有些总体的各个个体的某种性状,只能发生非此即有些总体的各个个体的某种性状,只能发生非此即彼两种结果,彼两种结果,“此此”和和“彼彼”是对立事

24、件,如,种是对立事件,如,种子的发芽和不发芽等,这种由非此即彼事件构成的子的发芽和不发芽等,这种由非此即彼事件构成的总体,叫做二项总体。总体,叫做二项总体。 为便为便 于研究,将这类的试验结果数量化,于研究,将这类的试验结果数量化,“此此”事件设为事件设为1,具概率,具概率p ,“彼彼”事件设为事件设为0,具概率具概率q,因而,二项总体又称为,因而,二项总体又称为0-1总体,其概率总体,其概率关系显然为:关系显然为: p + q = 1 q = 1 p 表表4.3 二项总体的概率分布列二项总体的概率分布列 (0-1分布分布)xP(X=x)P(Xx)01q=1ppqp+q=1m m = p, s

25、 s2 2 = pq图图4.4 0-1分布的概率函数分布的概率函数观察值观察值(x)概率函数概率函数f(x)1.例例4.3以某试验地的以某试验地的5株蔬菜为总体调查蚜虫株蔬菜为总体调查蚜虫为害情况。令为害情况。令x1代表受害,代表受害,x0代表未受害,代表未受害,5株的观察结果为株的观察结果为0,1,0,1,0。试求危害率的。试求危害率的数学期望数学期望m m和方差和方差s s2 2。说明该试验地蚜虫的平均危害率为说明该试验地蚜虫的平均危害率为0.4,危害率,危害率变异的方差为变异的方差为0.24。此例也说明了二项总体的平。此例也说明了二项总体的平均数为均数为m m = p,方差为,方差为 s

26、 s2 2 = pq24. 05)4 . 00()4 . 01()4 . 00()4 . 01()4 . 00(4 . 0501010222222 s sm m 二、二项分布二、二项分布 从二项总体中,每次以样本容量从二项总体中,每次以样本容量n抽样,将抽样,将会有会有n+1种可能的结果,这种可能的结果,这n+1种可能的结种可能的结果有它各自的概率而组成一种分布,就叫果有它各自的概率而组成一种分布,就叫二项概率分布,简称二项分布(二项概率分布,简称二项分布(binomial distribution) 。又称贝努利分布。又称贝努利分布 。x3225)2(qpcf xnxxnqpcxf )(50

27、05)0(qpcf 4115)1(qpcf 1)4(445qpcf 0555)5(qpcf 2335)3(qpcf 0 1 0 11 1 0 0 1 0 1 0 1 0 1 0 0 0 1 0 1 0 1 00 1 0 1 1 0 01 1 01 0 0 0 0 1 0 1 1 0 1 0 1 1 1 0 1 00000000011000000011110000011111100011111111011111以以n=5抽样,有抽样,有6种可能的种可能的结果结果(即:变量即:变量X有有6种可种可能的取值能的取值)二项总体二项总体(0-1)总体总体这这6种可能的结果有它各自的概率而组成一种分布就种

28、可能的结果有它各自的概率而组成一种分布就叫二项概率分布,简称叫二项概率分布,简称二项分布二项分布(binomial distribution) 。又称贝努利分布。又称贝努利分布 。012345v二项展开式二项展开式 464)(33)(2)()(432234432233222011100pqpqppqqqppqppqqqpppqqqpqpCqpCqpCqpCqpnnnxnxxnnnnnn 如:如:三、计算二项分布概率的方法三、计算二项分布概率的方法 例例4.4在一批发芽率为在一批发芽率为0.9的种子里取的种子里取5粒进行粒进行发芽试验。以发芽试验。以x为发芽粒数,试做出试验结果为发芽粒数,试做出

29、试验结果X的概的概率分布列。率分布列。表表4.4 种子发芽试验的概率分布列种子发芽试验的概率分布列xP(x=x)P(xx)01234510.900.1550.910.14100.920.13100.930.1250.940.1110.950.110.000010.000450.008100.072900.328050.590490.000010.000460.008560.081460.409511.0000 xnxxnqpc v四、二项分布的形状和参数四、二项分布的形状和参数u图图4.5表示表表示表4.4的概率分布列。这是一个偏的概率分布列。这是一个偏态的概率分布,因为其态的概率分布,因为其

30、pq且且n较小。较小。u如果如果pq则二项分布是对称的,见图则二项分布是对称的,见图4.6。u理论分析和实践结果都表明当理论分析和实践结果都表明当n很大时,即很大时,即使使pq的二项分布其图形也接近对称,见图的二项分布其图形也接近对称,见图4.7。 图图4.5 表表4.4的概率分布图的概率分布图图图4.6 p=q=0.5, n= 5的二项分布图示的二项分布图示图图4.7 p=0.4,q=0.6, n= 20的二项分布图示的二项分布图示例例4.5 某玉米种子发芽率为某玉米种子发芽率为0.6,今按设计株距穴播,今按设计株距穴播,若每穴播若每穴播4粒,预计田间保苗率是多少?粒,预计田间保苗率是多少?

31、 首先考虑,这里的田间保苗率实际上是首先考虑,这里的田间保苗率实际上是每穴有种每穴有种子发芽子发芽的概率,这是一个的概率,这是一个和事件和事件,可计算为,可计算为可知此时,田间预计保苗率为可知此时,田间预计保苗率为97.44% 9744. 04 . 06 . 01)0(1)4()3()2()1()(04004 cfffffP 一一穴穴中中有有种种子子发发芽芽v例例4.6在已往大规模田间播种作业中,在已往大规模田间播种作业中,已观测到种子的出苗概率为已观测到种子的出苗概率为0.6。若每穴若每穴播播1010粒,粒,试确定播种作业的穴粒数分布,试确定播种作业的穴粒数分布,求出在此出苗概率求出在此出苗

32、概率(0.6)下,田间保苗率下,田间保苗率95%的最少穴粒数。的最少穴粒数。v解:设出苗种子数解:设出苗种子数X为随机变量,服从二项为随机变量,服从二项分布。其概率函数为分布。其概率函数为 10., 2 , 1 , 04 . 06 . 01010 xCxXPxfxxx表表4.5 田间播种作业穴粒数的概率函数和分布函数(田间播种作业穴粒数的概率函数和分布函数(103)x012345f(x) 0.10491.572910.61742.467111.48200.66F(x) 0.10491.677812.29554.762166.24366.90 x678910f(x) 250.82214.9912

33、0.9340.3116.0466F(x) 617.72832.71953.64993.951000图图4.8 每穴出苗种子数的概率函数(二项分布)每穴出苗种子数的概率函数(二项分布)概率函数概率函数观察值观察值(x) 设:田间保苗率大于设:田间保苗率大于95%时,最少穴粒数为每穴时,最少穴粒数为每穴n粒。粒。 与上题相同,田间保苗率实际上是每穴有种子发芽与上题相同,田间保苗率实际上是每穴有种子发芽的概率,因此:的概率,因此:至少一粒种子出苗的概率如下:至少一粒种子出苗的概率如下: 由此可见,穴粒数达由此可见,穴粒数达4粒以上就可基本保证每穴必出粒以上就可基本保证每穴必出苗,最佳穴粒数定为苗,最

34、佳穴粒数定为4。 2694. 34 . 0lg05. 0lg95. 06 . 011111101000 npppCXPXPnnnn解解得得于于是是五、泊松分布五、泊松分布 当当n较大,较大,p或或q较小,较小,np或或nq5时,二项分布将为泊松时,二项分布将为泊松分布(分布(Poisson distribution)所接近。令)所接近。令 np,则泊松,则泊松分布的概率分布为分布的概率分布为v记作记作Xp( )。泊松分布的概率函数仅含一个参数,意。泊松分布的概率函数仅含一个参数,意味着只要获知味着只要获知 ,概率函数就被完全确定。,概率函数就被完全确定。v 泊松分布的期望和方差相等且均为泊松分

35、布的期望和方差相等且均为 ,这是泊松分,这是泊松分布所特有的性质。布所特有的性质。如果试验次数很大,某事件出现的次如果试验次数很大,某事件出现的次数很小,那么此事件的出现次数将服从泊松分布。数很小,那么此事件的出现次数将服从泊松分布。 !)(xexXPx v泊松分布的概率函数图形见图泊松分布的概率函数图形见图4.11。图图4.9 泊松分布的概率函数泊松分布的概率函数 =0.5 =1.5 =2.5 =3.5v例例4.11为考察果树品种为考察果树品种A和和B的幼苗在某栽植地的幼苗在某栽植地区的抗寒力及分布,设置区的抗寒力及分布,设置200个面积相等且足够大个面积相等且足够大的抽样小区,观测小区寒害

36、株数(小区内遭受寒害的抽样小区,观测小区寒害株数(小区内遭受寒害的株数),观测结果为的株数),观测结果为0,1,2,3,4和和5。统计寒害株数。统计寒害株数相同的小区数(小区寒害次数),计算小区寒害率相同的小区数(小区寒害次数),计算小区寒害率(小区寒害次数与观测小区总数之比),结果见表(小区寒害次数与观测小区总数之比),结果见表4.6。试用泊松分布预测小区寒害率并与观测结果比。试用泊松分布预测小区寒害率并与观测结果比较,同时考察两品种抗寒力的差异。较,同时考察两品种抗寒力的差异。表表4.6 两果树品种的小区寒害株数、次数和寒害率的观测结果两果树品种的小区寒害株数、次数和寒害率的观测结果小区寒

37、害株数观察值小区寒害株数观察值 x012345品种的小区寒害次数品种的小区寒害次数nA(x) 285852341810品种的小区寒害率品种的小区寒害率 fA(x)0.14 0.29 0.26 0.17 0.09 0.05品种的小区寒害次数品种的小区寒害次数 nB(x) 42665026106品种的小区寒害率品种的小区寒害率 fB(x)0.21 0.33 0.25 0.13 0.05 0.03v品种品种A:v品种品种B: v品种品种A的泊松分布概率函数的泊松分布概率函数v品种品种B的泊松分布概率函数的泊松分布概率函数 , 2 , 1 , 0,!93. 193. 1 xexxXPxfxA , 2

38、, 1 , 0,!57. 157. 1 xexxXPxfxB 93. 150AA xxxfXE 57. 150BB xxxfXE 图图4.10 品种品种A小区寒害率的观察值与泊松预测值小区寒害率的观察值与泊松预测值v图图4.11 品种品种B小区寒害率的观察值与泊松预测值小区寒害率的观察值与泊松预测值v一批种子中不合格种子占一批种子中不合格种子占0.005,从中抽,从中抽取取800粒,试求其中不合格种子恰有粒,试求其中不合格种子恰有10粒粒和不多于和不多于5粒的概率。粒的概率。v因为因为n800,p0.005,np45,所以,所以可按泊松分布来计算。可按泊松分布来计算。v后者也可以在泊松分布累积

39、函数表中查出。后者也可以在泊松分布累积函数表中查出。 785132. 0!4)5(005292. 0!104)10(504410 xxxeXPeXP第四节第四节 正态分布正态分布v正态分布是田间试验与统计分析中最重要的一种分布正态分布是田间试验与统计分析中最重要的一种分布:v生物科学的生物科学的许多随机变量均服从正态分布许多随机变量均服从正态分布,比如产量、,比如产量、株高、生物量等;株高、生物量等; vn趋于无穷大,任意分布趋于无穷大,任意分布平均数平均数的分布均趋于正态分布,的分布均趋于正态分布,这意味着这意味着n足够大时可用正态分布近似平均数的分布;足够大时可用正态分布近似平均数的分布;

40、 vn趋于无穷大,二项分布、泊松分布等许多分布都趋于趋于无穷大,二项分布、泊松分布等许多分布都趋于正态分布,这意味着正态分布,这意味着n足够大时可用正态分布近似这些分足够大时可用正态分布近似这些分布;布; v三大抽样分布三大抽样分布t、c c2和和F均源于正态分布总体的抽样均源于正态分布总体的抽样,而它们又是形成统计方法的基础。而它们又是形成统计方法的基础。 一、正态总体分布一、正态总体分布随机变数随机变数X服从正态分布记为服从正态分布记为XN(m m,s s2) s2)正态分布的概率密度函数为正态分布的概率密度函数为 正态分布的概率累积函数为正态分布的概率累积函数为 22121)( s sm

41、 m s sxexf)()()(xXPdxxfxFx 二、正态分布曲线的性质二、正态分布曲线的性质1、正态分布曲线以总体平均数、正态分布曲线以总体平均数m m为中心,向左右两侧对称分为中心,向左右两侧对称分布。布。2、正态分布曲线是一单峰曲线,总体平均、正态分布曲线是一单峰曲线,总体平均m m对应的概率密度对应的概率密度最大,左右两侧离最大,左右两侧离m m越远对应的概率密度越小。越远对应的概率密度越小。3、总体平均数、总体平均数m m决定曲线的中心位置,标准差决定曲线的中心位置,标准差s s决定曲线的决定曲线的变化率。变化率。 m m和和s s不同的总体其正态分布曲线的位置和形不同的总体其正

42、态分布曲线的位置和形状各异,因此正态分布曲线是以参数状各异,因此正态分布曲线是以参数m m和和s s的不同而变化的不同而变化的曲线系统。的曲线系统。4、正态分布曲线在、正态分布曲线在m m 1s s处有拐点,两尾向左右无限延伸,处有拐点,两尾向左右无限延伸,以横轴为渐近线,全距为以横轴为渐近线,全距为-至至。5、无论、无论m m和和s s为多少,正态分布曲线与横轴间的总面积都等为多少,正态分布曲线与横轴间的总面积都等于于1,意为随机变数,意为随机变数X的取值位于的取值位于-至至之间的概率为之间的概率为1,即即图图6、无论、无论m m和和s s为多少,随机变数的取值落在任为多少,随机变数的取值落

43、在任意区间(意区间(a,b)的)的概率概率为直线为直线xa和和xb与正态分布曲线和横轴间的与正态分布曲线和横轴间的面积面积,即:,即:表表4.7 几个常见区间所对应的概率几个常见区间所对应的概率 baaFbFdxxfaXPbXPbXaP)()()()()()(x区间区间x - m mu面积或概率面积或概率m m 1 s sm m 2 s sm m 3 s sm m 1.96 s sm m 2.58 s s1 s s2 s s3 s s1.96 s s2.58 s s 1 2 3 1.96 2.580.68260.95450.99730.950.99图图4.12 正态概率密度曲线及随的变化(固定

44、)正态概率密度曲线及随的变化(固定)图图4.13 正态概率密度曲线及随的变化(固定)正态概率密度曲线及随的变化(固定)返回性质返回性质图图4.14 正态分布曲线正态分布曲线0.682 60.954 50.997 3m m -3s s m m -2s s m m - 1s s m m m m +1s s m m +2s s m m +3s s Xf(x)0.40.30.20.1正态分布的概率计算正态分布的概率计算 n随机变数随机变数X在在(a,b)范围内的概率等于范围内的概率等于X在在(a,b)范围范围内的定积分:内的定积分:n计算曲线下从计算曲线下从-到到x的面积其式如下:的面积其式如下:nF

45、N(x)称为正态分布的累积函数或分布函数,具平称为正态分布的累积函数或分布函数,具平均数均数 m m和标准差和标准差s s,f(x)为概率密度函数。为概率密度函数。 baxbadxedxxfbXaP2)(2121)()(s sm m s s xxxxdxedxxfxF2)(2121)()(s sm m s sP(Xa)=FN(a)P(aXb)= FN(b) - FN(a)P(aXb)= FN(b) - FN(a)a baP(xa)= 1 - P(xx)+ P(Xx)=1得得)()()()()()(uuUPxUPxXPxXPxF s sm ms sm ms sm m )(1)(1)(1)(1ux

46、xFxXPxXP s sm mv得变量在任意区间得变量在任意区间(x1, x2)内取值的概率如下内取值的概率如下v例例4.13设设 UN(0,1),试计算试计算 P(U1.38)、 P(|U|1)、 P(|U|2)、 P(|U|3)()()()()()()(12121221uuxxxFxFxXxP s sm ms sm mv由正态分布函数表(附表由正态分布函数表(附表1)查得:)查得: (2.1) =0.0179、(1.38) =0.9162、(1) =0.8413、 (-1) = 0.1587、 (2) =0.9772、 (-2) =0.0228、 (3) =0.9987、(-3) =0.0

47、013vP(U1.38)=1 P(U1.38) = 1 0.9162 =0.0838v P(|U|1)= P(- 1U 1)= (1) (-1) =0.8413 0.1587 =0.6826v P(|U|2)=0.9545v P(|U|3)=0.9973图图4.16 正态累积函数的图示正态累积函数的图示ui Uf f (u)f f (u)0.4-3 -2 -1 0 1 2 3 Uv图图4.17 区间区间(-1,1)、(-2,2)和和(-3,3)的概率图示的概率图示 0.682 60.954 50.997 3图图4.18 标准正态分布的概率计算标准正态分布的概率计算v例例4.14设设XN(3,9

48、),试计算,试计算P(X 7.53)、 P(|X| 3.9)v由附表由附表1查得查得 : (1.4) =0.0808、(1.51) =0.9345、(0.3) =0.6179、 (-2.3) = 0.0107、 3928. 06072. 01)9 . 3(1)9 . 3(6072. 00107. 06179. 0)30. 2()30. 0()339 . 3()339 . 3()9 . 39 . 3(9 . 30655. 09345. 01)51. 1(1)3353. 7(153. 71)53. 7(0808. 0)4 . 1()332 . 1()2 . 1( XPXPXPXPFXPXP图图4.

49、19 任意正态分布的概率计算任意正态分布的概率计算v假定假定X是一个随机变量,服从是一个随机变量,服从m m30,s s5的的正态分布正态分布,即:即: X N(30,25)。试求其取值小。试求其取值小于于26,大于,大于40和介于和介于26和和40之间的概率。之间的概率。v本例不是标准正态分布,须经标准化后才能本例不是标准正态分布,须经标准化后才能可求出落于各区间的概率。可求出落于各区间的概率。v 查附表查附表2:(-0.8)0.211 9 )8 . 0()8 . 0()53026()26( UPUPXP0.211 9x26 30u0.211 9-0.8 00227. 09773. 01)2

50、(1)2(1)2(53040)40( UPUPUPXP0.022 740 x300.022 72 u00.765 426 30 40 x0.765 4-0.8 0 2 u4 0.7659 0.211-3 0.977(-0.8)-(2)28 . 0(5304053026)4026( UPUPXPv例例4.9试求正态分布曲线对应中间概率为试求正态分布曲线对应中间概率为0.95和两尾概率为和两尾概率为0.01时随机变数时随机变数X的取值区间。的取值区间。v设对应中间概率为设对应中间概率为0.95的取值区间为(的取值区间为(x1,x2),),即即P(x1Xx2)0.95。经标准化变换后。经标准化变换后

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第四章概率分布《试验设计与统计分析》PPT课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|