理论分布和抽样分布课件.ppt

上传人(卖家):三亚风情 文档编号:3273462 上传时间:2022-08-15 格式:PPT 页数:111 大小:1.24MB
下载 相关 举报
理论分布和抽样分布课件.ppt_第1页
第1页 / 共111页
理论分布和抽样分布课件.ppt_第2页
第2页 / 共111页
理论分布和抽样分布课件.ppt_第3页
第3页 / 共111页
理论分布和抽样分布课件.ppt_第4页
第4页 / 共111页
理论分布和抽样分布课件.ppt_第5页
第5页 / 共111页
点击查看更多>>
资源描述

1、第三章第三章 理论分布和抽样分布理论分布和抽样分布 第一节:概率及其计算第一节:概率及其计算 概率论:研究随机现象规律性的科学。概率论:研究随机现象规律性的科学。统计学:基于实际观测结果,利用统计学:基于实际观测结果,利用概率论得出的规律,解释偶然性中概率论得出的规律,解释偶然性中所寄寓的必然性。所寄寓的必然性。第1页,共111页。两者都是研究随机现象,概率论是统两者都是研究随机现象,概率论是统计学的基础,统计学是概率论得出规计学的基础,统计学是概率论得出规律在各领域中的实际应用。律在各领域中的实际应用。第2页,共111页。一、事件与概率一、事件与概率 事件是指某一事物的每一个现象,或某事件是

2、指某一事物的每一个现象,或某项试验的每一结果。(试验中所发生的现项试验的每一结果。(试验中所发生的现象)。象)。分类:分类:、必然事件:在一定条件组下,必然、必然事件:在一定条件组下,必然要发生的事件。要发生的事件。例:在标准大气压下,水加热到例:在标准大气压下,水加热到100这这一组条件实现,一组条件实现,则水沸腾是必然事件。则水沸腾是必然事件。第3页,共111页。、不可能事件:在一定条件组下,一定、不可能事件:在一定条件组下,一定不能发生的事件。不能发生的事件。例:在以上条件实现,水结冰这一事例:在以上条件实现,水结冰这一事件,就是不可能事件。件,就是不可能事件。、随机事件:在一定条件组实

3、现下,可、随机事件:在一定条件组实现下,可能发生也可能不发生的事件。能发生也可能不发生的事件。例:一粒种子播种后发芽与否。例:一粒种子播种后发芽与否。红花豌豆与白花豌豆杂交,红花豌豆与白花豌豆杂交,2是红花。是红花。第4页,共111页。概率的统计定义:概率的统计定义:假定在相似条件下,重复进行同一类试假定在相似条件下,重复进行同一类试验,事件发生的次数验,事件发生的次数a 与总试验次数与总试验次数n的的比数称为频率比数称为频率a/n,在试验总次数,在试验总次数n逐渐增逐渐增大时,大时,事件的频率愈来愈稳定地接近定事件的频率愈来愈稳定地接近定值值p,于是定义事件的概率为,于是定义事件的概率为p,

4、并记为,并记为 P(A)=p第5页,共111页。一个总体的概率值在理论上是存在的,一个总体的概率值在理论上是存在的,但在一般情况下,无法得到这个数值,但在一般情况下,无法得到这个数值,只有通过样本的频率来推断总体概率。只有通过样本的频率来推断总体概率。因此便以因此便以n在充分大时事件的频率作在充分大时事件的频率作为该事件概率为该事件概率p的近似值,即的近似值,即 (A)=p(a/n)第6页,共111页。概率的表示:概率的表示:小数小数 分数分数0p(A)1 P(A)=1 时为必然事件时为必然事件 P(A)=0 时为不可能事件时为不可能事件第7页,共111页。二、事件间的关系二、事件间的关系 基

5、本事件基本事件:就是不可能再分的事就是不可能再分的事件。件。复合事件复合事件:由若干个基本事件组由若干个基本事件组合而成的事件。合而成的事件。第8页,共111页。以以“事件事件”一词代表随机事件,并以字一词代表随机事件,并以字母母A,B,C.等表示,以等表示,以U表示必然事表示必然事件,以件,以V代表不可能事件。代表不可能事件。1.事件事件A与事件与事件B至少有一件发生至少有一件发生而构成的新事件称为事件而构成的新事件称为事件A与事件与事件B的的和事件和事件。记作:记作:A+B读作读作“或或A发生,或发生,或B发生发生”第9页,共111页。和事件可以推广到个事件:和事件可以推广到个事件:A+B

6、+C+.+N表示表示N个事件至少有一个发个事件至少有一个发生。生。第10页,共111页。2.两个事件两个事件A与与B同时发生而构成的新事同时发生而构成的新事件称为事件件称为事件A与事件与事件B的的积事件积事件。记作:记作:A.B,读作,读作“AB同时发生同时发生”第11页,共111页。积事件可以推广到多个事件的情形:积事件可以推广到多个事件的情形:A.B.C.N表示表示N个事件同时发生个事件同时发生。第12页,共111页。3.两个事件两个事件A与与B如果不能同时发生,即如果不能同时发生,即A.B=V,那么称,那么称A和和B是是互斥事件互斥事件。例:任一玉米株高例:任一玉米株高2.5m以上以上(

7、A)任一玉米株高任一玉米株高2.0-2.5m(B)A.B:任一玉米株高既高于任一玉米株高既高于2.5m又在又在2.0-2.5m之间。之间。抛硬币:抛硬币:A:正面朝上:正面朝上B:反面朝上反面朝上第13页,共111页。4.如果事件如果事件A与事件必发生其一,但与事件必发生其一,但又不可能同时发生,即:又不可能同时发生,即:A+B=u,A.B=V,那么那么B是是A的的对立事件对立事件,可用,可用表示。表示。A第14页,共111页。5.如果事件如果事件A1、A2.An两两互斥,且两两互斥,且每次试验必发生其一,则称每次试验必发生其一,则称A1、A2.An为为完全事件系完全事件系。例:袋中有红、黄、

8、黑、白四种颜色的例:袋中有红、黄、黑、白四种颜色的球,每次取一个,球,每次取一个,“取到红球取到红球”、“取取到黄球到黄球”、“取到黑球取到黑球”、“取到白球取到白球”构成完全事件系。构成完全事件系。第15页,共111页。、如果事件的发生与否不影响事件、如果事件的发生与否不影响事件的发生,则称其的发生,则称其相互独立相互独立。例:例:A:第一粒种子发芽第一粒种子发芽B:第二粒种子发芽第二粒种子发芽第16页,共111页。三、计算概率的法则三、计算概率的法则法则一法则一:对立事件的概率:对立事件的概率:若事件若事件A的概率为的概率为P(A),那么其对立事件,那么其对立事件的概率为的概率为 P()=

9、1-P(A)例:小麦播种后发芽的概率为例:小麦播种后发芽的概率为0.9,那,那么,不发芽的概率为么,不发芽的概率为(1-0.9)=0.1A第17页,共111页。法则二:法则二:互斥事件概率的加法:互斥事件概率的加法:若事件若事件A与事件与事件B是互斥的,概率是互斥的,概率各为各为P(A)和和P(B),那么,那么“A+B”事件事件的概率为的概率为 P(A+B)=P(A)+P(B)第18页,共111页。法则三:独立事件概率的乘法:法则三:独立事件概率的乘法:若确定事件若确定事件A的概率时不受到事件的概率时不受到事件B的影响,反之亦然,那么,这两个的影响,反之亦然,那么,这两个事件是互相独立,称独立

10、事件。对事件是互相独立,称独立事件。对于这类事件,同时出现这一新事件于这类事件,同时出现这一新事件的概率必为每个事件概率的积。的概率必为每个事件概率的积。P(A.B)=p(A).P(B)第19页,共111页。法则四:完全事件系的概率法则四:完全事件系的概率 若若A1,A2.An是完全事件系,则是完全事件系,则这这n个事件的概率之和为个事件的概率之和为1,即,即P(A1+A2+A3+.+An)=P(A1)+P(A2)+.+P(An)=1如果如果n个事件出现的概率是相等的,个事件出现的概率是相等的,那么那么 P(Ai)=1/n第20页,共111页。第二节总体分布第二节总体分布一、二项分布一、二项分

11、布(binomial distribution)(一)二项分布的概率函数(一)二项分布的概率函数二项总体:有非此即彼事件组成的总二项总体:有非此即彼事件组成的总体。体。二项分布:以容量二项分布:以容量n从二项总体中抽样从二项总体中抽样,共有共有n+1种可能的结果种可能的结果,每种结果都有一每种结果都有一个固定的概率个固定的概率,这种变量取值及其概率构这种变量取值及其概率构成的分布称为二项分布成的分布称为二项分布.第21页,共111页。种子发芽试验:种子发芽试验:一粒种子:发芽概率一粒种子:发芽概率p、不发芽概率、不发芽概率q概率相加得概率相加得(p+q)两粒种子:两粒种子:甲乙均发芽:概率为甲

12、乙均发芽:概率为p2 甲发乙不发:概率为甲发乙不发:概率为p(1-p)pq 乙发甲不发:乙发甲不发:qp 甲乙均不发:甲乙均不发:q2概率相加得概率相加得p2+pq+qp+q2=(p+q)2第22页,共111页。依此类推,独立地对依此类推,独立地对n粒种子进行实验,粒种子进行实验,一种结果出现一种结果出现x次的概率是:次的概率是:称为二项分布律或二项概率函数,称为二项分布律或二项概率函数,是是(p+q)n展开后含有展开后含有p(x)的一项这的一项这一分布律也称为贝努里分布一分布律也称为贝努里分布第23页,共111页。其中,其中,x=0,1,2,n,为某事为某事件出现次数。件出现次数。n为样本含

13、量为样本含量,即事件发生总数即事件发生总数.第24页,共111页。二项分布是说明结果只有两种二项分布是说明结果只有两种情况的情况的n次独立实验中发生某种结次独立实验中发生某种结果为果为x次的概率分布。次的概率分布。第25页,共111页。因为(因为(p+q),所以),所以第26页,共111页。二项分布的累积函数:二项分布的累积函数:二项分布中某结果最多发生二项分布中某结果最多发生k次的概率为次的概率为发生发生0次、次、1次、次、.、直至、直至k次的概率之和:次的概率之和:第27页,共111页。(二二)二项分布的应用条件二项分布的应用条件:(1)每次实验只有两类对立的结果每次实验只有两类对立的结果

14、;(2)n次事件相互独立;次事件相互独立;(3)每次实验某类结果的发生的概率是每次实验某类结果的发生的概率是一个常数。一个常数。第28页,共111页。(三)(三)二项分布的参数二项分布的参数二项分布总体的平均数和标准差为:二项分布总体的平均数和标准差为:第29页,共111页。二项分布常表示为:二项分布常表示为:B(n,p)即:二项分布是由即:二项分布是由n和和p两个参数据定两个参数据定的。的。第30页,共111页。(四四)二项分布的形状二项分布的形状二项分布的形状有如下特征:二项分布的形状有如下特征:(1)二项分布图形的形状取决于二项分布图形的形状取决于P 和和n 的的大小;大小;(2)当当P

15、=0.5时,无论时,无论n的大小,均为的大小,均为对称分布;对称分布;(3)当当p0.5,n较小时为偏态分布较小时为偏态分布,n较较大时大时逼近正态分布逼近正态分布。第31页,共111页。一般来说,当一般来说,当n大于,而大于,而p或或q又不过小(例如不接近于),且又不过小(例如不接近于),且np及及nq不小于时,可将其看作不小于时,可将其看作正态分布正态分布,可用正态公式求其概率。可用正态公式求其概率。第32页,共111页。(五)二项分布的应用实例(五)二项分布的应用实例、一批种子的发芽率为、一批种子的发芽率为0.8,现每,现每穴播粒,问每穴出三棵苗的概率?穴播粒,问每穴出三棵苗的概率?平均

16、每穴出苗几棵?平均每穴出苗几棵?本例中,每穴出苗数为随机变量本例中,每穴出苗数为随机变量X,它服从它服从B(5,0.8),故:,故:第33页,共111页。若计算每穴出苗数低于若计算每穴出苗数低于4棵的概率,则棵的概率,则计算累积概率:计算累积概率:P(X3)=P(X=0)+P(X=1)+P(X=2)+P(X=3)平均每穴出苗数:平均每穴出苗数:=np=50.8=4第34页,共111页。、两个纯合亲本杂交、两个纯合亲本杂交(RRrr),F1自自交,交,F2的基因型分离比。的基因型分离比。F2中,中,R基因出现的概率基因出现的概率p=0.5,r基因出现的概率基因出现的概率q=0.5第35页,共11

17、1页。一对因子:一对因子:第36页,共111页。两对因子:两对因子:YYRRyyrrF2中显中显:显显:显显:显显:显显第37页,共111页。3、两对基因分离:、两对基因分离:bbRRBBrrF1 BbRrF2 9B-R-:3B-rr:3bbR-:1bbrr问:样本容量多大时,才能以问:样本容量多大时,才能以99的概的概率至少得到一个率至少得到一个bbrr个体?个体?第38页,共111页。解:解:bbrr的概率的概率q=1/16,非非bbrr出现概率出现概率p=15/16。得到。得到bbrr的概率的概率99%,则非则非bbrr为,所以:为,所以:pn=(15/16)n=0.01n(lg15-l

18、g16)=lg0.01n=71.4因此:要以的可能获得一个因此:要以的可能获得一个bbrr个体,样本容量只少为。个体,样本容量只少为。第39页,共111页。二、二、Poisson分布分布1.Poisson分布的概念分布的概念:二项分布二项分布n很大而很大而P很小时的特殊形很小时的特殊形式。其概率函数式。其概率函数 x=0,1,2.n,其中,其中e为自然对数的底,为自然对数的底,为总体均数,为总体均数,x为事件发生的次数。为事件发生的次数。第40页,共111页。主要描述大量实验中随机稀疏现主要描述大量实验中随机稀疏现象,如:单位面积内的昆虫数、象,如:单位面积内的昆虫数、病斑数、植物种类、细胞计

19、数、病斑数、植物种类、细胞计数、田间杂草分布等。田间杂草分布等。第41页,共111页。2.Poisson分布的应用条件分布的应用条件:(1)两类结果要相互对立;两类结果要相互对立;(2)n次试验相互独立;次试验相互独立;(3)n应很大应很大,P应很小。应很小。第42页,共111页。3.Poisson分布的参数分布的参数方差与平均数相等,只有一个参数。方差与平均数相等,只有一个参数。第43页,共111页。4.Poisson分布的性质分布的性质:(1)均数与方差相等;均数与方差相等;(2)均数均数较小时呈偏态较小时呈偏态,20时近似正时近似正态;态;(3)n很大很大,p很小,很小,np=为常数时二

20、为常数时二项分布趋近于项分布趋近于Poisson分布;分布;(4)n个独立的个独立的Poisson分布相加仍符合分布相加仍符合Poisson分布分布第44页,共111页。5、形状、形状由由决定:决定:很小时分布很偏,很小时分布很偏,增增大后逐渐对称,趋近于正态分布大后逐渐对称,趋近于正态分布 第45页,共111页。三、正态分布三、正态分布(normal distribution)(一)正态分布的密度函数和分布函数(一)正态分布的密度函数和分布函数是连续性变数的一种理论分布。是连续性变数的一种理论分布。许多生物学产生的数据都服从正态分布。许多生物学产生的数据都服从正态分布。正态分布是生物统计学的

21、重要基础正态分布是生物统计学的重要基础 第46页,共111页。对于平均数为对于平均数为,标准差为,标准差为的正态分布,的正态分布,其概率密度函数为:其概率密度函数为:-x 第47页,共111页。其中:其中:平均数,是曲线最高值的横坐标,曲平均数,是曲线最高值的横坐标,曲线以其为对称;线以其为对称;标准差,表示曲线展开程度,标准差,表示曲线展开程度,越大,越大,曲线展开度越大,数据越分散;越小,曲线展开度越大,数据越分散;越小,曲线展开度越小,数据越集中;有了曲线展开度越小,数据越集中;有了和和,曲线形状就可以确定下来。,曲线形状就可以确定下来。第48页,共111页。,标准差为,标准差为的正态分

22、布称为的正态分布称为标准正态分布标准正态分布(standard normal distribution)。以。以N(,2)表示平均数为表示平均数为,标准差为,标准差为的正态分布;以的正态分布;以N(,)表示标准正态分布。表示标准正态分布。第49页,共111页。第50页,共111页。累积分布函数累积分布函数:第51页,共111页。(二)正态分布曲线的特性(二)正态分布曲线的特性、以、以为原点左右对称;为原点左右对称;、x=处处f(x)具有最大值,且算具有最大值,且算术平均数、中数、众数合于这术平均数、中数、众数合于这一点;一点;、是一个曲线簇,由、是一个曲线簇,由和和确定:确定:确定在确定在x轴

23、上的位置,轴上的位置,确定确定其变异度;其变异度;第52页,共111页。以平均数和标准差不同的正态分布系列曲线第53页,共111页。、在、在x=1有拐点;有拐点;、x取值范围是取值范围是,,但多数集中,但多数集中在在附近,离其越远,次数越少;且在附近,离其越远,次数越少;且在 x-相等处具有相等次数。相等处具有相等次数。、曲线的总面积等于。曲线下任何、曲线的总面积等于。曲线下任何定值之间的面积等于这两个定值间面定值之间的面积等于这两个定值间面积占总面积的成数,或者说变量落入积占总面积的成数,或者说变量落入这个区间内的概率。这个区间内的概率。第54页,共111页。几个常用区间与其相应的面积或概率

24、几个常用区间与其相应的面积或概率区间面积或概率区间面积或概率 0.68272 0.95453 0.99731.960 0.95002.576 0.9900第55页,共111页。第56页,共111页。区间区间面积或概率面积或概率10.682720.954530.99731.9600.95002.5760.9900正态分布正态分布第57页,共111页。(三)标准正态分布(三)标准正态分布将将x离其平均数的差数以离其平均数的差数以为单位进为单位进行转换,于是行转换,于是:u为正态离差。可将一般方程转为标为正态离差。可将一般方程转为标准正态分布方程。准正态分布方程。第58页,共111页。概率密度函数:

25、概率密度函数:-u 第59页,共111页。(四四)正态分布区间概率的计算方法正态分布区间概率的计算方法随机变量落在某区间随机变量落在某区间(a,b)内的概率,内的概率,可以从标准正态分布可以从标准正态分布累积分布累积分布函数表中函数表中查出。对于一般的正态分布,先将其查出。对于一般的正态分布,先将其化为标准正态分布再查表化为标准正态分布再查表.第60页,共111页。例:例:u=-0.82,(0.82)0.2061 u=1.15 (u)=0.8749例:随机变量例:随机变量U服从服从N(0,1),求其落在,求其落在0,1.21间间的概率:的概率:P(0U1.21)=(1.21)(0)=0.886

26、90.5000=0.3869落在落在-1.96和和1.96之间的概率:之间的概率:P(|U|u)=1-2(-u)=1-2(-1.96)1-0.0500=0.9500第61页,共111页。正态分布正态分布第62页,共111页。例:变量例:变量X服从服从N(156.2,4.822),求:求:(1)X164;(3)152X162的概率的概率第63页,共111页。(1)(161-156.2)/4.82=1 P(X164)=1-P(X164)=P(X-164)=(-u)=(-1.62)=0.0526 第64页,共111页。(3)u1=(152-156.2)/4.82=-0.87 u2=(162-156.

27、2)/4.82=1.2P(152P162)=(u2)-(u1)=(1.2)-(-0.87)=0.8849-0.1921=0.6928第65页,共111页。(五五)正态分布的单侧分位数正态分布的单侧分位数/临界值临界值上面介绍了正态分布区间概率的计算上面介绍了正态分布区间概率的计算方法。即对于给定的方法。即对于给定的u,通过正态分布,通过正态分布累积函数表查累积函数表查Uu)=时的时的u值。值。u称为称为的上侧的上侧分位数。分位数。对于左侧尾区,满足:对于左侧尾区,满足:P(Uu/2)=时的时的u/2称为称为的的双侧分位数。双侧分位数。第67页,共111页。第68页,共111页。对于单尾表(上侧

28、分位对于单尾表(上侧分位):对于双尾表对于双尾表:第69页,共111页。第三节第三节 抽样分布抽样分布(sampling distribution)可从两个方向研究总体与样本的关系:可从两个方向研究总体与样本的关系:一是总体到样本,即由已知的总体研究样一是总体到样本,即由已知的总体研究样本的分布规律;二是从样本到总体的方向,本的分布规律;二是从样本到总体的方向,即由样本推断未知的总体。抽样分布是研即由样本推断未知的总体。抽样分布是研究第一个方向的问题究第一个方向的问题,是统计推断的基础。是统计推断的基础。第70页,共111页。第71页,共111页。从一个总体进行随机抽样从一个总体进行随机抽样:

29、从无限总体中可抽取无限多个随机样本。从无限总体中可抽取无限多个随机样本。从容量为从容量为N的有限总体的有限总体:样本容量为样本容量为n,有,有Nn个个所有可能样本。所有可能样本。每个样本可得一平均数:每个样本可得一平均数:,构成一新,构成一新的总体,平均数为新总体的变量。每一平均数的总体,平均数为新总体的变量。每一平均数会有差异,所以平均数新总体也有其分布,称会有差异,所以平均数新总体也有其分布,称为平均数的抽样分布。为平均数的抽样分布。第72页,共111页。(一)从一个正态总体抽出的随机样本(一)从一个正态总体抽出的随机样本的平均数分布的平均数分布、总体标准差已知时的平均数分布、总体标准差已

30、知时的平均数分布u分布分布从一个正态总体抽出从一个正态总体抽出的随机样本的随机样本,无论样无论样本容量大小,其样本平均数的抽样分布必本容量大小,其样本平均数的抽样分布必呈正态分布呈正态分布第73页,共111页。若总体不是正态分布,但具有一定量若总体不是正态分布,但具有一定量的的和和2,只要样本容量,只要样本容量n足够大足够大(一般(一般n30),从总体抽出的样本),从总体抽出的样本平均数也近似地服从正态分布平均数也近似地服从正态分布N(,2/n),称为中心极限定理。,称为中心极限定理。第74页,共111页。(1)该抽样分布的平均数与母总体的平均数该抽样分布的平均数与母总体的平均数相等相等(2)

31、该抽样分布的方差与母总体方差间存在如下该抽样分布的方差与母总体方差间存在如下关系:关系:即:即:第75页,共111页。第76页,共111页。标准化:标准化:其中,其中,n为样本容量,为样本容量,是样本平均数分是样本平均数分布的标准差,称为布的标准差,称为标准误标准误(差),可以(差),可以度量抽样分布的变异度量抽样分布的变异 第77页,共111页。例:从例:从N3(2,4,6),以以n=1,2,4,8复置抽样复置抽样第78页,共111页。n=1n=2n=4n=8 ffff2122122.0122.00122.258182.54102.5036902.751123083263.010303.00

32、2667983.2550416383.516563.5078427443.751 016381041443124.019764.001 10744284.251 01643184.516724.5078435284.75504239452105.010505.0026613305.251125885.54225.50361985.758466166166.0166.00166总和31293681324656126244均数12/3=(4)36/9=(4)324/81=(4)26244/6561=(4)方差8/34/32/31/3第79页,共111页。、总体标准差未知、总体标准差未知(或虽然总体

33、标准或虽然总体标准差已知,但总体不呈正态,且差已知,但总体不呈正态,且n较小较小)时时的平均数分布的平均数分布t分布分布总体总体2未知,可以用样本标准差代替未知,可以用样本标准差代替总体标准差,标准化变量总体标准差,标准化变量 不服从正态分布,而是服从自由度为不服从正态分布,而是服从自由度为n-1的的t分布分布 第80页,共111页。其中其中 ,为标准误。为标准误。第81页,共111页。t分布也是一组对称密度函数曲线分布也是一组对称密度函数曲线分布,它只有一个参数自由度确分布,它只有一个参数自由度确定其分布。与正态曲线相比,定其分布。与正态曲线相比,t分分布曲线稍微扁平,峰顶略低,尾部布曲线稍

34、微扁平,峰顶略低,尾部稍高。稍高。理论上,理论上,随着自由度的增大,随着自由度的增大,t 分布分布趋于正态分布:趋于正态分布:30时接近正态曲时接近正态曲线,线,时,与正态曲线合一。时,与正态曲线合一。第82页,共111页。第83页,共111页。正态分布正态分布t分布分布40。正态分布正态分布t分布分布4000.10.20.30.4123-3-2-1正态分布曲线与t分布曲线的比较第84页,共111页。概率密度函数:概率密度函数:t分布的平均数和标准差分布的平均数和标准差:第85页,共111页。t 分布的累积函数:分布的累积函数:第86页,共111页。t分布的概率累积函数也分为一尾分布的概率累积

35、函数也分为一尾表和两尾表,一尾表是表和两尾表,一尾表是t到到的面积,的面积,两尾表是两尾表是-t到到-的面积和的面积和t到到的面的面积之和。积之和。单尾表表头上的各概率(单尾表表头上的各概率()是)是t大大于表中所列于表中所列t值时的概率。例如从表值时的概率。例如从表中查出中查出df=9,=0.05的的t单侧分位数单侧分位数t0.05=1.8331,表示表示t1.8331 时,曲线时,曲线下面积(或概率)为下面积(或概率)为0.05第87页,共111页。由于曲线的对称性,对于单侧分位由于曲线的对称性,对于单侧分位数可以表示为:数可以表示为:P(tt)=P(t-t)=第88页,共111页。两尾时

36、,每一尾的面积只有给出概两尾时,每一尾的面积只有给出概率的率的1/2。例如。例如df=9,=0.05的的t双双侧分位数,就要查侧分位数,就要查/2=0.025时时的单侧分位数:的单侧分位数:t0.025,9=2.2622,由于由于对称性,另一侧对称性,另一侧-t0.025,9=-2.2622即:即:t2.2622和和t2.2622(相当于(相当于|t|2.2622)两尾面积之和为)两尾面积之和为0.05。第89页,共111页。(二)样本总和数的抽样分布(二)样本总和数的抽样分布样本总和数(以样本总和数(以x表示)的抽样分布表示)的抽样分布参数与母总体间存在如下关系:参数与母总体间存在如下关系:

37、()抽样分布的平均数是母总体平均数()抽样分布的平均数是母总体平均数的的n倍倍xn(2)抽样分布的方差是母总体方差的抽样分布的方差是母总体方差的n倍倍x2n2第90页,共111页。(三)从两个正态总体抽出的随机样本(三)从两个正态总体抽出的随机样本的平均数差数的分布的平均数差数的分布总体总体N(,12),以以n1抽样抽样:,s1;总体总体2N(,22),以以n2抽样抽样:,s2;第91页,共111页。、标准差、标准差1、已知:已知:两者抽样相互独立,则两个独立随机两者抽样相互独立,则两个独立随机抽取的样本平均数间差数抽取的样本平均数间差数()的抽的抽样分布参数与两个母总体间存在如下关样分布参数

38、与两个母总体间存在如下关系:系:xx21第92页,共111页。),()(2221212121nnNxx第93页,共111页。标准化:第94页,共111页。、标准差、标准差1、未知:未知:若若1、未知,但两个总体相互独立未知,但两个总体相互独立而且都是正态分布,同时而且都是正态分布,同时1=,则差数分布服从则差数分布服从df1+df2的的t分布分布,其中其中df1=n1-1,df2=n2-1;第95页,共111页。第96页,共111页。3 3 近似近似t t分布:分布:当两个总体标准差当两个总体标准差11和和22未知,且未知,且1212,符合近似符合近似t t检验检验因为因为1212,差数标准误

39、需用两个样本的,差数标准误需用两个样本的S1S1、S2S2均方均方分别估计分别估计11、2222121212xxsssnn121212()()xxxxts 第97页,共111页。21221222121(1)xxxsksskk 具有自由度第98页,共111页。二、二项总体的抽样分布二、二项总体的抽样分布(一)样本平均数(成数)的分布(一)样本平均数(成数)的分布从二项总体进行抽样得到样本,样本平均从二项总体进行抽样得到样本,样本平均数(成数)的分布为二项分布:数(成数)的分布为二项分布:平均数:平均数:方方 差:差:标准误:标准误:第99页,共111页。(二)样本总和数(次数)的抽样分布从二项总

40、体进行抽样得到样本,样本总和数(次数)的分布为二项分布第100页,共111页。三、样本方差的抽样分布三、样本方差的抽样分布(一)卡方分布(一)卡方分布从方差为从方差为2的正态总体中,随机抽取的正态总体中,随机抽取容量为容量为n的样本,计算出样本方差的样本,计算出样本方差s2,将其标准化,得到一个不带任何单将其标准化,得到一个不带任何单位的纯数,然后讨论其分布。标准位的纯数,然后讨论其分布。标准化的方法为:化的方法为:第101页,共111页。称为具有称为具有n-1自由度的卡方自由度的卡方,分分布是概率曲线随自由度布是概率曲线随自由度df而改变的而改变的一类分布(如图),它的密度函数一类分布(如图

41、),它的密度函数为:为:第102页,共111页。第103页,共111页。分布的平均数和标准差为:分布的平均数和标准差为:第104页,共111页。(二)(二)F分布分布从平均数和方差为从平均数和方差为(,2)一个正态一个正态总体中独立地抽出含量分别为总体中独立地抽出含量分别为n1、n2的样本,并分别求其方差的样本,并分别求其方差s12和和s22。则:则:F=s12/s22此此F值具有自由度值具有自由度1和和2,第105页,共111页。如果按给定的自由度如果按给定的自由度1和和2进行一系进行一系列的抽样,就可以得到一系列值而成列的抽样,就可以得到一系列值而成一个分布。分布的形状决定于一个分布。分布

42、的形状决定于1和和2,在在1=1或和或和1=2时为反向时为反向J型型,1大于等于大于等于3时转为偏态。时转为偏态。第106页,共111页。第107页,共111页。分布下一定区间的概率可以从已制分布下一定区间的概率可以从已制成的统计表查出。成的统计表查出。如:如:1 3,2 1 2 时,时,F0.05=3.49;F0.01=5.95,表示以表示以n1=4,n2=13在一个正态总体中连续抽在一个正态总体中连续抽样,则所的样,则所的F值大于值大于3.49的概率仅有的概率仅有5%,而大于,而大于5.95的概率仅有的概率仅有1%。第108页,共111页。从两个正态总体中抽样时,从两个正态总体中抽样时,F值为标准值为标准化的样本方差之比化的样本方差之比:第109页,共111页。F表专为测验表专为测验12是否显著大于是否显著大于22而设而设计的,当计的,当FF值时,应否定值时,应否定HO:12 22在方差分析体系中,在方差分析体系中,F测验可用于检测验可用于检测某项变异因素的效应或方差是否真测某项变异因素的效应或方差是否真实存在实存在。第110页,共111页。F测验需具备:测验需具备:1、变数、变数x服从服从N(,2);2、s12 s22彼此独立。彼此独立。不符合这些条件时,需作适当转换。不符合这些条件时,需作适当转换。第111页,共111页。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(理论分布和抽样分布课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|