1、(生统与田试)第四章 统计假设检验6本章主要内容本章主要内容 由样本的结果如何来推断总体由样本的结果如何来推断总体假设检验假设检验 参数估计参数估计分析误差产生的原因分析误差产生的原因 确定差异的性质确定差异的性质 排除误差干扰排除误差干扰 对总体特征做出正确判断对总体特征做出正确判断l假设检验假设检验就是就是根据总体的理论分布和根据总体的理论分布和小概率原理小概率原理,对未知或不完全知道的,对未知或不完全知道的总体总体提出两种彼此对立的假设提出两种彼此对立的假设,然后,然后由样本的实际结果,经过一定的计算,由样本的实际结果,经过一定的计算,作出作出在一定在一定概率意义上概率意义上应该接受的那
2、应该接受的那种假设的种假设的推断推断。l如果抽样结果使小概率发生,则拒如果抽样结果使小概率发生,则拒绝假设,绝假设,如抽样结果没有使小概率如抽样结果没有使小概率发生,则接受假设。发生,则接受假设。生物统计学中,一般认为生物统计学中,一般认为小于小于0.050.05或或0.0l0.0l的概率为的概率为小概率小概率。通过假设。通过假设检验,可以正确分析处理效应和随检验,可以正确分析处理效应和随机误差,作出可靠的结论。机误差,作出可靠的结论。l在进行假设检验时,一般应包括以下在进行假设检验时,一般应包括以下4 4个个步骤步骤:提出假设提出假设确定显著水平确定显著水平计算概率计算概率推断是否接受假设推
3、断是否接受假设l假设检验首先要对总体假设检验首先要对总体提出假设提出假设(statistical hypothesis)(statistical hypothesis)l一般应作一般应作两个假设:两个假设:无效假设无效假设,记作,记作H0;备择假设备择假设,记作,记作HA。l无效假设无效假设(null hypothesis)(null hypothesis)是是直接检直接检验验的假设,是对总体提出的一个假想目的假设,是对总体提出的一个假想目标。标。l所谓所谓“无效无效”意指处理效应与总体参数意指处理效应与总体参数之间之间没有真实的差异没有真实的差异,试验结果中的差,试验结果中的差异乃误差所致。
4、异乃误差所致。l备择假设备择假设(alternative hypothesis)(alternative hypothesis)是和无效假设相反的一种假设,即认是和无效假设相反的一种假设,即认为试验结果中的为试验结果中的差异是由于总体参数差异是由于总体参数不同不同所引起的。所引起的。因此,无效假设与备择假设是因此,无效假设与备择假设是对立事对立事件件,在检验中,如果,在检验中,如果接受接受H0就就否定否定HA;否定否定H0则则接受接受HA。l确定确定无效假设无效假设必须遵循必须遵循两个原则两个原则:l无效假设是无效假设是有意义有意义的;的;l据此据此可算出因抽样误差可算出因抽样误差而获得样而获
5、得样本结果的概率。本结果的概率。l在进行无效假设和备择假设后,要在进行无效假设和备择假设后,要确定一个确定一个否定否定H0的概率标准的概率标准,这个,这个概率标准叫概率标准叫显著水平显著水平,记作,记作。是是人为规定人为规定的的小概率界限小概率界限,生物统计生物统计学中常取学中常取0.05和和0.0l两个显著两个显著水平。水平。l在假设在假设H0正确的前提下,根据样本平均正确的前提下,根据样本平均数的抽样分布计算出由抽样误差造成的数的抽样分布计算出由抽样误差造成的概率。对于上面一个样本平均数的例子,概率。对于上面一个样本平均数的例子,在在H0:0 0的前提下,根据式的前提下,根据式3 3272
6、7可求得:可求得:l查附表查附表2 2,P P(|u|(|u|1.5811.581)2 20.057l0.057l0.11420.1142,即在,即在N(126N(126,240)240)的总的总体中,以体中,以n n6 6进进行随机抽样,所行随机抽样,所得平均得平均数136136与与126126相差为相差为1010以以上的概率为上的概率为0.11420.1142xl注意:注意:检验所计算的并不是实得差异检验所计算的并不是实得差异本身的概率,而是超过实得差异的概本身的概率,而是超过实得差异的概率。率。概率的大小,是推断概率的大小,是推断H H0 0是否正确是否正确的依据的依据。在。在H H0
7、0假设下,由于假设下,由于 有可能有可能大于大于,也有可能小于,也有可能小于,因此需要,因此需要考虑考虑差异的正和负差异的正和负两个方面,所以一两个方面,所以一般计算的都是般计算的都是双尾概率双尾概率。xl根据小概率原理作出根据小概率原理作出是否接受是否接受H0:小概小概率原理率原理指出:指出:如果假设一些条件,并在如果假设一些条件,并在假设的条件下能够准确地算出事件假设的条件下能够准确地算出事件A A出现出现的概率的概率为为很小很小,则在假设条件下的则在假设条件下的n n次次独立重复试验中,事件独立重复试验中,事件A A将按预定的概率将按预定的概率发生,发生,而在而在一次试验中则几乎不可能发
8、一次试验中则几乎不可能发生生(“(“小概率事件实际上不可能发生小概率事件实际上不可能发生”)。)。l统计学中,常把概率统计学中,常把概率小于小于0 00505或或0.010.01作为作为小概率小概率。l如果计算的概率如果计算的概率大于大于0.050.05或或0.010.01,则认,则认为为不是不是小概率事件;小概率事件;H0的假设的假设可能是正可能是正确的确的,应该,应该接受接受,同时同时否定否定HA;l反之,反之,所计算的概率小于所计算的概率小于0.050.05或或0.010.01,则否定否定H0,接受接受HA。l通常把通常把概率等于或小于概率等于或小于0.050.05叫做叫做差异显差异显著
9、标准著标准,或,或差异显著水平差异显著水平(significance levelsignificance level);等于或小于等于或小于0.010.01叫做叫做差异极显著标准差异极显著标准,或,或差异极显差异极显著水平著水平。l一般一般差异达到显著水平差异达到显著水平,则在资料的,则在资料的右右上方上方标以标以“*”,差异达到极显著水平差异达到极显著水平,则在资料则在资料右上方右上方标以标以“*”。上例中,所计算的概率为上例中,所计算的概率为0.11420.1142,大于,大于0.050.05的显著水平,应的显著水平,应接受接受H0,可以,可以推断治推断治疗前后疗前后的血红蛋白含量的血红蛋
10、白含量未未发现有显著差异发现有显著差异,其其差值差值1010(mgL(mgL)应归于应归于误差误差所致。所致。l在实际检验时,可将上述计算在实际检验时,可将上述计算简化简化。由例。由例3 31010已知已知P(|u|P(|u|1.96)1.96)0.050.05,P(|u|P(|u|2.58)2.58)0.010.01,因此,在用,因此,在用u u分布进行检验分布进行检验时,如果算得时,如果算得|u|u|1.961.96,就是在,就是在0.050.05的水平上达到显著的水平上达到显著,如果,如果|u|u|2.582.58,就是,就是在在0.0l0.0l的水平上达到的水平上达到显著,即达到显著,
11、即达到极极显著水平显著水平,勿须再计算,勿须再计算u u值的概率。值的概率。l样本频率样本频率、变异数变异数以及以及多个平均数多个平均数的假的假设检验,都应根据试验目的提出无效假设检验,都应根据试验目的提出无效假设和备择假设。设和备择假设。l 提出无效假设的目的提出无效假设的目的:可从假设的总:可从假设的总体中体中推论其平均数的随机抽样分布推论其平均数的随机抽样分布,从,从而可以而可以算出某一样本平均数指定值出现算出某一样本平均数指定值出现的概率的概率,这样就可以根据样本与总体的,这样就可以根据样本与总体的关系,关系,作为假设检验的理论依据作为假设检验的理论依据。l综上所述,综上所述,假设检验
12、的步骤假设检验的步骤可概括为:可概括为:l(1)(1)对样本所属总体提出无效假设对样本所属总体提出无效假设H0和备和备择择HA;l(2)(2)确定检验的显著水平确定检验的显著水平;l(3)(3)在在H0正确正确的前提下,根据抽样分布的的前提下,根据抽样分布的统计数,进行假设检验的统计数,进行假设检验的概率计算概率计算;l(4)(4)根据显著水平根据显著水平的的u u值临界值值临界值,进行,进行差异是否显著的差异是否显著的推断推断。l进行假设检验时,需要提出无效假设和进行假设检验时,需要提出无效假设和备择假设。提出的这种假设,其总体平备择假设。提出的这种假设,其总体平均数均数可能大于可能大于0,
13、也可能小于也可能小于0。l在样本平均数的抽样分布中,对于在样本平均数的抽样分布中,对于0.05时,落在区间时,落在区间(-1.96 ,+1.96 )的的 有有95,落在这一区间之外,落在这一区间之外(即即 -1.96 和和 +1.96 )的的只有只有5。xxxxxxxxl同理,对于同理,对于0.010.01时,落在区间时,落在区间(-2.58 2.58 ,+2.58 +2.58 )的的 有有9999,落落在这一区间之外在这一区间之外(即即 -2.58 -2.58 和和 +2.58 +2.58 )的的 只有只有1 1。l在进行假设检验时,前者相当于接受在进行假设检验时,前者相当于接受H0的区的区
14、域,简称域,简称接受区接受区(acceptance regionacceptance region);后者;后者相当于否定相当于否定H0的区域,简称的区域,简称否定区否定区(rejection regionrejection region)()(图图4 41)1)。xxxxxxxxl一般将接受区和否定区的两个临界值写作一般将接受区和否定区的两个临界值写作u u ,即当,即当 在在(-u-u ,+u+u )内为内为H0的的接受区接受区,而,而 -u 和和 u为为H0的的两个否定区两个否定区;lxx-u-u :为:为左尾左尾否定区,否定区,+u 为为右尾右尾否定区。否定区。l上述假设检验的上述假设
15、检验的两个两个否定区,否定区,分别位于分分别位于分布的两尾布的两尾,称为,称为双尾检验双尾检验。xxxxxxxxxxxl当假设检验的当假设检验的 时,则时,则,这时备择假设就有,这时备择假设就有两种可能两种可能,或或 或或 ,也就是说在,也就是说在 的情况下,样本的情况下,样本平均数平均数 有可能落入有可能落入左左尾尾否定区,也有可能落入否定区,也有可能落入右尾右尾否定区,这两否定区,这两种情况都属于种情况都属于 的情况。的情况。例如,检验某种新药与旧药的治病疗效是否有差别,就例如,检验某种新药与旧药的治病疗效是否有差别,就是说新药疗效比旧药好还是旧药疗效比新药好,两种可是说新药疗效比旧药好还
16、是旧药疗效比新药好,两种可能性都存在,相应的假设检验就应该用双尾检验。在生能性都存在,相应的假设检验就应该用双尾检验。在生物学研究中,双尾检验的应用是非常广泛的。物学研究中,双尾检验的应用是非常广泛的。l单尾检验单尾检验l但在某些情况下,双尾检验不一定符合实但在某些情况下,双尾检验不一定符合实际。例如,我们已经知道新药疗效不可能际。例如,我们已经知道新药疗效不可能低于旧药,于是其低于旧药,于是其无效假设无效假设 ,备择假设备择假设,这时,这时仅有一种可仅有一种可能性能性,其,其否定区只有一个否定区只有一个,相应的检验也相应的检验也只能考虑一侧的概率只能考虑一侧的概率,这种具有,这种具有左尾左尾
17、或或右右尾尾一个否定区一个否定区的检验叫的检验叫单尾检验单尾检验。l单尾检验的步骤与双尾检验相同单尾检验的步骤与双尾检验相同,查,查u u分布分布表表或或t t分布分布表时,表时,需将一尾概率乘以需将一尾概率乘以2 2,再进行,再进行查表。查表。l例如,进行例如,进行0.050.05的单尾的单尾检验时,对检验时,对,需进行左尾检验,其否定区为,需进行左尾检验,其否定区为;对;对,需进行右尾,需进行右尾检验,其否定区为检验,其否定区为 l同理,进行同理,进行0.010.01的的单尾单尾检验时,对检验时,对 ,其否定区为,其否定区为,对,对 ,其否定,其否定 假设检验是根据一定概率显著水平对总体假
18、设检验是根据一定概率显著水平对总体特征进行推断。特征进行推断。否定了否定了H0,并,并不等于不等于已证已证明明H0不真实不真实;接受接受了了H0,也,也不等于不等于已证明已证明H H0 0是是真实真实的。的。l如果如果H0是真实是真实的,假设检验却的,假设检验却否定了它否定了它,就,就犯了一个犯了一个否定真实假设否定真实假设的错误,这类错误叫的错误,这类错误叫第一类错误第一类错误,或称,或称错误,亦称错误,亦称弃真错误弃真错误。l如对样本平均数的抽样分布,当取概率显著水如对样本平均数的抽样分布,当取概率显著水平平0.050.05时,时,x x落在区间落在区间()的概率为的概率为落在区间落在区间
19、(-1.96 1.96 ,+1.96+1.96)之外之外的概率为的概率为0.050.05,当当 一旦落在一旦落在区间区间(-1.96 -1.96 ,+1.96 )+1.96 )之外,之外,假设检验时假设检验时就会否定就会否定H0,接受接受HA,这这样就会样就会导致错误的结论导致错误的结论。不过,。不过,犯这类错误的犯这类错误的概率很小概率很小,只有,只有0.050.05。l如果取概率显著水平为如果取概率显著水平为0.010.01,则,则x x落在区落在区间间(-2.58 -2.58 ,+2.58+2.58)的概率为的概率为落在区间落在区间(-2.58 -2.58 ,+2.582.58)之外的概
20、率只有之外的概率只有0.010.01,即犯,即犯“错误的错误的可能性更小,只有可能性更小,只有0.010.01。xxxxxxxxxxxxxxxl如果如果H0不是真实的不是真实的,假设检验时却,假设检验时却接受了接受了H0,否定了否定了HA ,这样就犯了接受不真实的错误,这样就犯了接受不真实的错误,这类错误叫这类错误叫第二类错误第二类错误,或称,或称错误,亦称错误,亦称纳伪错误。纳伪错误。l第一类错误和第二类错误既有第一类错误和第二类错误既有区别区别又有又有联系联系。二者的区别二者的区别是,第一类错误只有在否定是,第一类错误只有在否定H0时时才会发生,而第二类错误只有在接受才会发生,而第二类错误
21、只有在接受H0时才时才会发生。会发生。二者的联系二者的联系是,在样本容量相同的是,在样本容量相同的情况下,第一类错误减少,第二类错误就会情况下,第一类错误减少,第二类错误就会增加;反之,第二类错误减少,第一类错误增加;反之,第二类错误减少,第一类错误就会增加。就会增加。正确正确不正确不正确接受接受 没犯错误没犯错误否定否定 犯了错误犯了错误弃真错误弃真错误(第一类错误)(第一类错误)(危险率以危险率以表示表示)接受接受犯了错误犯了错误采伪错误采伪错误(第二类错误)(第二类错误)(危险率以危险率以表示表示)否定否定没犯错误没犯错误l在假设检验时,一个假设的接受或否定,在假设检验时,一个假设的接受
22、或否定,不可能保证百分之百的正确,肯定会出现不可能保证百分之百的正确,肯定会出现一些错误的推断。一些错误的推断。l如何减少犯这两类错误的概率如何减少犯这两类错误的概率?l(1)(1)概率显著水平的确定与犯两类错误有概率显著水平的确定与犯两类错误有密切的关系,密切的关系,取值太高或太低都会导致取值太高或太低都会导致某一种错误的增加。一般的作法是,某一种错误的增加。一般的作法是,将概将概率显著水平不要定得太高,率显著水平不要定得太高,以取以取0.050.05作为小概率比较合适,这样可使犯两类错作为小概率比较合适,这样可使犯两类错误的概率都比较小。误的概率都比较小。l(2)(2)在计算正态离差在计算
23、正态离差u u时,总体平均数时,总体平均数和样本平和样本平均数均数 之间的差值不是随意能够进行主观改变的,之间的差值不是随意能够进行主观改变的,但在试验研究中,但在试验研究中,却是可以减小的。却是可以减小的。xxxxxx从理论上讲,从理论上讲,可通过精密的试验设计和增大可通过精密的试验设计和增大样本容量而减小到接近样本容量而减小到接近0 0的程度的程度,这样正态分布,这样正态分布中接受区就变得十分狭窄,中接受区就变得十分狭窄,和和之间的差别之间的差别就比较容易发现,所以减小就比较容易发现,所以减小 是减少两类错误是减少两类错误的关键。因此,的关键。因此,在试验和研究中应用假设检验时,在试验和研
24、究中应用假设检验时,要有要有合理的试验设计合理的试验设计和和正确的试验技术,正确的试验技术,尽量尽量增增加样本容量,加样本容量,以以减小标准误减小标准误 。的假设检验的假设检验l根据根据总体方差总体方差2是否已知是否已知,一个样本平均数,一个样本平均数的的u u检验分为两种情况检验分为两种情况。l1 1总体方差总体方差2已知时的检验已知时的检验 当当总体方差总体方差为为已知已知时,检验一个样本平均数时,检验一个样本平均数 的总体平的总体平均数均数是否属于某一指定平均数为是否属于某一指定平均数为0 0的总体,的总体,不论不论其样本容量是否大于其样本容量是否大于3030,均可采用,均可采用u u检
25、验检验法。法。xl例例4.14.1 某鱼场按常规方法所育某鱼苗一月龄某鱼场按常规方法所育某鱼苗一月龄的的平均体平均体长为长为7.25cm7.25cm,标准差标准差为为1.581.58cmcm,为,为提高鱼苗质量,现采用一提高鱼苗质量,现采用一新方法新方法进行育苗,进行育苗,一月龄时随机抽取一月龄时随机抽取100100尾尾进行测量,测得其进行测量,测得其平均平均体长为体长为7.65cm7.65cm,试问新育苗方法与常规,试问新育苗方法与常规方法有无显著差异方法有无显著差异?分析:分析:这里总体这里总体1.58cm1.58cm,2 2为已知为已知,故采用故采用u u检验;又新育苗方法的鱼苗体长可检
26、验;又新育苗方法的鱼苗体长可能高于常规方法,也可能低于常规方法,故能高于常规方法,也可能低于常规方法,故进行进行双尾双尾检验。检验步骤为:检验。检验步骤为:l(1)(1)假设假设H0:0 0=7.25cm=7.25cm,即新育苗方,即新育苗方法与常规方法所育鱼苗一月龄体长相同。对法与常规方法所育鱼苗一月龄体长相同。对HA:0 0;l(2)(2)选取显著水平选取显著水平=0.05=0.05;l(3)(3)检验计算:检验计算:l(4)(4)推断:推断:u u分布中,当分布中,当=0.05=0.05时,时,u u0.050.05=1.96=1.96。实得实得|u|u|1.961.96,P P0.05
27、0.05,故,故在在0.050.05显著水平上显著水平上否定否定H0,接受接受HA,认为新育苗方法一月龄体长,认为新育苗方法一月龄体长与常规方法与常规方法有显著差异。有显著差异。l例例4.24.2 生产某种纺织品,生产某种纺织品,要求要求棉花纤维长度棉花纤维长度平均为平均为30mm30mm以上以上,现有一棉花品种,以,现有一棉花品种,以n n400400进行抽查,测得其纤维进行抽查,测得其纤维平均长度为平均长度为30.2mm30.2mm,标准差为标准差为2.5mm2.5mm,问该棉花品种的纤维长度,问该棉花品种的纤维长度是是否符合否符合纺织品的生产纺织品的生产?l分析分析:由题可知,:由题可知
28、,30.0mm30.0mm,30.2 30.2 mmmm,s s2.5mm2.5mm,而,而2 2未知未知,但由于,但由于n n400400,属于大样本,故可用属于大样本,故可用S S2 2来代替来代替2 2进行进行u u检验;检验;又由于棉花纤维只有又由于棉花纤维只有大于大于30.0mm30.0mm才符合纺织才符合纺织品生产的要求,故用品生产的要求,故用单尾检验单尾检验。xl(1)(1)假设假设H0:30.0mm 30.0mm,即该棉花品种纤,即该棉花品种纤维长度维长度达不到达不到纺织品生产的要求。对纺织品生产的要求。对HA:30.0mm 30.0mm;(2)(2)确定显著水平确定显著水平
29、0.050.05;(3)(3)检验计算:检验计算:l两个样本平均数比较两个样本平均数比较的的u u检验是要检验两检验是要检验两个样本平均数个样本平均数 和和 所属的总体平所属的总体平均数均数1 1和和2 2是否来自同一个总体。在两是否来自同一个总体。在两个样本方差个样本方差和和已知已知,或,或和和未未知知,但但两个样本都是大样本,即在两个样本都是大样本,即在n n1 13030和和n n2 23030时,可用时,可用u u检验法检验法1x2x21212222l在进行在进行两个大样本平均数两个大样本平均数的比较时,需要计的比较时,需要计算算样本平均数差数的标准误样本平均数差数的标准误 和和u u
30、值值。当两样本方差当两样本方差 和和 已知已知,两个样本平均两个样本平均数差数的标准误为:数差数的标准误为:21xx 2122(4.1,3.37)(4.2)(4.3)(4.4)(4.5)(4.6)(4.7)(4.8)l 例例4.34.3 根据根据多年的资料多年的资料,某杂交黑麦,某杂交黑麦从播种到开花的天数的从播种到开花的天数的标准差为标准差为6.9d6.9d,现在相同试验条件下采取两种方法取样现在相同试验条件下采取两种方法取样调查,调查,A A法法调查调查400400株,得出从播种到开株,得出从播种到开花的平均天数为花的平均天数为69.5d69.5d;B B法法调查调查200200株株,得出
31、从播种到开花的平均天数为得出从播种到开花的平均天数为70.3d70.3d,试比较两种调查方法所得黑麦从播种到试比较两种调查方法所得黑麦从播种到开花的天数有无显著差别。开花的天数有无显著差别。l分析分析:根据题意,总体方差已知,:根据题意,总体方差已知,l故用故用u u检验;又事先不知检验;又事先不知A A、B B两法所得从播种两法所得从播种到开花的天数是否相同,需用到开花的天数是否相同,需用双尾双尾检验。检验。l(3)(3)检验计算:检验计算:l(1)(1)假设假设H0:1 12 2,即,即A A、B B两法所得从两法所得从播种到开花的天数相同。对播种到开花的天数相同。对HA:1 12 2;l
32、(2)(2)取显著水平取显著水平 0.050.05;l 例例4 44 4 为了比较为了比较“42674267RRIM603”RRIM603”和和“42674267PB86”PB86”两个橡胶品种的割两个橡胶品种的割胶产量,两品种分别随机抽样胶产量,两品种分别随机抽样5555株株和和107107株株进行割胶,割胶平均产量分别为进行割胶,割胶平均产量分别为株株-l-l和和77.6mL.77.6mL.株株-1-1,割胶产量,割胶产量的方差分别为的方差分别为和和试检验两个橡胶品种试检验两个橡胶品种在割胶产量上是否有显著差别。在割胶产量上是否有显著差别。l分析:分析:l(1)(1)假设假设H0:1 1
33、2 2即两品种的割胶产量即两品种的割胶产量没有显著差别。对没有显著差别。对HA:1 1 2 2;l(2)(2)规定显著水平规定显著水平=0.01=0.01;l(3)(3)检验计算:检验计算:l(4)(4)推断推断:现实得现实得|u|u0.01 2.58,P0.01,故,故否否定定H H0 0,接受接受H HA A,即两个橡胶品种的割胶产量存在极显,即两个橡胶品种的割胶产量存在极显著的差别,由于著的差别,由于 ,所以可以得出,所以可以得出“42426767RRIM603”RRIM603”的割胶产量显著高于的割胶产量显著高于“42674267PB86”PB86”的结论。的结论。当样本容量当样本容量
34、n n3030且总体方差且总体方差2 2未知未知时,就时,就无法使用无法使用u u检验法对样本平均数进行假设检验,检验法对样本平均数进行假设检验,这时,要检验样本平均数这时,要检验样本平均数 与指定总体平均数与指定总体平均数00的差异显著性,就必须使用的差异显著性,就必须使用t t检验法检验法。l在生物学研究中,由于试验条件和研究对象的在生物学研究中,由于试验条件和研究对象的限制,有许多研究的样本容量都限制,有许多研究的样本容量都很难达到很难达到3030,因此,采用因此,采用小样本平均数的小样本平均数的t t检验法检验法在生物学在生物学研究中具有重要的意义。研究中具有重要的意义。xl检验总体方
35、差检验总体方差2 2未知未知,样本容量样本容量n n3030的平均的平均数数是否属于平均数为是否属于平均数为0 0的指定总体的一种的指定总体的一种t t分布分布。因为小样本的。因为小样本的S S2 2和和2 2相差较大,相差较大,故故遵循自由度遵循自由度d d=n-1=n-1的的t t分布分布。例例4.54.5 某鱼塘水中的含氧量,某鱼塘水中的含氧量,多年平均多年平均为为4.5mg4.5mg,现在该鱼塘设,现在该鱼塘设1010个点个点采集水样,采集水样,测定水中含氧量分别为:测定水中含氧量分别为:4.334.33,4.624.62,3.893.89,4.144.14,4.784.78,4.64
36、4.64,4.524.52,4.554.55,4.484.48,4.26 mgL-14.26 mgL-1,试检验该次抽样测定的水中含,试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。氧量与多年平均值有无显著差别。xl分析:分析:此题此题2 2未知,且未知,且n nl0l0,为小样本,为小样本,故用故用t t检验检验;又该次测定的水中含氧量;又该次测定的水中含氧量可能可能高于也可能低高于也可能低干多年平均值,故用干多年平均值,故用双尾检双尾检验验。l(1)(1)假设假设H0:0 0=4.5mg.L=4.5mg.L-1-1,即该即该次测定的水中含氧量与多年平均值没有显次测定的水中含氧量与多
37、年平均值没有显没有显著差别。对没有显著差别。对HA:0 0;l(2)(2)选取显著水平选取显著水平=0.05=0.05;l(3)(3)检验计算:检验计算:,当,当d dn-1n-19 9时,时,t t0.050.052.2622.262,现实得,现实得|t|t|t t0.050.05,故,故P P0.050.05;l(4)(4)推断推断:接受接受H0,认为该次抽样测定的鱼,认为该次抽样测定的鱼塘水中含氧量与多年平均含氧量塘水中含氧量与多年平均含氧量没有显著差没有显著差别别,与与相差相差0.079mgL0.079mgL-1属于属于随机误差随机误差。xl成组数据资料的特点成组数据资料的特点:是指两
38、个样本的:是指两个样本的各个变量是各个变量是从各自总体从各自总体中抽取的,中抽取的,两个两个样本之间的变量没有任何关联样本之间的变量没有任何关联,即两个,即两个抽样样本抽样样本彼此独立彼此独立。这样,。这样,不论两样本不论两样本的容量是否相同,所得数据皆为成组数的容量是否相同,所得数据皆为成组数据据。两组数据以。两组数据以组平均数组平均数进行相互比较,进行相互比较,来检验其差异的显著性。来检验其差异的显著性。l当总体方差当总体方差1 12 2和和2 22 2已知已知,或或总体方差总体方差1 12 2和和2 22 2未知未知,但两个样本但两个样本均为均为大样本大样本时时,采用采用u u检验法检验
39、法检验两组平均数的差异检验两组平均数的差异显著性。显著性。l这里讨论当总体方差这里讨论当总体方差1 12 2和和2 22 2未知未知,且两样本为且两样本为小样本小样本(n(n1 13030,n n2 230)30),进行进行两组平均数两组平均数差异显著性检验的差异显著性检验的t t检验法。检验法。l首先,用样本方差首先,用样本方差和和进行进行加权加权求出求出平均数差数的方差平均数差数的方差,作为对,作为对的估计,的估计,计算公式为:计算公式为:(4.9,5.6)(4.9,5.6)(4.10,5.7)(4.11,5.8)(4.12,5.9A)l例例4.64.6 用高蛋白和低蛋白两种饲料饲养一月用
40、高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的龄大白鼠,在三个月时,测定两组大白鼠的增重量增重量(g),两组的数据分别为:,两组的数据分别为:(4.13,5.9B)高蛋白组:高蛋白组:134,146,106,119,124,161,l07,83,113,129,97,123;低蛋白组:低蛋白组:70,118,101,85,107,132,94。试问两种饲料饲养的大白鼠增重量是否试问两种饲料饲养的大白鼠增重量是否有差别有差别?l分析:分析:本题本题1 12 2和和2 22 2未知,且为未知,且为小样本小样本,用用t t检验检验;又;又事先不知事先不知两种饲料饲养的大白两种饲
41、料饲养的大白鼠增重量鼠增重量孰高孰低孰高孰低,故用,故用双尾检验双尾检验。l(1)(1)假设假设H0:1 1 2 2,即两种饲料饲养,即两种饲料饲养的大白鼠体重没有显著差别。对的大白鼠体重没有显著差别。对HA:1 1 2 2;l(2)(2)规定显著水平规定显著水平=0.05=0.05;l(3)(3)检验计算:检验计算:l(4)(4)推断推断:接令接令H0,认为两种饲料饲,认为两种饲料饲养大白鼠的增重量养大白鼠的增重量没有显著差别。没有显著差别。l这种情况仍可用这种情况仍可用t t检验检验法,其计算也与法,其计算也与可假设两总体方差可假设两总体方差12=22的情况一样,的情况一样,只是在只是在查
42、查t t值表值表时,所用自由度时,所用自由度d dn-n-1 1,而,而不是不是2(n-1)。l例例4.74.7 两小麦品种千粒重两小麦品种千粒重(g)的调查结果的调查结果如下:如下:品种甲:品种甲:50,47,42,43,39,5l,43,38,44,37;品种乙:品种乙:36,38,37,38,36,39,37,35,33,37。试检验两品种的干粒重有无显著差异。试检验两品种的干粒重有无显著差异。l分析:分析:此题此题n1=n2=10,经,经F F检验检验,得知,得知两品种千粒重的两品种千粒重的方差有显著的不同方差有显著的不同。l(1)(1)假设假设H0:1 2,即两品种的千粒重没,即两品
43、种的千粒重没有显著差别。对有显著差别。对HA:;l(2)(2)取显著水平取显著水平=0.05=0.05;l(3)检验计算:检验计算:l查附表查附表4 4,d 10-19,现实得,现实得|t|,故,故P P0.050.05l(4)(4)推断:否定推断:否定H0,接受接受HA,认为两品,认为两品种千粒重有显著差异,甲品种的千粒重种千粒重有显著差异,甲品种的千粒重显著高于乙品种。显著高于乙品种。l这种情况所构成的这种情况所构成的统计数统计数t t不再服从相应的不再服从相应的t t分布分布,只能进行,只能进行近似的近似的t t检验检验。由于。由于1 12 2 2 22 2,所以两样本平均数差数的标准误
44、,所以两样本平均数差数的标准误不能使用加权方差,需用两个样本方差不能使用加权方差,需用两个样本方差S12和和S12分别估计总体方差分别估计总体方差12和和22,即有:,即有:(4.14,5.10)作作t t检验时,需先计算检验时,需先计算R R和和d d:式式4.17的的t d近似服从于近似服从于t分布,其自由度为分布,其自由度为d,查,查t值表得值表得t (d),临界值。,临界值。(4.15,5.11)(4.16)(4.17,5.12A)l例例4 48 8 测定冬小麦东方红测定冬小麦东方红3号的蛋白质含号的蛋白质含量量()10次,得次,得 ,S121.621;测定农大测定农大193的蛋白质含
45、量的蛋白质含量5次,次,得得 ,S22 0.135。试检验两品种。试检验两品种蛋白质含量是否有显著差异。蛋白质含量是否有显著差异。l分析:分析:经经F检验,得知两品种蛋白质含量检验,得知两品种蛋白质含量的的方差有显著的不同方差有显著的不同,又由于,又由于n1 n2,故,故需计算需计算t d,作,作近似的近似的t t检验检验。使用。使用双尾双尾检检验。验。l(1)(1)假设假设H0:1 1 2 2即两品种蛋白质含即两品种蛋白质含量没有显著差别。对量没有显著差别。对HA:1 12 2;l(2)(2)取显著水平取显著水平=0.01=0.01;l(3)(3)检验计算:检验计算:(4)(4)推断推断:否
46、定否定H0,接受接受HA,认为,认为两品种蛋白质含量两品种蛋白质含量有极显著差异有极显著差异。l成对数据的比较要求成对数据的比较要求两样本间配偶成对两样本间配偶成对,每一对除随机地给予不同处理外,每一对除随机地给予不同处理外,其他试其他试验条件应尽量一致验条件应尽量一致。l成对数据特点成对数据特点:由于同一配对内两个供试由于同一配对内两个供试单位的试验条件非常接近,而不同配对间单位的试验条件非常接近,而不同配对间的条件差异又可以通过各个配对差数予以的条件差异又可以通过各个配对差数予以消除,因而,可以控制试验误差,具有较消除,因而,可以控制试验误差,具有较高精确度。高精确度。设两样本的变量分别为
47、设两样本的变量分别为x1和和x2,共配,共配成成n n对,各对的差数为对,各对的差数为d d,则,则样本差数平均数样本差数平均数 为:为:(4.18)(4.19)(4.20,5.14)(4.21,5.15A)(4.22,5.15B)例例4 49 9 在研究饮食中缺乏维生素在研究饮食中缺乏维生素E与肝中与肝中维生素维生素A的关系时,将试验动物按性别、的关系时,将试验动物按性别、体重等配成体重等配成8 8对对,并将每对中的两头试验,并将每对中的两头试验动物用随机分配法分配在正常饲料组和动物用随机分配法分配在正常饲料组和维生素维生素E缺乏组,然后将试验动物杀死,缺乏组,然后将试验动物杀死,测定其肝中
48、的维生素测定其肝中的维生素A的含量,其结果的含量,其结果如表如表4-1,试,试检验两组饲料对试验动物检验两组饲料对试验动物肝中维生素肝中维生素A A含量的作用是否有显著差异。含量的作用是否有显著差异。l分析分析:此题为此题为配对配对数据,因两组饲料对试验数据,因两组饲料对试验动物肝中维生索动物肝中维生索A含量的作用孰大孰小,含量的作用孰大孰小,事事先并不明确先并不明确,故用,故用双尾双尾检验。检验。l(1)(1)假设假设H0:d 0,两组饲料对试验动物,两组饲料对试验动物肝中维生索肝中维生索A含量的作用含量的作用没有显著差别。对没有显著差别。对HA:;l(2)(2)确定显著水平确定显著水平=0
49、.01=0.01;l(3)(3)检验计算:检验计算:(4)(4)推断推断:否定否定H0:,接受接受HA:u ud d 0 0,即两组饲料对试验动物肝中维生,即两组饲料对试验动物肝中维生素素A含量的作用含量的作用有极显著差异有极显著差异,用正常饲,用正常饲料饲养的试验动物肝中的维生素料饲养的试验动物肝中的维生素A含量含量显显著高于著高于维生素维生素E缺乏组饲养的试验动物肝缺乏组饲养的试验动物肝中的维生素中的维生素A含量。含量。l在生物学研究中,有许多试验或调查结果是用在生物学研究中,有许多试验或调查结果是用频率频率(或或百分数百分数、成数成数)表示的表示的。比如总体或样。比如总体或样本中的个体本
50、中的个体分属两种属性分属两种属性,象药剂处理后害虫,象药剂处理后害虫的死与活、种子的发芽与不发芽、动物的雌与的死与活、种子的发芽与不发芽、动物的雌与雄、试验的成功与失败等,类似这些性状组成雄、试验的成功与失败等,类似这些性状组成的总体通常的总体通常服从二项分布服从二项分布,因此叫二项总体,因此叫二项总体,即由即由“非此即彼非此即彼”组成的总体。组成的总体。l有些总体中的个体有多个属性,但可根据研究有些总体中的个体有多个属性,但可根据研究目的经适当的统计处理分为目的经适当的统计处理分为“目标性状目标性状”和和“非目标性状非目标性状”两种属性,也可看作二项总体。两种属性,也可看作二项总体。l在二项