1、第五章统计假设测验第五章统计假设测验-统计推断统计推断第一节第一节 统计假设测验的基本原理统计假设测验的基本原理第二节第二节 平均数的假设测验平均数的假设测验第三节第三节 二项资料的百分数假设测验二项资料的百分数假设测验第四节第四节 参数的区间估计参数的区间估计第一节统计假设测验的基本原理第一节统计假设测验的基本原理一、统计假设的基本概念一、统计假设的基本概念二、统计假设测验的基本方法二、统计假设测验的基本方法三、两尾测验与一尾测验。三、两尾测验与一尾测验。四、假设测验的两类错误四、假设测验的两类错误一、统计假设的基本概念一、统计假设的基本概念 所谓所谓统计假设统计假设(statistical
2、 hypothesis)(statistical hypothesis)是指有关某一总体是指有关某一总体参数的假设。例如假设某小麦新品种的产量和原地方品种参数的假设。例如假设某小麦新品种的产量和原地方品种的产量一样,或者比旧地方品种更好。的产量一样,或者比旧地方品种更好。单个平均数的假设单个平均数的假设适于统计测验的假设适于统计测验的假设 两个平均数相比较的假设两个平均数相比较的假设 (一一)单个平均数的假设单个平均数的假设 一个样本是从一个具有平均数一个样本是从一个具有平均数 的总体中随机抽的总体中随机抽出的,记作:出的,记作:。例如:。例如:(1)某一小麦品种的产量具有原地方品种的产量,某
3、一小麦品种的产量具有原地方品种的产量,这指新品种的产量表现乃原地方品种产量表现的一个随这指新品种的产量表现乃原地方品种产量表现的一个随机样本,其平均产量机样本,其平均产量 等于某一指定值等于某一指定值 ,故记,故记为为 。(2)某一棉花品种的纤维长度某一棉花品种的纤维长度()具有工业上某一具有工业上某一指定的标准指定的标准(),这可记为,这可记为 。000:H00:H0CH:0C(二二)两个平均数相比较的假设两个平均数相比较的假设 两个样本乃从两个具有相等参数的总体中随机抽出两个样本乃从两个具有相等参数的总体中随机抽出的,记为的,记为 或或 。例如:。例如:(1)两个小麦品种的产量是相同的。两
4、个小麦品种的产量是相同的。(2)两种杀虫药剂对于某种害虫的药效是相等的。两种杀虫药剂对于某种害虫的药效是相等的。210:H 上述两种假设称为上述两种假设称为无效假设无效假设(null hypothesis)(null hypothesis)。因为假设。因为假设总体参数总体参数(平均数平均数)与某一指定值相等或假设两个总体参数相与某一指定值相等或假设两个总体参数相等,即假设其没有效应差异,或者说实得差异是由误差造等,即假设其没有效应差异,或者说实得差异是由误差造成的。成的。0:210H 和无效假设相对应的应有一个统计假设,叫和无效假设相对应的应有一个统计假设,叫对应对应假设假设或或备择假设备择假
5、设(alternative hypothesis)(alternative hypothesis),记作,记作 或或 。如果否定了无效假设,则必接受备择假设;同理,如果否定了无效假设,则必接受备择假设;同理,如果接受了无效假设,当然也就否定了备择假设。如果接受了无效假设,当然也就否定了备择假设。0:AH21:AH二、统计假设测验的基本方法二、统计假设测验的基本方法-步骤步骤 (一一)对所研究的总体首先提出一个统计假设对所研究的总体首先提出一个统计假设 (二二)在承认上述无效假设的前提下,获得平均数在承认上述无效假设的前提下,获得平均数的抽样分布,计算该假设正确的概率的抽样分布,计算该假设正确的
6、概率 (三三)根据根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原理原理接受或否定假设接受或否定假设 下面以一个例子说明假设测验方法的具体内容。下面以一个例子说明假设测验方法的具体内容。设某地区的当地小麦品种一般设某地区的当地小麦品种一般667m2产产300kg,即,即当地品种这个总体的平均数当地品种这个总体的平均数 =300(kg),并从多年种植,并从多年种植结果获得其标准差结果获得其标准差=75(kg),而现有某新品种通过,而现有某新品种通过25个个小区的试验,计得其样本平均产量为每小区的试验,计得其样本平均产量为每667m2330kg,即即 =330,那么新品种样本所属总体
7、与,那么新品种样本所属总体与 =300的当地品的当地品种这个总体是否有显著差异呢?以下将说明对此假设进种这个总体是否有显著差异呢?以下将说明对此假设进行统计测验的方法。行统计测验的方法。0y0 (一一)对所研究的总体首先提出一个无效假设对所研究的总体首先提出一个无效假设 通常所做的无效假设常为所比较的两个总体间无差异。通常所做的无效假设常为所比较的两个总体间无差异。测验单个平均数,则假设该样本是从一已知总体测验单个平均数,则假设该样本是从一已知总体(总体平均总体平均数为指定值数为指定值 )中随机抽出的,即中随机抽出的,即 。如上例,即。如上例,即假定新品种的总体平均数假定新品种的总体平均数 等
8、于原品种的总体平均数等于原品种的总体平均数=300kg,而样本平均数和之间的差数:,而样本平均数和之间的差数:330300=30(kg)属属随机误差;对应假设则为随机误差;对应假设则为 。如果测验两个平均数,则假设两个样本的总体平均数相等,如果测验两个平均数,则假设两个样本的总体平均数相等,即即 ,也就是假设两个样本平均数的差数,也就是假设两个样本平均数的差数 属随机误差,而非真实差异;其对应假设则为属随机误差,而非真实差异;其对应假设则为 。000:H00:AH210:H21yy 21:AH (二二)在承认上述无效假设的前提下,获得平均数的在承认上述无效假设的前提下,获得平均数的抽样分布,计
9、算假设正确的概率抽样分布,计算假设正确的概率 先承认无效假设,从已知总体中抽取样本容量为先承认无效假设,从已知总体中抽取样本容量为n=25的样本,该样本平均数的抽样分布具正态分布形状,的样本,该样本平均数的抽样分布具正态分布形状,平均数平均数 =300(kg),标准误,标准误 =15(kg)。通过试验,如果新品种的平均产量很接近。通过试验,如果新品种的平均产量很接近300 kg,例如,例如301kg或或299kg等,则试验结果当然与假设相符,等,则试验结果当然与假设相符,于是应接受于是应接受H0。如果新品种的平均产量为。如果新品种的平均产量为500kg,与总,与总体假设相差很大,那当然应否定体
10、假设相差很大,那当然应否定H0。但如果试验结果与。但如果试验结果与总体假设并不相差悬殊总体假设并不相差悬殊,就要借助于概率原理,具体做就要借助于概率原理,具体做法有以下两种:法有以下两种:y2575ny1.计算概率计算概率 在假设在假设 为正确的条件下,根据的抽样分布算出为正确的条件下,根据的抽样分布算出获得获得 =330kg的概率,或者说算得出现随机误差的概率,或者说算得出现随机误差 =30(kg)的概率:在此,根据的概率:在此,根据u 测验公式可算得:测验公式可算得:0Hy0y 因为假设是新品种产量有大于或小于当地品种产量的可能因为假设是新品种产量有大于或小于当地品种产量的可能性,所以需用
11、两尾测验。性,所以需用两尾测验。查附表查附表3,当,当u=2时,时,P(概率概率)界于界于0.04和和0.05之间,即这之间,即这一试验结果:一试验结果:=30(kg),属于抽样误差的概率小于,属于抽样误差的概率小于5%。0y215300330yyu2.计算接受区和否定区计算接受区和否定区 在假设在假设H0为正确的条件下,根据为正确的条件下,根据 的的抽样分布划出一个区间,如抽样分布划出一个区间,如 在这一区间内则接受在这一区间内则接受H0,如,如 在在这一区间外则否定这一区间外则否定H0。如何确定这一区间呢?如何确定这一区间呢?yyyyyyu根据上章所述根据上章所述 和和 的分布,可知:的分
12、布,可知:95.096.196.1yyyP025.096.1yyP025.096.1yyP025.0)96.1(yyP025.0)96.1(yyP 因此,在因此,在 的抽样分布中,落在的抽样分布中,落在()区间内的有区间内的有95%,落在这一区间外的只有,落在这一区间外的只有5%。yyy96.196.1,如果以如果以5%概率作为接受或否定概率作为接受或否定H0的界限,则上述区间的界限,则上述区间()为接受假设的区域,简称为接受假设的区域,简称接受区接受区(acceptance region)(acceptance region);和和 为否定为否定假设的区域,简称假设的区域,简称否定区否定区(
13、rejection region)(rejection region)。yy96.196.1,yy96.1yy96.1 同理,若以同理,若以1%作为接受或否定作为接受或否定H0的界限,则的界限,则()为接受区域,为接受区域,和和 为否定区域。为否定区域。yy58.258.2,yy58.2yy58.2 所以在测验时需先计算所以在测验时需先计算1.96 或或2.58 ,然后从,然后从 加加上和减去上和减去1.96 或或2.58 ,即得两个否定区域的临界值。,即得两个否定区域的临界值。yyyyy2552702853003153303450.000.010.020.03fN(y)y329.4270.6
14、否定区 域 2.5%否定区 域 2.5%接 受 区 域 如上述小麦新品种例,如上述小麦新品种例,=300,,1.96 =29.4(kg)。因之,。因之,它的两个它的两个2.5%概率概率的否定区域为的否定区域为 30029.4和和 300+29.4,即,即大于大于329.4(kg)和小于和小于270.6(kg)的概率只有的概率只有5%(见图见图5.1)。0y15yyy图图5.1 5%显著水平假设测验图示显著水平假设测验图示(表示接受区域和否定区域)(表示接受区域和否定区域)(三三)根据根据“小概率事件实际上不可能发生小概率事件实际上不可能发生”原理接受或否定假设原理接受或否定假设 当当 由随机误
15、差造成的概率小于由随机误差造成的概率小于5%或或1%时,就可时,就可认为它不可能属于抽样误差,从而否定假设。认为它不可能属于抽样误差,从而否定假设。如果因随机误差而得到某差数的概率如果因随机误差而得到某差数的概率P0.05,则称这个,则称这个差数是显著的。如果因随机误差而得到某差数的概率差数是显著的。如果因随机误差而得到某差数的概率P0.01,则称这个差数是极显著的。而这种假设测验也叫显著性测验。则称这个差数是极显著的。而这种假设测验也叫显著性测验。用来测验假设的概率标准用来测验假设的概率标准5%或或1%等,称为等,称为显著水平显著水平(significance level)(signific
16、ance level)。一般以一般以 表示,如表示,如 =0.05或或 =0.01。y综合上述,统计假设测验的步骤可总结如下:综合上述,统计假设测验的步骤可总结如下:(1)对样本所属的总体提出统计假设,包括无效假设和备对样本所属的总体提出统计假设,包括无效假设和备择假设。择假设。(2)规定测验的显著水平规定测验的显著水平 值。值。(3)在在 为正确的假定下,根据平均数为正确的假定下,根据平均数()或其他统计数或其他统计数的抽样分布,如为正态分布的则计算正态离差的抽样分布,如为正态分布的则计算正态离差u值。由值。由u值查值查附表附表3即可知道因随机抽样而获得实际差数即可知道因随机抽样而获得实际差
17、数(如如 等等)由误差由误差造成的概率。或者根据已规定概率,如造成的概率。或者根据已规定概率,如 =0.05,查出查出u=1.96,因而划出两个否定区域为因而划出两个否定区域为:和和 (4)将规定的将规定的 值和算得的值和算得的u值的概率相比较,或者将试值的概率相比较,或者将试验结果和否定区域相比较,从而作出接受或否定无效假设的验结果和否定区域相比较,从而作出接受或否定无效假设的推断。推断。0Hyyyy96.1yy96.1三、两尾测验与一尾测验三、两尾测验与一尾测验 如果统计假设为如果统计假设为 ,则备择假设为则备择假设为 ,在在假设测验时所考虑的概率为曲线左边一尾概率假设测验时所考虑的概率为
18、曲线左边一尾概率(小于小于 )和右和右边一尾概率边一尾概率(大于大于 )的总和。这类测验称为的总和。这类测验称为两尾测验两尾测验(two-(two-tailed test)tailed test),它具有两个否定区域。,它具有两个否定区域。00:H0:AH00 如果统计假设为如果统计假设为 ,则其对应的备择假设必则其对应的备择假设必为为 。因而,这个对应的备择假设仅有一种可能性。因而,这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域,即曲线的右边一尾。这类测而统计假设仅有一个否定区域,即曲线的右边一尾。这类测验称验称一尾测验一尾测验(one-tailed test)(one-tai
19、led test)。一尾测验还有另一种情况,。一尾测验还有另一种情况,即即 ,,这时否定区域在左边一尾这时否定区域在左边一尾.作一尾测验时,需将附表作一尾测验时,需将附表3列出的两尾概率乘以列出的两尾概率乘以2,再查,再查出其出其u值。值。00:H0:AH00:H0:AH四、假设测验的两类错误四、假设测验的两类错误表5.1 假设测验的两类错误测验结果测验结果如果如果H0是正确的是正确的如果如果H0是错误的是错误的H0被否定被否定 第一类错误第一类错误 没有错误没有错误H0被接受被接受 没有错误没有错误 第二类错误第二类错误 第一类错误的概率为显著水平第一类错误的概率为显著水平 值。值。第二类错
20、误的概率为第二类错误的概率为 值。值。值的计算方法就是计算值的计算方法就是计算抽样平均数落在已知总体的接受区的概率抽样平均数落在已知总体的接受区的概率(这里的已知总体这里的已知总体是假定的是假定的)。例:已知总体的均值例:已知总体的均值 =300,其平均数抽样标准误为,其平均数抽样标准误为15,被抽样总体的平均数被抽样总体的平均数 315kg、标准误也为、标准误也为15,由此可以画,由此可以画出这两个总体的分布曲线如图出这两个总体的分布曲线如图5.2,图中标出了已知总体的接,图中标出了已知总体的接受区域在受区域在c1和和c2之间。由于两个总体的平均数不同,这种可能之间。由于两个总体的平均数不同
21、,这种可能性正是第二类错误的概率值,其一般计算方法为:性正是第二类错误的概率值,其一般计算方法为:09621531562701.u9601531543292.u查附表查附表2,P(u12.96)=0.0015,P(u20.96)=0.8315,故有故有 =P(u20.96)P(u1 2.96)=0.83150.0015=0.83或或83%25527028530031533034536083%c2c1图图5.2 :=300是错误时的是错误时的 值值0 0H关于两类错误的讨论可总结如下:关于两类错误的讨论可总结如下:(1)在样本容量在样本容量n固定的条件下,提高显著水平固定的条件下,提高显著水平
22、(取较小的取较小的值值),如从,如从5%变为变为1%则将增大第二类错误的概率则将增大第二类错误的概率 值。值。(2)在在n和显著水平和显著水平 相同的条件下,真总体平均数相同的条件下,真总体平均数 和假设和假设平均数平均数 的相差的相差(以标准误为单位以标准误为单位)愈大,则犯第二类错误的概愈大,则犯第二类错误的概率率 值愈小。值愈小。(3)为了降低犯两类错误的概率,需采用一个较低的显著水为了降低犯两类错误的概率,需采用一个较低的显著水平,如平,如 =0.05;同时适当增加样本容量,或适当减小总体方;同时适当增加样本容量,或适当减小总体方差差 ,或两者兼有之。,或两者兼有之。(4)如果显著水平
23、如果显著水平 已固定下来,则改进试验技术和增加样已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。本容量可以有效地降低犯第二类错误的概率。02第二节第二节 平均数的假设测验平均数的假设测验一、一、t 分布分布二、单个样本平均数的假设测验二、单个样本平均数的假设测验三、两个样本平均数相比较的假设测验三、两个样本平均数相比较的假设测验一、一、t 分布分布 从一个平均数为从一个平均数为 、方差为、方差为 的正态总体中抽样,的正态总体中抽样,2y),(2yNyyu (2)当样本容量不太大当样本容量不太大(n30)而而 为未知时,以样本均为未知时,以样本均方方 估计估计 ,则其标
24、准化离差,则其标准化离差 的分布不呈正态,的分布不呈正态,而作而作 t 分布,具有自由度分布,具有自由度DF=n-1。(1)样本平均数样本平均数 的分布必趋向正态分布的分布必趋向正态分布 ,并且并且 遵循正态分布遵循正态分布N(0,1)。22s2ysy)(ysyt(51)nssy 为样本平均数的标准误,为样本平均数的标准误,s为样本标准差,为样本标准差,n为样本容量。为样本容量。t 分布分布(t-distribution)是是1908年年.S.Gosset首先提出的,又首先提出的,又叫学生氏分布叫学生氏分布(students t distribution)。它是一组对称密度函数。它是一组对称密
25、度函数曲线,具有一个单独参数曲线,具有一个单独参数 以确定某一特定分布。以确定某一特定分布。v 是自由度。是自由度。在理论上,当在理论上,当v 增大时,增大时,t 分布趋向于正态分布。分布趋向于正态分布。t 分布的密度函数为:分布的密度函数为:t 分布的平均数和标准差为:分布的平均数和标准差为:(54)2210)()(假定假定假定假定tt)()1(2)2(2)1()()21(2t t!/!/tf(53)-4-20240.000.050.100.150.200.250.300.350.400.45t分布(df=4)正 态分布图图5.5 标准化正态分布与自由度为标准化正态分布与自由度为4 4的的t
26、 t分布曲线分布曲线 t 分布曲线是对称的,分布曲线是对称的,围绕其平均数围绕其平均数 向两向两侧递降。和正态曲线比较,侧递降。和正态曲线比较,t 分布曲线稍为扁平,峰分布曲线稍为扁平,峰顶略低,尾部稍高顶略低,尾部稍高(图图5.5)。t 分布是一组随自由度分布是一组随自由度v 而改变的曲线,但当而改变的曲线,但当v30时接近正态曲线,当时接近正态曲线,当v=时和正态曲时和正态曲0t线合一。由于线合一。由于t 分布受自由度制约,所以分布受自由度制约,所以t 值与其相应的概率值与其相应的概率也随自由度而不同。也随自由度而不同。t 分布的概率累积函数为:分布的概率累积函数为:dttftF)()(5
27、5)和正态概率累积函数一样,和正态概率累积函数一样,t 分布的概率累积函数也分一分布的概率累积函数也分一尾表和两尾表。计算尾表和两尾表。计算 于给定于给定 t0 值时值时 t000tdttfttPtF)()()(因而因而t 分布曲线右尾从分布曲线右尾从 t 到到的面积为的面积为1Fv(t),而两尾面积,而两尾面积则为则为21Fv(t)在在t 表中,若表中,若v相同,则相同,则P越大,越大,t 越小;越小;P越小,越小,t 越大。越大。因此在假设测验时,若算得的因此在假设测验时,若算得的|t|,则接受无效假设。,则接受无效假设。t二、单个样本平均数的假设测验二、单个样本平均数的假设测验 测验某一
28、样本测验某一样本 所属总体平均数是否和某一指定的所属总体平均数是否和某一指定的总体平均数相同。总体平均数相同。y 例例5.1 某春小麦良种的千粒重某春小麦良种的千粒重 34g,现自外地,现自外地引入一高产品种,在引入一高产品种,在8个小区种植,得其千粒重个小区种植,得其千粒重(g)为:为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问,问新引入品种的千粒重与当地良种有无显著差异?新引入品种的千粒重与当地良种有无显著差异?0 这里总体这里总体 为未知,又是小样本,故需用为未知,又是小样本,故需用t 测验;又测验;又新引入品种千粒重可能高于也可能低于当地良种,故
29、需作新引入品种千粒重可能高于也可能低于当地良种,故需作两尾测验。测验步骤为:两尾测验。测验步骤为:2 H0:新引入品种千粒重与当地良种千粒重指定值相同,:新引入品种千粒重与当地良种千粒重指定值相同,即即 34g;或简记作;或简记作H0:34g;对;对HA:34g。0显著水平显著水平 =0.05。测验计算:测验计算:g.s641188318g.sy5808641069258034235.t 查附表查附表4,v=7时,时,t0.05=2.365。现实得。现实得|t|0.05。推断:接受推断:接受H0:34g,即新引入品种千粒重与当地良种千,即新引入品种千粒重与当地良种千粒重指定值没有显著差异。粒重
30、指定值没有显著差异。g././.y235872818)634637635(83188)7281(6346376352222./.SS三、两个样本平均数相比较的假设测验三、两个样本平均数相比较的假设测验 由两个样本平均数的相差,以测验这两个样本所属由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。的总体平均数有无显著差异。测验方法测验方法 成组数据的平均数比较成组数据的平均数比较 成对数据的比较成对数据的比较(一一)成组数据的平均数比较成组数据的平均数比较 如果两个处理为完全随机设计的两个处理,各供试如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本
31、容量是否相同,所单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组得数据皆称为成组数据,以组(处理处理)平均数作为相互比平均数作为相互比较的标准。较的标准。成组数据的平均数比较又依两个样本所属的总体方成组数据的平均数比较又依两个样本所属的总体方差差(和和 )是否已知、是否相等而采用不同的测验方法。是否已知、是否相等而采用不同的测验方法。2122(1)在两个样本的总体方差在两个样本的总体方差 和和 为已知时,用为已知时,用u测验测验21 22 由抽样分布的公式知,两样本平均数由抽样分布的公式知,两样本平均数 和和 的差数标准的差数标准误误 ,在,在 和和 是已知时为:是已
32、知时为:1y2y21yy 212222212121nnyy并有并有:21)()(2121yyyyu 在假设在假设 下,正态离差下,正态离差u值为值为 ,故可对两样本平均数的差异作出假设测验。故可对两样本平均数的差异作出假设测验。21)(21yyyyu0:210H 例例5.2 据以往资料,已知某小麦品种每平方米产量的据以往资料,已知某小麦品种每平方米产量的 。今在该品种的一块地上用。今在该品种的一块地上用A、B两法取样,法两法取样,法取取12个样点,得每平方米产量个样点,得每平方米产量 =1.2(kg);B法取法取8个样点,得个样点,得 =1.4(kg)。试比较。试比较A、B两法的每平方米产量是
33、否有显著差异?两法的每平方米产量是否有显著差异?22)(4.0kg1y2y 假设假设H0:A、B两法的每平方米产量相同,即两法的每平方米产量相同,即 系随机误差;对系随机误差;对 显著水平显著水平 2.021 yy0:AH05.096.105.0u 4022212.8,1221nn)(28870840124021kg.yy690288704121.u 因为实得因为实得|u|0.05 推断推断:接受接受 ,即即A、B两种取样方法所得的每平方两种取样方法所得的每平方米产量没有显著差异。米产量没有显著差异。210:H0:210H (2)在两个样本的总体方差在两个样本的总体方差 和和 为未知,但为未知
34、,但 (样本方差同质样本方差同质),而两个样本又为小样本时,用),而两个样本又为小样本时,用t 测验。测验。21 22 22221 从样本变异算出平均数差数的均方从样本变异算出平均数差数的均方 ,2es1)(1)()()(21222211nnyyyySSSSse21212(56)其两样本平均数的差数标准误为:其两样本平均数的差数标准误为:221221nsnsseeyy当当 时,时,nnn21nsseyy2221于是有:于是有:21)()(2121yysyyt由于假设由于假设 210:H21)(21yysyyt故故自由度自由度(57)(58)(59A)(59B)1()1(21nn 例例5.3 调
35、查某农场每亩调查某农场每亩30万苗和万苗和35万苗的稻田各万苗的稻田各5块,块,得亩产量得亩产量(单位:单位:kg)于表于表5.2,试测验两种密度亩产量的差异,试测验两种密度亩产量的差异显著性。显著性。表表5.2 两种密度的稻田亩产两种密度的稻田亩产(kg)(kg)y1(30万苗万苗)y2(35万苗万苗)400450420440435445460445425420 假设假设H0:两种密度的总体产量两种密度的总体产量没有差异,即没有差异,即 对对210:H0:AH 显著水平显著水平 =0.05 1y测验计算:测验计算:=428kg =440kg SS1=1930 SS2=550 2y310445
36、5019302es 故故)(136.115310221kgsyy08113611440428.t 查附表查附表4,v=4+4=8时时,t0.05=2.306。现实得现实得|t|=1.080.05。推断:接受假设推断:接受假设 ,两种密度的亩产量没,两种密度的亩产量没有显著差异。有显著差异。210:H 例例5.4 研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区壮素小区8株、对照区玉米株、对照区玉米9株,其株高结果如表株,其株高结果如表5.3。试作假设。试作假设测验。测验。表表5.3 喷矮壮素与否的喷矮壮素与否的玉米株高玉米株高(cm)(cm)y1
37、(喷矮壮素喷矮壮素)y2(对照对照)160170160270200180160250200270170290150270210230170矮壮素只可能矮化无效而不可矮壮素只可能矮化无效而不可能促进植侏长高,因此假设能促进植侏长高,因此假设H0:喷:喷矮壮素的株高与未喷的相同或更高,矮壮素的株高与未喷的相同或更高,即即 对对即喷矮壮素的株高较未喷的为矮,即喷矮壮素的株高较未喷的为矮,作一尾测验。作一尾测验。显著水平显著水平 =0.05。210:H0:AH测验计算:测验计算:=176.3cm =233.3cm SS1=3787.5 SS2=184001y2y故有故有 17.147987537871
38、84002.se)(688.18918117147921cm.syy0536881832333176.t 按按 v=7+8=15,查,查t表得一尾表得一尾 t0.05=1.753(一尾测验一尾测验t0.05等于等于两尾测验的两尾测验的t0.10),现实得现实得 t=3.05t0.05=1.753,P3.106,故,故Pt0.01,故,故P0.01。推断:否定推断:否定 ,接受,接受 ,即,即A、B两法对两法对饨化病毒的效应有极显著差异。饨化病毒的效应有极显著差异。00d:H0dA:H)(387587)12(1)15(个个./d)(99716743167个个.sd 例例5.7 研究某种新肥研究某
39、种新肥料能否比原肥料每亩增产料能否比原肥料每亩增产5kg以上皮棉,选土壤和其以上皮棉,选土壤和其他条件最近似的相邻小区他条件最近似的相邻小区组成一对,其中一区施新组成一对,其中一区施新肥料,另一区施原肥料作肥料,另一区施原肥料作对照,重复对照,重复9次。产量结果次。产量结果见表见表5.5。试测验新肥料能。试测验新肥料能否比原肥料每亩增产否比原肥料每亩增产5kg以以上皮棉?上皮棉?表表5.5 两种肥料的皮棉产量两种肥料的皮棉产量(kg)重复区y1(新肥料)y(对照)d67.460.66.872.866.66.268.464.93.566.061.84.270.861.79.169.667.22.
40、467.262.44.868.961.37.662.656.75.9 因为要测验新肥料能否比对照增产因为要测验新肥料能否比对照增产5kg,故采用一尾测验。,故采用一尾测验。H0:新肥料比对照每亩增收不到:新肥料比对照每亩增收不到5kg,最多,最多5kg,即,即 ;对;对HA:新肥料比对照每亩可增收新肥料比对照每亩可增收5kg以上,即以上,即 。显著水平显著水平 。50d:H5dA:H050.测验计算:测验计算:87070056155.sdtd 按按v=91=8,查,查t表得,表得,t0.05=1.860(一尾概率一尾概率)。现实得。现实得|t|0.05。推断:接受推断:接受 ,即认为新肥料较原
41、肥料每亩增,即认为新肥料较原肥料每亩增收皮棉不超过收皮棉不超过5kg。50d:H)(61595509)952686(公斤/亩公斤/亩././.d)(700)19(99)550(9526862222公斤/亩公斤/亩./.sd 成对数据和成组数据平均数比较的不同成对数据和成组数据平均数比较的不同:(1)成对数据和成组数据平均数比较所依据的条件是不相同成对数据和成组数据平均数比较所依据的条件是不相同的。的。前者是假定各个配对的差数来自差数的分布为正态的总体前者是假定各个配对的差数来自差数的分布为正态的总体,具有具有N(0,);而每一配对的两个供试单位是彼此相关的。;而每一配对的两个供试单位是彼此相关
42、的。后者则是假定两个样本皆来自具有共同后者则是假定两个样本皆来自具有共同(或不同或不同)方差的正方差的正态总体,而两个样本的各个供试单位都是彼此独立的。态总体,而两个样本的各个供试单位都是彼此独立的。(2)在实践上,如将成对数据按成组数据的方法比较,容易在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应属显著的差异。故使统计推断发生第二类错误,即不能鉴别应属显著的差异。故在应用时需严格区别。在应用时需严格区别。2d第三节第三节 二项资料的百分数假设测验二项资料的百分数假设测验 许多生物试验的结果是用百分数或成数表示的,如结实率、许多生物试验的结果是用百分数或
43、成数表示的,如结实率、发芽率等,这些百分数系由计数某一属性的个体数目求得,属发芽率等,这些百分数系由计数某一属性的个体数目求得,属间断性的计数资料间断性的计数资料.在理论上,这类百分数的假设测验应按二项分布进行,即在理论上,这类百分数的假设测验应按二项分布进行,即从二项式从二项式(p+q)n的展开式中求出某项属性个体百分数的概率的展开式中求出某项属性个体百分数的概率 。这样虽精确但麻烦。如样本容量这样虽精确但麻烦。如样本容量n 较大,较大,p不过较小,而不过较小,而np和和nq又均不小于又均不小于5时时,(p+q)n的分布趋近于正态。因而可以将百分的分布趋近于正态。因而可以将百分数资料作正态分
44、布处理,从而作出近似的测验。数资料作正态分布处理,从而作出近似的测验。适于用适于用u测验所需的二项样本容量测验所需的二项样本容量n见表见表5.6。p p pn(样本百分数样本百分数)(较小组次数较小组次数)n(样本容量样本容量)0.5015300.4020500.3024800.20402000.10606000.05701400表表5.6 适于用正态离差测验的二项样本的适于用正态离差测验的二项样本的 和和n值表值表pn一、单个样本百分数一、单个样本百分数(成数成数)的假设测验的假设测验 测验某一样本百分数测验某一样本百分数 所属总体百分数与某一理论值或所属总体百分数与某一理论值或期望值期望值
45、p0的差异显著性。的差异显著性。由于样本百分数的标准误由于样本百分数的标准误 为:为:p p nppp)(100故由故由 pppu0即可测验即可测验H0:p=p0。(516)(517)例例5.8 以紫花和白花的大豆品种杂交,在以紫花和白花的大豆品种杂交,在F2代共得代共得289株,其中紫花株,其中紫花208株,白花株,白花81株。如果花色受一对等位基因控株。如果花色受一对等位基因控制,则根据遗传学原理,制,则根据遗传学原理,F2代紫花株与白花株的分离比率应为代紫花株与白花株的分离比率应为3 1,即紫花理论百分数,即紫花理论百分数p=0.75,白花理论百分数,白花理论百分数q=1p=0.25。问
46、该试验结果是否符合一对等位基因的遗传规律?。问该试验结果是否符合一对等位基因的遗传规律?假设大豆花色遗传符合一对等位基因的分离规律,紫花假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分数是植株的百分数是75%,即,即H0:p=0.75;对;对HA:p0.75。显著水平显著水平 0.05,作两尾测验,作两尾测验,u0.05=1.96。05.0u 测验计算:测验计算:71970289208.p02550289250750.p1910255075071970.u因为实得因为实得|u|0.05。推断:接受推断:接受H0:p=0.75,即大豆花色遗传是符合一对等位,即大豆花色遗传是符合一对等位
47、基因的遗传规律的,紫花植株百分数基因的遗传规律的,紫花植株百分数 =0.72和和p=0.75的相差的相差系随机误差。如果测验系随机误差。如果测验H0:p=0.25,结果完全一样。,结果完全一样。p 以上资料亦可直接用次数进行假设测验。当二项资料以次以上资料亦可直接用次数进行假设测验。当二项资料以次数表示时,数表示时,,npnpqnp故测验计算:故测验计算:于是于是 19136775216208.nppnunp结果同上结果同上)(75216750289株株.np)(367250750289株株.np二、两个样本百分数相比较的假设测验二、两个样本百分数相比较的假设测验 测验两个样本百分数和所属总体
48、百分数测验两个样本百分数和所属总体百分数p1和和p2的差异显著的差异显著性性.一般假定两个样本的总体方差是相等的,即一般假定两个样本的总体方差是相等的,即 ,设,设两个样本某种属性个体的观察百分数分别为两个样本某种属性个体的观察百分数分别为 和和 ,而两样本总体该种属性的个体百分数分别为,而两样本总体该种属性的个体百分数分别为p1和和 p2,则两样本百分数的差数标准误,则两样本百分数的差数标准误 为:为:1p2p2221pp111nyp 222nyp 21pp 22211121nqpnqppp(518)上式中的上式中的q1=(1p1),q2=(1p2)。这是两总体百分数为。这是两总体百分数为已
49、知时的差数标准误公式。已知时的差数标准误公式。如果假定两总体的百分数相同,即如果假定两总体的百分数相同,即 p1=p2=p,q1=q2=q,则:,则:)11(2121nnpqpp p1 和和 p2 未知时,则在未知时,则在 的假定下,可用两样本百的假定下,可用两样本百分数的加权平均值分数的加权平均值 作为作为 p1 和和 p2 的估计。的估计。2221ppppqnnyyp1 2121(520)(519)11(21 21nnqppp因而两样本百分数的差数标准误为:因而两样本百分数的差数标准误为:(521)故由故由2121ppppu即可对即可对 H0:p1=p2 作出假设测验。作出假设测验。(52
50、2)例例5.9 调查低洼地小麦调查低洼地小麦378株株(n1),其中有锈病株,其中有锈病株355株株(y1),锈病率,锈病率93.92%();调查高坡地小麦;调查高坡地小麦396株株(n2),其中有锈病,其中有锈病346株株(y2),锈病率,锈病率87.31%()。试测。试测验两块麦田的锈病率有无显著差异?验两块麦田的锈病率有无显著差异?1 p2 p 假设假设H0:两块麦田的总体锈病率无差别,即:两块麦田的总体锈病率无差别,即 H0:p1=p2;对;对 HA:p1 p2。显著水平取显著水平取 ,作两尾测验,作两尾测验,u0.05=1.96。050.测验计算:测验计算:9060396378346
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。