1、 2检验检验是次数资料显著性检验的方法。它是通是次数资料显著性检验的方法。它是通过提出某种假设,用理论次数与观察次数进行比过提出某种假设,用理论次数与观察次数进行比较,从而确定两者的符合程度。较,从而确定两者的符合程度。2检验检验的分类:的分类:适合性检验适合性检验 独立性检验独立性检验 l(1)适合性检验用来检验某性状观察次数与该性状的理论比率是否符合。l(2)独立性检验 根据次数资料判断两类因子彼此相关或相互独立的假设检验。是次数资料的相关性研究。l l一、一、x 检验的意义检验的意义l 1、定义定义l 2、分类分类l二、二、x 统计量的意义统计量的意义l 1、x 值值度量度量A与与T偏差
2、程度大小偏差程度大小l 2、公式公式l三、三、x分布分布l 1、x 值概率分布值概率分布l 2、特点:特点:、l四、连续性矫正四、连续性矫正案例:统计某羊场一年所产的案例:统计某羊场一年所产的876只羔羊中,有公只羔羊中,有公羔羔428只,母羔只,母羔448只。问其性别比例是否正常。只。问其性别比例是否正常。根据遗传学理论,动物的性别比例是根据遗传学理论,动物的性别比例是1:1。按按1:1的性别比例计算,公、母羔均应为的性别比例计算,公、母羔均应为438只。只。实际观察次数(实际观察次数(A)与与理论次数(理论次数(T)存在一定的存在一定的差异。差异。这是抽样误差,还是本质差异这是抽样误差,还
3、是本质差异?这取决于其偏离程度。这取决于其偏离程度。由于由于A1T110,A2T210,差数之和为,差数之和为0;为避免正负抵消,可将差数平方后再相加:为避免正负抵消,可将差数平方后再相加:(AT)2。其值越大,实际观察次数与理论次数相差亦越大,反之则其值越大,实际观察次数与理论次数相差亦越大,反之则越小。越小。为了弥补基数不同的影响,可先将各差数平方除以相应为了弥补基数不同的影响,可先将各差数平方除以相应的理论次数后再相加,以统计量的理论次数后再相加,以统计量2表示:表示:TTA22)(2越小,表明实际观察次数与理论次数越接近;越小,表明实际观察次数与理论次数越接近;2=0,表示两者完全吻合
4、;,表示两者完全吻合;2越大,表示两者相差越大。越大,表示两者相差越大。2分布分布 2分布的特点:分布的特点:(1)2 0,即,即2 的取值范围是的取值范围是 0,+)。)。(2)2 分布是偏斜分布,随分布是偏斜分布,随df 减少而加剧;当减少而加剧;当df时,曲线时,曲线以纵轴为渐近线。以纵轴为渐近线。(3)df 逐渐增大,曲线趋对称;逐渐增大,曲线趋对称;df=30时,时,x2 分布近于正态分布。分布近于正态分布。l问题:l、什么情况下x2检验需矫正?l、如何矫正?l、为什么?2的连续性矫正的连续性矫正 当当df=1时,计算时,计算2 值必须进行矫正,计算公式为:值必须进行矫正,计算公式为
5、:TTAc22)5.0(原因原因:2分布属于连续型随机变量的概率分布,在对分布属于连续型随机变量的概率分布,在对次数资料进行次数资料进行2检验时,计算所得的检验时,计算所得的2值偏大,概率值偏大,概率偏低,因此需要矫正。偏低,因此需要矫正。当当df1时,可不作连续性矫正,但要求各组内的理时,可不作连续性矫正,但要求各组内的理论次数不小于论次数不小于5。若某组的理论次数小于。若某组的理论次数小于5,则应把它,则应把它与其相邻的一组或几组合并,直到理论次数大于与其相邻的一组或几组合并,直到理论次数大于5为为止。止。第二节第二节 适合性检验适合性检验判断实际观察的属性类别分配是否符合已知属判断实际观
6、察的属性类别分配是否符合已知属 性类别分配理论或学说的假设检验称为性类别分配理论或学说的假设检验称为适合性适合性 检验。检验。遗传学上:遗传学上:一对性状杂种后代的分离现象,一对性状杂种后代的分离现象,:;二对性状杂种后代的分离现象是否符合二对性状杂种后代的分离现象是否符合:;动物性别比动物性别比 :。l(一)建立假设l(二)计算实际x2值l(三)查x2值表,作统计判断l1、x2x20.05 P0.05 l 差异不显著;差异不显著;2、x20.05x2x20.010.01P0.05 l 差异显著;差异显著;*l3、x2x20.01 P0.01 l 差异极显著;差异极显著;*第二节第二节 适合性
7、适合性【例【例7.1】为了研究山羊毛色的遗传规律,用白】为了研究山羊毛色的遗传规律,用白 色山羊与黑色山羊进行杂交,结果在色山羊与黑色山羊进行杂交,结果在260只杂只杂 交子二代中,交子二代中,181只为白色,只为白色,79只为黑色。问只为黑色。问 是否符合孟德尔遗传分离定律。是否符合孟德尔遗传分离定律。(一)建立假设(一)建立假设H0:子二代分离现象符合:子二代分离现象符合3:1的理论比例的理论比例 HA:子二代分离现象不符合:子二代分离现象不符合3:1的理论比例的理论比例第二节第二节 适合性适合性(二)计算公式(二)计算公式 本例的属性类别分类数本例的属性类别分类数k=2(包括白色、黑色)
8、,(包括白色、黑色),则自由度则自由度df=k1=21=1,为了减少偏差,必须采,为了减少偏差,必须采用矫正公式用矫正公式:TTAxc22)5.0(第二节第二节 适合性适合性(三)计算理论数(三)计算理论数 根据根据3:1的理论比例,的理论比例,白色山羊的理论数白色山羊的理论数T1=2603/4=195 黑色山羊的理论数黑色山羊的理论数T2=2601/4=65 第二节第二节 适合性适合性(四四)计算卡方值计算卡方值 739.365)5.06579(195)5.0195118()5.0(2222TTAxc第二节第二节 适合性适合性(五)查临界值,作出统计推断(五)查临界值,作出统计推断 (P13
9、9)当自由度当自由度df=1时,查得。时,查得。84.321005)(x2cx由于,故由于,故P0.05,不能否定,不能否定H0,表明实际观察次数与理论次数差异不显著。表明实际观察次数与理论次数差异不显著。因此,可以认为白色山羊与黑色山羊的比率符合孟德因此,可以认为白色山羊与黑色山羊的比率符合孟德尔遗传分离定律尔遗传分离定律3:1的理论比例。的理论比例。21005)(x2cx第二节第二节 适合性适合性【例【例7.2】在研究牛的毛色(黑色、红色)和角】在研究牛的毛色(黑色、红色)和角(无角、有角)这两对相对性状的分离现象时,用黑(无角、有角)这两对相对性状的分离现象时,用黑色无角牛与红色有角牛进
10、行杂交,结果在色无角牛与红色有角牛进行杂交,结果在360头子二头子二代中,黑色无角牛有代中,黑色无角牛有192头,黑色有角牛有头,黑色有角牛有78头,红头,红色无角牛有色无角牛有72头,红色有角牛头,红色有角牛18头。问这两对性状是头。问这两对性状是否符合孟德尔遗传规律中否符合孟德尔遗传规律中9:3:3:1的比例。的比例。第二节第二节 适合性适合性(一)建立假设(一)建立假设H0:实际观察次数之比符合:实际观察次数之比符合9:3:3:1的理论比例的理论比例HA:实际观察次数之比不符合:实际观察次数之比不符合9:3:3:1的理论比例的理论比例第二节第二节 适合性适合性(二)计算公式(二)计算公式
11、 本例的属性类别分类数本例的属性类别分类数k=4,因此自由度因此自由度df=k-1=4-1=3,可采用一般公式,可采用一般公式 TTAx22)(第二节第二节 适合性适合性(三)计算理论数(三)计算理论数 根据根据9:3:3:1的理论比例,的理论比例,黑色无角牛的理论数黑色无角牛的理论数 T1=3609/16=202.5 黑色有角牛的理论数黑色有角牛的理论数 T2=3603/16=67.5 红色无角牛的理论数红色无角牛的理论数 T3=3603/16=67.5 红色有角牛的理论数红色有角牛的理论数 T4=3601/16=22.5第二节第二节 适合性适合性(四四)计算计算 类型类型实际观察次实际观察
12、次数数(A)理论次数理论次数(T)A-T黑色无角牛黑色无角牛黑色有角牛黑色有角牛红色无角牛红色无角牛红色有角牛红色有角牛 1927872 18 202.567.567.5 22.5-10.5+10.5+4.5 -4.5 0.54441.63330.3 0.9 总计 360 36003.377 表表7-3 计算表计算表 2xTTA2)(2x第二节第二节 适合性适合性(五)查临界值,作出统计推断(五)查临界值,作出统计推断 (P346)当自由度当自由度df=3时,查得。时,查得。由于由于 ,故,故P0.05,不能否定,不能否定H0,表明,表明实际观察次数与理论次数差异不显著。因此,可以认为毛实际观
13、察次数与理论次数差异不显著。因此,可以认为毛色与角的有无两对性状杂交二代的分离现象符合孟德尔遗色与角的有无两对性状杂交二代的分离现象符合孟德尔遗传规律中传规律中9:3:3:1的理论比例。的理论比例。2x81.723005)(x2x23005)(x第七章第七章 2检验检验第三节第三节 独立性检验独立性检验独立性检验的意义独立性检验的意义 根据次数资料判断两类因子彼此相关或相互独根据次数资料判断两类因子彼此相关或相互独立的假设检验就是独立性检验。立的假设检验就是独立性检验。例如:例如:注射某种疫苗预防某种疾病的关系(猪瘟);注射某种疫苗预防某种疾病的关系(猪瘟);不同配种(单次配、双重配)与受胎数
14、有关系。不同配种(单次配、双重配)与受胎数有关系。独立性检验与适合性检验的区别:独立性检验与适合性检验的区别:(1)独立性检验的次数资料是按两因子属性类别进行归独立性检验的次数资料是按两因子属性类别进行归组。根据两因子属性类别数的不同而构成组。根据两因子属性类别数的不同而构成22、2c、rc列联表列联表(r为行因子的属性类别数,为行因子的属性类别数,c为列因子的属为列因子的属性类别数性类别数)。而适合性检验只按某一因子的属性类别将。而适合性检验只按某一因子的属性类别将如性别、表现型等次数资料归组。如性别、表现型等次数资料归组。(2)适合性检验按已知的属性分类理论或学说计算理论适合性检验按已知的
15、属性分类理论或学说计算理论次数。独立性检验在计算理论次数时没有现成的理论次数。独立性检验在计算理论次数时没有现成的理论或学说可利用,理论次数是在两因子相互独立的假设或学说可利用,理论次数是在两因子相互独立的假设下进行计算。下进行计算。(3)适合性检验的自由度适合性检验的自由度=属性类别数属性类别数1。rc列联表的独立性检验中,自由度列联表的独立性检验中,自由度df=(r1)(c1)。l1、独立性检验无已知的理论比率;独立性检验无已知的理论比率;l2、独立性检验必须安排以因子划分的两独立性检验必须安排以因子划分的两l 向列联表;向列联表;l3、独立性检验是次数资料相关性的研究;独立性检验是次数资
16、料相关性的研究;l4、适合性检验的自由度、适合性检验的自由度df=属性类别数属性类别数k1,独立性检验中,自由度独立性检验中,自由度df=(r1)(c1)。独立性检验的方法独立性检验的方法(一)(一)列联表的独立性检验列联表的独立性检验【例【例7.7】某猪场用】某猪场用80头猪检验某种疫苗是否有头猪检验某种疫苗是否有 预防效果。结果是注射疫苗的预防效果。结果是注射疫苗的44头中有头中有12头发头发 病,病,32头未发病;未注射的头未发病;未注射的36头中有头中有22头发病,头发病,14头未发病。问该疫苗是否有预防效果?头未发病。问该疫苗是否有预防效果?1将资料整理成列联表将资料整理成列联表 l
17、 表表711 22列联表列联表 2建立假设建立假设H0:发病与否和注射疫苗无关,即二因子相互独立:发病与否和注射疫苗无关,即二因子相互独立HA:发病与否和注射疫苗有关,即二因子彼此相关:发病与否和注射疫苗有关,即二因子彼此相关3计算理论次数计算理论次数 根据假设,二因子相互独立,即注射疫苗与否不影响根据假设,二因子相互独立,即注射疫苗与否不影响发病率,也就是注射组与未注射组的发病率应当相同,发病率,也就是注射组与未注射组的发病率应当相同,均应等于总发病率均应等于总发病率34/80=0.425。依此可计算出各个理论次数。依此可计算出各个理论次数。注射组注射组 理论发病数:理论发病数:T11=44
18、0.42518.7 理论未发病数:理论未发病数:T12=4418.725.3未注射组未注射组 理论发病数:理论发病数:T21=360.42515.3 理论未发病数:理论未发病数:T22=3615.320.74计算卡方值计算卡方值 df(c1)()(r1)()(21)()(21)1944.77.20)5.07.2014(3.15)5.03.1522(3.25)5.03.2532(7.18)5.07.1812()5.0(222222TTAxc 由于由于 ,故,故P0.01,否定,否定H0,接,接 受受HA,表明发病率与是否注射疫苗极显著相,表明发病率与是否注射疫苗极显著相 关。也就是注射组的发病率
19、极显著低于未注关。也就是注射组的发病率极显著低于未注 射组,说明该疫苗是有预防效果的。射组,说明该疫苗是有预防效果的。5查临界值,作出统计推断查临界值,作出统计推断 当自由度当自由度df=1时,查得时,查得 。63.621001)(x2cx21001)(x(二)(二)列联表的独立性检验列联表的独立性检验 2 2c c列联表是行因子的属性类别数为列联表是行因子的属性类别数为2 2,列因子的属性,列因子的属性类别数为类别数为c c(c3c3)的列联表。)的列联表。其自由度其自由度dfdf=(2-1)(c-1)=(c-1)=(2-1)(c-1)=(c-1),因为,因为c3c3,所,所以自由度大于以自
20、由度大于2 2,在进行,在进行 2 2检验时,不需作连续性矫正。检验时,不需作连续性矫正。表表712 2c联列表一般形式联列表一般形式下一张下一张 主主 页页 退退 出出 上一张上一张 表表712 2c 联列表一般形式联列表一般形式 其中其中Aij(i=1,2;j=1,2,c)为实际观察次数。)为实际观察次数。【例【例7.8】在甲、乙两地进行水牛体型调查,将】在甲、乙两地进行水牛体型调查,将体型按优、良、中、劣四个等级分类,结果见表体型按优、良、中、劣四个等级分类,结果见表7-13。问两地水牛体型构成比是否相同?。问两地水牛体型构成比是否相同?这是一个这是一个24列联表独立性检验的问题。列联表
21、独立性检验的问题。检验步骤如下:检验步骤如下:1.提出无效假设与备择假设提出无效假设与备择假设 H0:水牛体型构成比与地区无关,即两地:水牛体型构成比与地区无关,即两地水牛体型构成比相同。水牛体型构成比相同。HA:水牛体型构成比与地区有关,即两地:水牛体型构成比与地区有关,即两地水牛体型构成比不同。水牛体型构成比不同。2.计算各个理论次数计算各个理论次数,并填在各观察次数后的括号中并填在各观察次数后的括号中 计算方法与计算方法与22表类似,即根据两地水牛体型构表类似,即根据两地水牛体型构成比相同的假设计算。成比相同的假设计算。如优等组中,甲地、乙地的理论次数按理论比率如优等组中,甲地、乙地的理
22、论次数按理论比率20/135计算;良等组中计算;良等组中,甲地、乙地的理论次数按理论甲地、乙地的理论次数按理论比率比率15/135计算;中等、劣等组中计算;中等、劣等组中,甲地、乙地的理论甲地、乙地的理论次数分别按理论比率次数分别按理论比率80/135和和20/135计算。计算。甲地优等组理论次数:甲地优等组理论次数:T11=9020/135=13.3,乙地优等组理论次数:乙地优等组理论次数:T21=4520/135=6.7,或或T21=2013.3=6.7;其余各个理论次数的计算类似。其余各个理论次数的计算类似。582.76.6)6.610(7.26)7.2620(10)1010(3.13)
23、3.1310(222223.计算计算计算计算 2值值 4.由自由度由自由度df=3查临界查临界 2值,作出统计推断值,作出统计推断 因因 为为 20.05(3)=7.8 1,而而 2=7.5820.05,不能否定,不能否定H0,可以认可以认为甲、乙两地水牛体型构成比基本相同。为甲、乙两地水牛体型构成比基本相同。在进行在进行2c列联表独立性检验时,还可利用下列联表独立性检验时,还可利用下述简化公式(述简化公式(7-7)或()或(7-8)计算)计算 2:(77).21212122TTTATTTjj下一张下一张 主主 页页 退退 出出 上一张上一张 或或 (78)(7-7)与()与(7-8)式的区别
24、在于:)式的区别在于:(7-7)式利用第一行中的实际观察次数)式利用第一行中的实际观察次数A1j和和行总和行总和T1.;(;(7-8)式利用第二行中的实际观察)式利用第二行中的实际观察次数次数A2j和行总和和行总和T2.,计算结果相同。对于,计算结果相同。对于例例7.7利用(利用(7-8)式计算)式计算 2 值得:值得:.22222122TTTATTTjj502.71354520108020155201045901352222222【例【例7.9】分别统计了】分别统计了A、B两个品种各两个品种各67头经头经产母猪的产仔情况,结果见表产母猪的产仔情况,结果见表7-14,问,问A、B两品两品种的产
25、仔构成比是否相同?种的产仔构成比是否相同?表表714 A、B两个品种产仔数的分类统计两个品种产仔数的分类统计 1、提出无效假设与备择假设、提出无效假设与备择假设 H0:A、B两个品种产仔数分级构成比相同。两个品种产仔数分级构成比相同。HA:A、B两个品种产仔数分级构成比不同。两个品种产仔数分级构成比不同。2、计算、计算 2值值 用简化公式(用简化公式(77)计算为:)计算为:23.2313467356774422176767134222222下一张下一张 主主 页页 退退 出出 上一张上一张 3、由自由度、由自由度df(21)(31)2查临界查临界 2值,作出统计推断值,作出统计推断 因为因为
26、 20.05(2)=9.21,2 20.01,P0.01,所以否定所以否定H0,接受,接受HA ,表明,表明A、B 两品种产仔两品种产仔数构成比差异极显著。需要应用数构成比差异极显著。需要应用 2检验的再分检验的再分割法来具体确定分级构成比差异在那样的等级。割法来具体确定分级构成比差异在那样的等级。下一张下一张 主主 页页 退退 出出 上一张上一张 利用简化公式(利用简化公式(7-7)计算)计算 21值为:值为:930.2996177442217386199222221下一张下一张 主主 页页 退退 出出 上一张上一张 由由df1=21=1,查,查 2值表得:值表得:20.05(1)=3.84
27、1,因,因为为 210.05,表明这两个品种的产仔数在,表明这两个品种的产仔数在9头以下头以下和和1012头这两个级别内的比率差异不显著。头这两个级别内的比率差异不显著。利用简化公式(利用简化公式(7-7)计算)计算 22值为:值为:458.201346735699616767134222222 (2)对产仔数在)对产仔数在13头以上组与其他合并组(即头以上组与其他合并组(即9头头以下和以下和1012头两个组的合并)进行头两个组的合并)进行 2检验,分割后检验,分割后见表见表716。由由df2=2-1=1,查,查 2值表得:值表得:20.05(1)=3.84,20.01(1)=6.63,因为,
28、因为 22 20.01(1),P0.01,表明这两个品种的产仔数在合并组与表明这两个品种的产仔数在合并组与13头以头以上组的比率差异极显著。其中上组的比率差异极显著。其中B品种产仔数在品种产仔数在13 头以头以上的比率为上的比率为29/67=42.38%,极显著高于,极显著高于A品种产仔数在品种产仔数在13头以上的比率头以上的比率6/67=8.96%。或者说。或者说B品种产仔数品种产仔数 在在合并组(合并组(12头以下)的比率为头以下)的比率为38/67=56.72%,极显著,极显著低于低于A品种产仔数在合并组(品种产仔数在合并组(12头以下)的比率头以下)的比率61/67=91.04%。下一
29、张下一张 主主 页页 退退 出出 上一张上一张 经分割检验后经分割检验后 df=df1+df2=1+1=2 2=23.25=21+22 =2.93+20.458 =23.388 2略小于略小于 21+22,是由于计算中的舍入误差,是由于计算中的舍入误差所致。所致。下一张下一张 主主 页页 退退 出出 上一张上一张 经分割检验后经分割检验后 df=df1+df2=1+1=2 2=23.25=21+22 =2.93+20.458 =23.388 2略小于略小于 21+22,是由于计算中的舍入误差,是由于计算中的舍入误差所致。所致。下一张下一张 主主 页页 退退 出出 上一张上一张(三)(三)rc列
30、联表的独立性检验列联表的独立性检验 其中其中Aij(i=1,2,r;j=1,2,c)为实际观察次数。)为实际观察次数。rc 列列 联联 表各个理论次数的计算方法与上述表各个理论次数的计算方法与上述(22)、()、(2c)表适合性检验类似。但一般用简)表适合性检验类似。但一般用简化公式计算化公式计算 2 值,其公式为:值,其公式为:1.22jiijTTAT下一张下一张 主主 页页 退退 出出 上一张上一张【例【例7.10】对】对3组奶牛(每组组奶牛(每组39头)分别喂给不头)分别喂给不同的饲料,各组发病次数见表同的饲料,各组发病次数见表7-18。问发病次数。问发病次数的构成比与所喂饲料是否有关?
31、的构成比与所喂饲料是否有关?表表718 三组牛的发病次数资料三组牛的发病次数资料 1建立假设建立假设H0:发病次数的构成比与饲料种类无关,即二者相互独立:发病次数的构成比与饲料种类无关,即二者相互独立HA:发病次数的构成比与饲料种类有关,即二者相互相关:发病次数的构成比与饲料种类有关,即二者相互相关2计算理论次数计算理论次数 对于理论次数小于对于理论次数小于5者,将相邻几个组加以合并者,将相邻几个组加以合并(见表(见表7-19),合并后的各组的理论次数均大于),合并后的各组的理论次数均大于5。表表719 资料合并结果资料合并结果(注:括号内为理论次数)(注:括号内为理论次数)下一张下一张 主主
32、 页页 退退 出出 上一张上一张 3计算卡方值计算卡方值 利用简化公式进行计算利用简化公式进行计算 61.10)11939919395223916523919(1171222222 )(。jiijTTATx4查临界值,作出统计推断查临界值,作出统计推断 df=(r1)()(c1)=(41)()(31)=6,查得,查得59.1226005)(x由于由于 ,故,故P0.05,接受,接受H0,可以认为,可以认为奶牛的发病次数的构成比与饲料种类相互独立,即用奶牛的发病次数的构成比与饲料种类相互独立,即用3种不同的饲料饲喂奶牛,各组奶牛发病次数的构成种不同的饲料饲喂奶牛,各组奶牛发病次数的构成相同。相同。2x26005)(x