1、 第十章第十章 检验22 2 单因素因果关系研究单因素因果关系研究自变量自变量数据类型数据类型因变量因变量数据类型数据类型统计方法统计方法检检验验2 连续连续连续连续连续连续连续连续类别(类别(2水平)水平)平均数差异检验(平均数差异检验(t,Z)点二列相关,二列相关点二列相关,二列相关类别(类别(3水平)水平)方差分析(方差分析(F检验)检验)多列相关多列相关类别类别类别类别积差相关积差相关一元回归一元回归 第十章第十章 心理学研究中,有时研究变量是按一定的性质划分为心理学研究中,有时研究变量是按一定的性质划分为不同类别,然后统计不同类别,然后统计各类别中的人数或个数各类别中的人数或个数,即
2、需要用到,即需要用到计数资料计数资料。例如,将人按照。例如,将人按照性别性别划分为划分为“男男”、“女女”;将学习成绩划分为将学习成绩划分为“优优”、“良良”、“中中”、“差差”四个四个等级等级等,然后对各类别分别有多少、占多大比例等问题进等,然后对各类别分别有多少、占多大比例等问题进行分析。行分析。对这些对这些计数资料计数资料的统计分析,不能用前几章的统计方法,的统计分析,不能用前几章的统计方法,则需要使用本章所介绍的则需要使用本章所介绍的 。应用。应用 分析计数数分析计数数据时,据时,对计数数据总体的分布形态不作任何假设对计数数据总体的分布形态不作任何假设,因此,因此 被视为是被视为是非参
3、数检验非参数检验方法的一种。方法的一种。检验检验2 检验2检验检验2 检验检验2 第一节第一节 检验检验 概述概述一、一、和和 检验的意义检验的意义 方法能处理方法能处理一个因素一个因素两项或多项分类的实际两项或多项分类的实际观察频数与理论频数分布是否相一致问题,或者说有无显观察频数与理论频数分布是否相一致问题,或者说有无显著差异问题。著差异问题。所谓所谓实际频数实际频数简称实计数或实际数,是指在实验或简称实计数或实际数,是指在实验或调查中得到的计数资料,又称为观察频数。调查中得到的计数资料,又称为观察频数。理论次数理论次数是指根据概率原理、某种理论、某种理论是指根据概率原理、某种理论、某种理
4、论次数分布或经验次数分布计算出来的次数,又称为期望次次数分布或经验次数分布计算出来的次数,又称为期望次数。数。222 eefff2022:.其其基基本本公公式式为为偏偏离离程程度度的的指指标标是是实实计计数数据据与与理理论论数数据据检验检验2 第一节第一节 检验检验 概述概述2检验的假设检验的假设二、二、2 互互独独立立最最安安全全的的做做法法。值值,这这是是确确保保观观测测值值相相每每个个被被试试只只有有一一个个观观测测同同被被试试的的总总数数,要要求求值值的的总总数数等等于于实实验验中中不不在在实实验验研研究究中中,让让观观测测(二二)观观测测值值相相互互独独立立互互不不包包容容(一一)分
5、分类类相相互互排排斥斥,第一节第一节 检验检验 概述概述2检验的假设检验的假设二、二、2 准准确确性性。,这这样样才才能能保保证证检检验验的的不不应应低低于于的的期期望望次次数数至至少少检检验验时时,每每一一个个单单元元格格时时,在在进进行行当当自自由由度度等等于于个个以以上上。的的期期望望次次数数应应该该至至少少在在,每每一一个个单单元元格格中中值值合合理理准准确确的的近近似似估估计计分分布布成成为为为为了了努努力力使使(三三)期期望望次次数数的的大大小小1015222 eefff202 第一节第一节 检验检验 概述概述2,处理的方法有四种:,处理的方法有四种:当单元格的人数过少时当单元格的
6、人数过少时显。显。检验的结果偏差非常明检验的结果偏差非常明,否则,否则单元格理论值要大于单元格理论值要大于以上的以上的要有要有统计检验高估。通常需统计检验高估。通常需可能违反基本假设导致可能违反基本假设导致时时,小于,小于的理论次数不得小于的理论次数不得小于检验时,要求各单元格检验时,要求各单元格运用运用22580%55 三三、小小期期望望次次数数校校正正第一节第一节 检验检验 概述概述2三、小期望次数的校正三、小期望次数的校正的的母母总总体体中中。不不能能推推论论到到这这些些被被去去除除试试去去除除,但但研研究究的的结结论论类类被被与与研研究究价价值值时时,可可将将该该低低的的类类别别又又不
7、不具具有有分分析析样样本本无无法法增增加加,次次数数偏偏第第三三,去去除除样样本本法法。方方法法是是直直接接增增加加样样本本数数想想获获得得有有效效样样本本,最最佳佳如如无无法法改改变变分分类类方方式式又又第第二二,增增加加样样本本数数。分分单单元元格格予予以以合合并并。整整变变量量分分类类方方式式,将将部部配配合合研研究究目目的的,适适当当调调第第一一,单单元元格格合合并并法法。第第四四,使使用用校校正正公公式式。第一节第一节 检验检验 概述概述2等等。性性检检验验、同同质质性性检检验验等等,如如配配合合度度检检验验、独独立立,可可以以细细分分为为多多种种类类型型检检验验因因研研究究的的问问
8、题题不不同同检检验验的的类类别别三三、22 合合性性检检验验。种种检检验验又又可可称称为为正正态态吻吻正正态态性性进进行行检检验验时时,这这数数据据的的差差假假说说检检验验。当当对对连连续续检检验验方方法法有有时时也也称称为为无无是是否否接接近近,这这种种数数实实际际观观察察数数与与某某理理论论次次验验一一个个因因素素多多项项分分类类的的配配合合度度检检验验主主要要用用来来检检2 第一节第一节 检验检验 概述概述2检验的类别检验的类别三、三、2 母母总总体体是是异异质质的的。个个质质的的,反反之之,则则说说这这两两可可以以说说两两个个母母总总体体是是同同果果两两样样本本没没有有差差异异,就就如
9、如单单一一变变量量的的分分布布情情形形,质质性性检检验验检检测测双双样样本本在在具具有有显显著著差差异异。当当用用同同否否在在某某一一个个变变量量的的反反应应是是于于鉴鉴定定不不同同人人群群母母总总体体同同质质性性检检验验主主要要目目的的在在的的态态度度是是否否有有关关系系。例例如如性性别别与与对对某某个个问问题题物物。所所要要研研究究的的两两个个不不同同事事。所所谓谓的的两两个个因因素素是是指指是是否否具具有有独独立立性性的的问问题题或或种种分分类类之之间间是是否否有有关关联联两两个个或或两两个个以以上上因因素素各各独独立立性性检检验验是是用用来来检检验验第二节第二节 配合度检验配合度检验一
10、、配合度检验的意义一、配合度检验的意义 配合度检验是应用配合度检验是应用 检验方法的一种,主要用于检验方法的一种,主要用于检验实检验实际观测次数与某理论次数是否有差别的情况际观测次数与某理论次数是否有差别的情况。它适用一个因素。它适用一个因素多项分类的计数资料,所以又称做单因素分类多项分类的计数资料,所以又称做单因素分类 检验或单向检验或单向表的表的 检验。检验。222第二节第二节 配合度检验配合度检验一、配合度检验的意义一、配合度检验的意义 进行配合度检验,应当注意进行配合度检验,应当注意自由度的确定自由度的确定和和理论次数的理论次数的计算计算。1.配合度检验自由度确定与下列两个因素有关:配
11、合度检验自由度确定与下列两个因素有关:一是实验或调查中分类的项数;一是实验或调查中分类的项数;二是计算理论次数时,用到的统计量的个数。二是计算理论次数时,用到的统计量的个数。自由度自由度=资料分类数目计算理论次数时所用的统计量个数资料分类数目计算理论次数时所用的统计量个数2.理论次数的计算,一般是根据某种理论,按一定的概率通理论次数的计算,一般是根据某种理论,按一定的概率通过样本即观测次数计算。通常用到无差假说、正态分布、二过样本即观测次数计算。通常用到无差假说、正态分布、二项分布等理论模型。项分布等理论模型。二、无差假说的检验二、无差假说的检验 无差假说无差假说是指各项分类的次数没有差异,即
12、假是指各项分类的次数没有差异,即假设各项分类之间的机会均等,或概率相等。因设各项分类之间的机会均等,或概率相等。因此,理论次数完全按概率相等的条件计算,其此,理论次数完全按概率相等的条件计算,其公式为:公式为:分类项数分类项数总数总数1 ef例例8 随机抽取随机抽取60名学生,问他们高中要不要文理分科,回答赞名学生,问他们高中要不要文理分科,回答赞成的成的39人,反对的人,反对的21人,问对分科的意见有无显著差异?人,问对分科的意见有无显著差异?解:解:.05.001.0,63.64.584.363.6,84.3:;112:34.5303021303039:2:;30:1305.060201.
13、1205.12220220100度度有有差差异异故故对对高高中中文文理理分分科科的的态态查查表表得得统统计计决决断断值值计计算算建建立立假假设设 PdffffffHffHfeeeee 例例9 大学某系大学某系54位老年教师中,健康状况属于好的有位老年教师中,健康状况属于好的有15人,中等的有人,中等的有23人,差的有人,差的有16人,问该校老年教师中三人,问该校老年教师中三种健康状况的人数是否一样?种健康状况的人数是否一样?解:解:.,05.0,99.511.299.5,213:311.218181618182318181518354:,:2,:,:1205.022222210差差三三种种人人
14、数数无无显显著著差差异异中中健健康康状状况况好好故故该该校校老老教教师师中中查查表表得得统统计计决决断断其其理理论论频频数数为为根根据据零零假假设设值值计计算算差差三三种种人人数数不不相相同同中中健健康康状状况况好好差差三三种种人人数数相相同同中中健健康康状状况况好好建建立立假假设设 PdffHHe 三、频数分布是否符合正态性的三、频数分布是否符合正态性的 检验检验 检验还可以检验某些实得次数是否合乎正态分检验还可以检验某些实得次数是否合乎正态分布。不过,在计算时,要注意把正态分布的概率,转布。不过,在计算时,要注意把正态分布的概率,转换为理论次数的数值。即要用正态分布的概率乘以总换为理论次数
15、的数值。即要用正态分布的概率乘以总次数得出理论次数的分配。次数得出理论次数的分配。例例10 对对50名学生进行操行评定,分优、良、中、差名学生进行操行评定,分优、良、中、差四等,评定的结果是:优四等,评定的结果是:优7人,良人,良22人,中人,中18人,差人,差3人,试检验其分布的形式是否合乎正态分布?人,试检验其分布的形式是否合乎正态分布?22例例10 的计算:的计算:概率P优良中差合计eefff20eff 00fef解:正态分布的基线上四等份,每等份解:正态分布的基线上四等份,每等份=(3+3)/4=1.5例例10 的计算:的计算:概率P优73.53.53.5良2221.50.50.01中
16、0.431821.5-3.50.57差0.0733.5-0.50.07合计50504.15eefff20eff 00fef07.00655.04332.04987.0 43.04332.0解:正态分布的基线上四等份,每等份解:正态分布的基线上四等份,每等份=(3+3)/4=1.5例例10的计算的计算(续续)由上表得由上表得:.,5005.0,81.715.481.7:,31415.4205.032其人数接近正态分布其人数接近正态分布名学生的操行评定名学生的操行评定故故查表得查表得 Pdf 四、连续变量分布的拟合度检验四、连续变量分布的拟合度检验 理论次数:理论次数:自由度:自由度:例例11 表
17、表12-5所列资料是所列资料是552名中学生的身高次数分。名中学生的身高次数分。问这些学生的身高是否符合正态分布?问这些学生的身高是否符合正态分布?Npfie计计量量的的数数计计算算理理论论次次数数时时所所用用统统组组数数 df例例11解解:表表12-5 理论曲线的配合度检验理论曲线的配合度检验身高分组组中值XC实际次数离差Z分数查表Y169-166-163-160-157-154-151-148-145-142-139-SiYp Npfe eefff20 例例11解解:表表12-5 理论曲线的配合度检验理论曲线的配合度检验身高分组组中值XC实际次数离差Z分数查表Y169-166-163-16
18、0-157-154-151-148-145-142-139-17016716416115815515214914614314027225711012411280258415.3812.389.386.383.380.38-2.62-5.62-8.62-11.62-14.623.032.441.851.260.67.07-0.52-1.11-1.70-2.29-2.880.004.00203.0720.1840.3187.3979.3484.2154.0940.0289.0067.00237.01201.04260.10888.18858.23544.20615.12746.05562.0171
19、0.00396172460104130114703192.167.150.471.277.0351.4291.161SiYp Npfe eefff20 125.090.07.5,62.154,552SXN552ef905.32例例11 解(续)解(续)如果两端的组中的理论次数均有小于如果两端的组中的理论次数均有小于5的,则需要将相的,则需要将相邻的理论次数合并至大于邻的理论次数合并至大于5。本题共分。本题共分11组,两端均有组,两端均有理论次数小于理论次数小于5,上端二组合并为一组,下端二组合并,上端二组合并为一组,下端二组合并为一组,然后将实际次数也相应合并之后,再求为一组,然后将实际次数也
20、相应合并之后,再求 值,值,本题由上面解得:本题由上面解得:。df=9-3=6,查,查 值表得:值表得:因为因为3.9030.05,差异不显著。,差异不显著。故这故这552名中学生的身高分布符合正态分布。名中学生的身高分布符合正态分布。905.3222 6.12205.6五、两项分类且某类理论次数小于五、两项分类且某类理论次数小于5的校正的校正 当只有两项分类(自由度为当只有两项分类(自由度为1)并且某项的理论次数小于)并且某项的理论次数小于5时,若用时,若用 检验,就要运用耶茨(检验,就要运用耶茨(Yates)连续性校正法,)连续性校正法,即在每一组实际频数与理论频数差数的绝对值平方之前,即
21、在每一组实际频数与理论频数差数的绝对值平方之前,各减去各减去0.5,用公式表示:,用公式表示:2 eefff2025.0 例例12 有一学校共评出有一学校共评出10名优秀学生班干部,其中男生名优秀学生班干部,其中男生3名,名,女生女生7名,问优秀学生班干部是否存在男女性别差异?名,问优秀学生班干部是否存在男女性别差异?解:假设无性别差异,则解:假设无性别差异,则p=q=0.5,那么男女应各有,那么男女应各有5人,这人,这时需要使用耶茨校正公式。时需要使用耶茨校正公式。.,05.0,84.39.084.3:19.055.05755.053205.01222不存在男女性别差异不存在男女性别差异故优
22、秀学生班干部中故优秀学生班干部中查表得查表得 Pdf 例例13 历年优秀学生干部中男女比例为历年优秀学生干部中男女比例为2:8,今年优秀学生干,今年优秀学生干部中有部中有3个男生,个男生,7个女生,问今年的优秀干部比率与往年是个女生,问今年的优秀干部比率与往年是否有显著差异?否有显著差异?第三节第三节 独立性检验独立性检验 独立性检验也是独立性检验也是 检验的又一重要应用,它检验的又一重要应用,它主要用于两个或两个以上因素多项分类的计数主要用于两个或两个以上因素多项分类的计数资料分析。如果想研究两个(或两个以上因素)资料分析。如果想研究两个(或两个以上因素)之间是否具有独立性或有无关联,就要用
23、之间是否具有独立性或有无关联,就要用 检验独立性检验。检验独立性检验。如果两个因素是独立的,即无关联,就意味着如果两个因素是独立的,即无关联,就意味着当其中一个因素变化时,另一个因素的变化是当其中一个因素变化时,另一个因素的变化是在取样误差的范围之内;反之,如果两个因素在取样误差的范围之内;反之,如果两个因素是非独立,即有关联或称有交互作用存在,当是非独立,即有关联或称有交互作用存在,当其中的一个自变量(因素)变化时,另一个因其中的一个自变量(因素)变化时,另一个因素的变化就超过了取样误差的范围。素的变化就超过了取样误差的范围。22一、独立性检验的一般问题一、独立性检验的一般问题 检验主要研究
24、两个因素或两个以上因素多项分类的计数资料的独立性问题。如果两个因素中的一个因素有R类,另一个因素有C类,这种表称之为RC表,即二维列联表。特殊的列联表是22表。因素若是多于两个,这种表称为多维表,多维列联表的分析较为复杂,本节从略,这里仅介绍二维列联表的 检验。22一、独立性检验的一般问题一、独立性检验的一般问题二维列联表的独立性检验的一般步骤:建立假设:H0:二因素之间是独立的或无关联;H1:二因素之间是有关联的或者说差异显著。(一般多用文字表述而很少用统计符号)计算理论次数:确定自由度:计算统计量:具体方法下面逐一介绍之。统计决断1312NfffjiijCRe11CRdf二、22列联表(四
25、格表)独立性检验独立样本四格表的 检验:四格表独立样本,即从总体中随机取样,然后按两个因素对个体进行分类,将观测结果分别填入四个格内,便得到独立样本四格表,当各格的理论次数 时,可用基本公式(12-11),即:5ef1412b:22202dcadcbabcadNfffee算或可用下面简便公式计2例14 今随机抽取90人,按男女不同性别和学生学习水平两个因素进行分类,结果如下表所示,问男女学生学业水平有无显著 差异?或问性别与学业之间有无关联?中等以上中等以下合 计男23(a)17(b)40(a+b)女28(c)22(d)50(c+d)合计51(a+c)39(b+d)90(a+b+c+d=N)例
26、14的计算解:略故差异不显著查表得统计决断即若用简便公式值计算异男女生学业水平显著差差异男女生学业水平无显著建立假设.,05.0,84.302.084.3:,1:302036.0395150402817222390:,141202.067.2167.212233.2833.282833.1733.171767.2267.2223:2:1205.1222222202210PdffffHHee二、22列联表(四格表)独立性检验相关样本四格表的 检验:相关样本比率差异的显著性检验公式:当df=1时,式中:b、c是四格表中分类项目不同的格内数字 故相关样本四格表 检验公式为:2cbcbZcbcbZ22
27、2)(2cbcb22例15 124个学生1000公尺长跑,训练一个月后前后两次测验达标情况如下表,问一个月的训练是否有显著性效果 第二次测验达标未达标第一次测验达标61(a)19(b)未达标33(c)11(d)例15计算解:建立假设:H0:一个月长跑训练无显著效果;H1:一个月长跑训练有显著效果计算检验统计量:统计决断:查表得:因为3.770.05,接受H0,差异不显著。故一个月长跑训练无显著效果。77.333193319222cbcb 84.3205.1(三)四格表 的校正 当四格表中任一格的理论次数小于5时,用亚茨连续性校正公式:对于独立样本四格表:对于相关样本四格表:2eefff2025
28、.0)()()()()2/(22dbcadcbaNbcadNcbcb22)1(例16某校将参加课外阅读活动的15名学生与未参加课外阅读活动的15名学生,根据各方面条件基本相同的原则进行配对,测得他们的阅读理解能力如下表,问课外阅读活动对提高阅读理解能力是否有良好的作用。参加课外阅读活动良非良未参加课外阅读活动良3(a)1 (b)非良9 (c)2 (d)例16的计算解:建立假设:H0:课外活动对阅读理解能力的提高没有什么作用;H1:课外活动对阅读理解能力的提高有良好作用。计算检验统计量:统计决断:查表得:因为4.903.84,所以P0.05,拒绝H0,而接受H1,差异显著。故课外活动对阅读理解能
29、力的提高有良好作用。90.49119122 84.3205.1(四)四格表的费舍精确概率检验方法 在理论次数小于5时,除可以用使用 校正公式外,还可以采用费舍(Fisher)精确概率检验法。费舍精确概率检验法的基本原理是:在边缘次数固定的情况下,观测数据的精确概率分布为超几何分布。如果两个变量是独立的,当边缘次数保持不变时,各格内的实计数a,b,c,d。任何一特定排列概率p是:2 1812!Ndcbadbcadcbap四格表的费舍精确概率检验方法 在边缘次数不变的情况下,用公式(12-18)计算出各格内实计数排列的概率,以及实计数最小的那一格的数字依次变化至零时,所有排列的概率和。然后将概率和
30、与显著性水平相比较,若p,则说明超过了独立性样本各格实计数的取样范围,就可以推论说,两样本独立的假设不成立,可说两样本之间存在相关。下面以表12-9的数据来说明四格表的费舍(Fisher)精确概率检验法。(四)四格表的费舍精确概率检验方法 P=p0+p1+p2+5276247 6 (A)6176157 6 (B)7076067 6 (C)四格表的费舍精确概率检验方法 概率和为:210pppp.,.,05.04174.04174.02087.02:,2087.00006.0!13!6!0!0!7!7!6!6!70245.0!13!5!1!1!6!7!6!6!71836.0!13!4!2!2!5!
31、6!7!6!72210012非常接近由此看两种方法的效能很接近其结果与上面连续性校正公式计算此题也可用或说二因素无关联差异不显著则双侧概率为这是单侧概率的资料表的资料表的资料表pppPCpBpAp三、列联表独立性检验 上述四格表检验是 列联表独立性检验的一个特例,一般情况下是 列联表的独立性检验。其目的是判断两种分类特征是否有依存关系。CRCRCR例17 家庭经济状况属于上、中、下的高三毕业生,对于是否愿意报考师范院校有三种不同的态度(愿意、不愿意、未定),其人数分布如下表。问学生是否愿意报考师范院校与家庭经济状况有无关系?家庭经济状况对报考师范院校的态度总和愿意不愿意未定上18(20.53)
32、27(19.43)10(15.03)55中20(22.03)19(20.85)20(16.13)59下18(13.44)7(12.72)11(9.84)36总和565341150例17的计算解:建立假设:H0:学生是否愿意报考师范院校与家庭经济状况没有关系;H1:学生是否愿意报考师范院校与家庭经济状况有关系计算检验统计量:48.1084.984.91143.1943.192753.2053.2018.,53.201505655:,:,222211号内并把结果填入上表的括数可仿此分别计算其它各格的理论次则有由公式计算各组的理论次数NfffNfffjijiijCReCRe例17的计算(续)统计决断
33、:df=(R-1)(C-1)=(3-1)(3-1)=4,查表得:.,005.05.001.028.1349.1049.928.13,49.9201.4205.4家庭经济状况有关系故学生报考师范院校与差异显著水平上拒绝零假设在p四、品质相关(一)四分相关 1.适用资料 两因素本身都是连续的正态变量 人为划分两种不同类别 这类四格表大都用于同一个被试样本中,分别调查四个不同因素两项分类的情况。(相关四格表)A 非Aa+bc+d B 非Babcd a+c b+d2.计算公式 皮尔逊余弦法:或:(书上有误)bcadbcrbcadrttcos1180cos0例18 下表所列数据是调查378名学生两科测验
34、成绩,设两科成绩分布为正态,只是人为地将其按一定标准划分为及格、不及格两类。求两科成绩的关联程度。物理成绩A总和及格不及格数学成绩B及格a=125b=68193不及格c=85d=100185 总和210168378例18的计算 解:.,01.0,58.263.3.63.30812.02945.037849.051.044.056.03987.03944.012945.01.,2945.087.72cos85681001251180cos22112100差异极显著则须进行显著性检验还是取样误差所致由两科成绩的真实相关欲判定这个相关系数是pNqpqpYYrZrtt(二)相关1.适用条件除四分相关之
35、外的四格表资料2.计算公式:或:22122N2312dbcadcbabcad例19 有研究者想了解不同性别的学生对某项教育措施的评价态度,调查了358人,结果如下,问性别与评价态度是否有关?相关度如何?评价态度总和拥护反对性别男66106172女28158186 总和94264358例19的计算解:先计算 值,即将上表的数据代入公式(12-14):2 .,265.0358095.25:,88.7:095.2594264186172106281586635822005.122005.1222显著的评价态度的相关是非常这个系数表示性别与所以差异显著检验表明因为其相关程度可表示为关联评价态度有非常密
36、切的说明性别与值表得查(三)列联相关v1.概念及适用条件v两个因素至少有一个被多项分类v2.相关系数计算:v或:241222nC2512112NCRT例20 有研究者想研究眼优势与手优势之间是否有关,调查结果如下表所示:眼优势总和左眼平衡右眼手优势左手346228124平衡27282075右手5710552214 总和118195100413例20的计算解:先计算 值:2.,06985.0413131302.411098.002.441302.4:.,49.902.4;02.411002145219512462118124344132222205.42222著故列联相关系数也不显检验不显著因相关系数较小列联相关系数为两变量无关NCRTNC122crofffN