1、第一节 抽样一、抽样一、抽样教育研究的对象有时是不容选择的,而且也是无法选择的,要研究就非得研究这一特定对象的全部不可。然而在绝大多数情况下,研究的对象是可以选择的,而且是必须加以选择的。从一个总体中选取一部分作为研究对象,这种方法就叫抽样或取样。从中抽样的这个总体有人把它叫做母体或全域,抽取的那一部分叫做样本。二、为什么要抽样1、我们进行一项教育研究为的是解决某一教育问题。而这个教育问题一般都是具有普遍意义的。这就是说,我们搞一项研究总是想把这项研究所得到的结论,普遍应用到同类对象中去。否则,这项研究就没有多大意义。我们研究的对象虽是某个部分,但我们着眼的却是某个总体。一般来说,以一个总体作
2、为研究对象往往是不可能的,也是没必要的,这就需要抽样。2、由于抽样减少了研究对象,使研究工作易于进行。3、节省人力、物力、财力,也是抽样的一大优点。4、一项试验研究在开始时还没有十分把握,最好规模不要过大,就这一点来说,也需要抽样。三、抽样的抽样的要求要求1、明确规定总体、明确规定总体研究这将来打算把研究结果应用推广到哪一个范围,就要在那个范围内抽样。2、样本的代表性、样本的代表性从总体中选取的这个部分应具有广泛的代表性。如果研究目的需要选取特定的对象,那这个特定的研究对象也必须从特定的范围内去抽取。3、合理的样本容量、合理的样本容量为了使抽样具有代表性,样本必须有足够的数量,否则将会影响到研
3、究结果的可靠性。可是,样本太大又不利于进行工作,而且可能产生浪费现象。4、选择合适的抽样方法选择合适的抽样方法以下是取样大小的参考值以下是取样大小的参考值:描述研究、调查研究描述研究、调查研究:总体的10%。除少数情况外,调查研究的样本容量一般不能少于100。相关、比较研究相关、比较研究的满意样本每组至少30。试验研究试验研究:条件控制较严密的研究,如心理学实验,每组15人;条件控制不严密的教育实验,最好是一个自然教学班,不少于30人。必须指出的是,不能绝对地理解“总体越大,样本容量就越大”,不能绝对地按比例取样。另外,要避免取样的偏见。取样的偏见来自研究者的失误,一是志愿者的使用,二是近便组
4、的使用,这些应在研究报告中写明。四、抽样的方法1、简单随机抽样、简单随机抽样按照概率论的原理,抽样时要尽可能使总体中的每一个基本观测单位都有均等的机会,有被抽到的可能。简单随机抽样有两种具体方式:(1)抽签。把总体的每个观测单位依次编上号码并做成签,放进一个器皿加以充分混合后,每次从中取出一个,记下号码,然后把抽取的签在放回器皿中,再次摇动和抽取,如此反复,直到取够足够的样本所需数目为止。(2)随机数目表。随机数字表是一种经严格制作的由许多数目字组成的表,数字随机排列,操作时,首先随机确定一个表上取数的“起点”,然后按表上所示的数字取样。2、系统随机抽样、系统随机抽样系统随机抽样也叫等距抽样、
5、机械抽样。先将总体各个观测单位按某一标志顺序排列编号并分成数量相等的组,使组数与取样数相同,然后从每组依事先规定的机械次序抽取对象。抽样比率的计算公式是:k=N/n(k是抽样比率,N总体数,n样本数)如:从1000人中取100,计算比率等于10,按学生名册或学号,从1-10中取出第一个样本,比如这个号码为5,样本依次为5、15、25.3、分层随机抽样、分层随机抽样分层抽样也叫类型抽样、配额抽样。将总体按一定标准,即单位属性特征(变异度的大小)分成若干层次或类别,然后再根据事先确定的样本大小及其各层或各类在总体中所占的比例提取一定数目的样本单位。即按总体中具有各类特征的对象所占的比例,在总体中随
6、机抽取同样比例的样组成分的取样方法。适用条件及特点:当已知研究总体由不同性质的几个部分组成,要使抽取的样本能客观反映总体的结构特征,就可以采用类型取样。采用分层取样的步骤:(1)了解总体中各特征的差别,按特征差异分组,计算每一类在总体中所占的比例。(2)根据各组在总体中所占的比例分配各组中每一类别的人数。(3)最后从总体的不同类别的对象中按规定人数在各组中随机抽取样本。4、多级抽样法、多级抽样法在总体较大而样本较少时使用。和分层抽样的不同之处在于,它只借助一级级的抽样作为最后抽样的过渡,以便最后决定在哪抽取。5、整群随机抽样整群随机抽样把一个个整体,如学校或班级编号后用随机、机械或类型取样方法
7、进行抽取,它不是从整体中逐个地抽取对象,而是抽取一个或几个单位整群作为样本。6、有意有意抽样法抽样法也叫目的抽样法,即按研究者一定的目的要求去抽选样本。例如,研究者的目的是要研究特意或弱智儿童的学习特点,那他就需按特意或弱智儿童的特点来抽取样本。像这样抽选的样本在总体的常态分布图中所占的位置,不是偏高就是偏低。所以有人把按目的抽样法抽选出来的样本叫做有偏的样本。五、非代表性样本优点:方便缺点:不能推论在总体第二节 变量一、什么是变量一、什么是变量随条件和情景的变化而在数量或类型上起变化的人或随条件和情景的变化而在数量或类型上起变化的人或事物的特征或方面。事物的特征或方面。二、变量的分类(一)(
8、一)自变量自变量与因变量与因变量 自变量是引起其他变量变化的变量,故也称作原因变量。而因变量则称作结果变量。在实验研究中,自变量又称作实验刺激(experimental stimulus),而因变量则往往是研究所测量的变量。实验研究的中心目标是探讨变量之间的因果关系,其基本内容是考察自变量对因变量的影响,即考察实验剌激对因变量的影响。(二)连续变量和间断变量(二)连续变量和间断变量连续变量的数值是连接不断的,相邻两值之间可作无限分割,例如,身高、体重、年龄等都是连续变量。年龄一般虽按整数计算,但如严格按出生时间起算,是可以细算到许多位小数的。连续变量的数值要用测量或计算的方法取得。离散变量的各
9、变量值之间都是以整数断开的,如人数、工厂数、机器台数等,都只能按整数计算。离散变量的数值只能用计数的方法取得。(三)定量变量和定性变量(三)定量变量和定性变量定量变量:表示数量的变量。定性变量又名分类变量:观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别,这样的观测数据称为定性变量。(四)物理变量与非物理变量物理变量:可以用物理术语定义的变量。非物理变量:是以认知和行为过程定义的变量。第三节 测量一、什么是测量一、什么是测量根据一定的法则,将事件或物体所具有的某种属性数量化的过程。二、测量量表的划分与比较(一)类别量表(二)等级量表(三)等距量表(四)等比量表(五)模
10、糊量表P37-39三、测量的基本类型常模参照测量是在较大群体范围内取样的基础上,以常模为参照系来解释测验分数。以绝对标准为根据的度量称为标准参照测量。四、教育与心理测量的特点间接测量测量标准的社会性测量结果的近似性第四节 误差一、系统误差一、系统误差持续地使测量或研究结果向某一方向产生偏差倾向的误差。产生原因:样本不具代表性;主试工作失误;被试的好被试心理或逆反心理。二、取样误差抽样实际误差是指在一次具体的抽样调查中,由于随机因素引起的样本指标与总体指标之间的离差。三、测量误差?!使用测量工具测量时所使用的误差。第五节 概念定义和操作性定义操作性定义,又称操作定义,按照在特定研究中对变量进行测
11、量所要进行的必要操作给变量定义,包括对必须测定的活动及操作过程的详细说明。是根据可观察、可测量、可操作的特征来界定变量含义的方法。即从具体的行为、特征、指标上对变量的操作进行描述,将抽象的概念转换成可观测、可检验的项目。P44-46第六节 信度和效度一、效度效度是指研究结论与现实的符合程度,或指测量结果与所要测得事物属性之间的符合程度。(一)内在效度 内在效度(internal validity)指研究结果能被明确解释的程度。实验者所操纵的实验变量对因变量所造成的影响的真正程度。实验内在效度高低,取决于对无关变量控制的程度。控制的越好,实验的效果越能解释为由实验处理所造成。反之,控制的越差,实
12、验结果越无法解释。其结果究竟是由实验处理所产生,还是由其他无关因素所导致的,将难以确定。影响内在效度的因素对于影响内在效度的因素,美国学者坎贝尔和斯坦利认为有八项因素是影响内在效度的无关变量。1.历史(history)(或同时事件)假定研究者所用研究实验设计为:O1 X O2 即在给予实验处理(X)之前进行测验(O1),实验处理(X)之后再进行测验(O2),自O1至O2这段期间内,影响因变量O2的因素,除了X之外,可能还有某些特殊事件。2.成熟(maturation)受试者在实验期间,不论生理或心理的都会产生变化。例如,变得更成熟、健壮、疲劳、饥饿、分心或没有兴趣等,这些改变都会影响实验结果。
13、3.测验(testing)测验效应许多教育实验研究为了比较实验前后的情况,往往在实验处理之前进行测验,但前测的经验常常有助于后测分数的提高,尤其是前后测验的题目基本相同时。因为,受试者在经过前测之后,会熟悉测验的技巧和内容。所以,即使没有实验处理的效果,也可能因前测的经验的影响,导致后测分数的提高。4.工具(instrumentation)在测量过程中,测量工具(例如,试卷、仪器等)不同,评价者身心发生变化(例如,评卷者在评价后测时,变得比前测时较为疲劳、粗心或严格),也可能改变实验的结果。5.统计回归(statistical regression)回归效应 统计回归现象指受试者的测量分数在第
14、二次测量时,有向团体平均数回归(趋近)的倾向。换言之,高分组的手势者在第二次测量时,其分数由于向平均数回归而有降低的趋势,但是低分的受试者,其分数却有升高的趋势。在有前后测的实践中。若以极端分数(高分和低分组)的学生为对象,容易出现统计回归现象。6.差异的选择(differential selection)分组误差 由于为用随即抽样和随即分派之故,所选择的两组或几组受试者,在未用实验处理之前,本来各方面能力有所偏差或不相等,那么实验结果的两组成绩不同,就不能说这种差异是单纯由于实验处理所造成的。所以,在采用两组或多组的实验研究中,研究者必须可考虑不同组别受试者在各项特质(实际素质)上的是否一致
15、。7.受试者的流失(experimental mortality)研究样本在实验期间的流失(例如,迁居、退学、死亡等),有可能使实验结果难以解释。8.选择与成熟的交互作用(selection-maturation interaction,etc.)前面所述七项因素,因彼此交互作用,将是构成影响内在效度的另一个因素。选择与成熟的交互作用便是常见的例子。例如,研究者要检验某心理治疗方法的效果,分别选择一些有心理异常状态的学生为实验组,选择一些心理正常的学生为控制组,在实验处理前,两组均作心理测验,测验表明,异常组的异常倾向分数比正常组的该项分数高的多。在异常组实施异常心理治疗后,再对两组进行心理测
16、量,发现异常组的异常倾向分数大为降低,或接近正常组的该项成绩分数。对这种现象的分析认为,有可能不是心理治疗所发生的实验处理效果,而是因为选择了一组有自然恢复现象的异常组与一组无自然恢复现象的正常组所造成的。异常组与正常组本来就不同,这是“差异的选择”的因素;实验处理后,异常组发生了自然恢复,正常组则无,这是“成熟因素”;这两种因素造成了不平行的发展曲线,即选择与成熟的交互作用因素的影响。(二)外部效度外部效度(external validity)指实验结果的概括性和代表性。换言之,就是指实验结果是否可以推论到实验对象以外的其他受试者,或实验情境以外的其他情境。一个实验越能实现这个目标,就表示该
17、实验越有良好的外部效度。如果用于男生实验的结果,只适用于中学生男生,而不能推论到女生,用于中学生的实验的结果,只适用于中学生,而不能推论到小学生,那么,这个实验设计的外部效度(群体效度)就比较低。如果在试验室里实验的结果,只是用于实验室环境,而不能推论到日常生活情境,在城市实验的结果,只适用于城市,而不能推论到农村,这个实验设计的外部效度(生态效度)也不高。影响外在效度的因素美国学者坎贝尔和斯坦利(Cambell&Stanley,1963)认为有四个因素是影响外在效度的无关变量。1.测验的反作用或交互作用效果(reaction or interaction effect of testing)
18、测验的反作用指前测对后测的作用;测验的交互作用,指前测与后测的交互作用。有前测经验容易造成后测成绩好。在有前测和后测的实验设计中,前测的经验往往会限制研究结果的推论性,因为,由于受实验处理具有敏感性,平常情境下未曾注意到的问题或现象,这时变得更加敏捷和警觉,以至实验效果可能部分来自前测的经验所产生的敏感性。平常情境下未曾注意到的问题或现象,这时变得更加敏感和警觉,以至实验效果可能来自于前测经验所产生的敏感性。2.选择偏差与实验变量的交互作用效果(interaction effects of selection biases and experimental variable)当研究者选择一些具
19、有独特心理的特质的受试者作实验时,选择偏差与实验变量的交互作用效果就容易产生。因为这些独特的心理特质,有利于对实验处理造成较佳的反应。例如,如果选择一些具有高智力的学生,进行发现式的教学与传统式教学比较,实验结果发现前一种教学法优于后一种教学法。但是这一结果不能推论到实验以外的其他一般的学生中去。3.实验安排的反作用效果(reactive effects of experimental arrangements)由于实验情节的安排,受试者知道自己正在被观察或正在参加实验,他(她)所表现出来的行为,通常与他(她)不知道在正在被观察或不是参加实验时,有很大的不同。这时,他们往往可能为投实验者所好,
20、而改变正常的行为方式,努力表现试验者所期望的行为,以获得实验者的欢悦。但受试者在非实验情境的表现,可能遇此完全不同。4.多重实验处理的干扰(multiple-treatment interference)当同样的受试者重复接受两种以上或多种实验处理时,由于前面的处理通常不易完全消失,以至几项实验处理之间会产生干扰的作用。因此,这种实验的结果,只能推论到类似这种重复实验处理的受试者,而无法应用于只有一种实验处理的情况。例如,实验集中学习法、分散学习法、整体学习法和部分学习法的效率时,让每位受试者重复采用四种方法,如果发现其中的整体学习法的效果最好时,研究者并不能将这种结果推论到仅仅接受一种整体学
21、习法的处理情境,因为整体学习法之所以取得良好的效果,可能是和其他的三种方法共同交互作用的结果。综合上述,实验的内在效度逾高,其结果愈能确认是由实验处理所造成的;而实验的外在效度逾高,其结果的推论范围就愈大。因此,实验的设计必须重视这两种效度。但是在实验情境中,要同时十全十美兼顾这两种效度是很难做到的。一般,基本研究比较重视内在效度,而应用研究则比较重视外在效度(在不太影响内在效度的情况下)(三)结构效度又称构想效度,结构效度是指研究结果符合某种理论框架的程度。影响因素:1、研究与理论之间的关系不密切。2、自变量影响作用不明显。p51(四)内容效度内容效度又称逻辑效度,是指项目对欲测的内容或行为
22、范围取样的适当程度,即测量内容的适当性和相符性。(五)表面效度某测验给人以主观上感觉有效的程度。(六)标准关联效度测验与某种标准相关的程度。(七)统计效度研究结果在统计学意义上达到有效(显著)的程度。表示自变量和因变量存在真正的因果关系。(八)生态效度研究情景和条件与所研究的对象(或行为)生活(或发生)于其中的自然情景相符合的程度。二、信度什么什么是信度是信度信度是指测量结果的稳定性或可靠性程度。必须从以下两个方面理解测量的信度:信度指实测值和真值相差的程度;信度指两次重复测量或等值测量之间的关联程度。信度的估计方法(一)稳定性系数重复信度(二)等值性系数复本信度(三)内部一致性系数分半信度(四)评分者信度P55-58三、信度和效度的关系信度是效度的必要条件。