1、大家晚上好 20110922今天课程安排:讲第3章 测量讲点补充材料 几种专题调查小组汇报选题情况下面开始讲课第3章社会测量与操作化第1节 测量的概念与层次第2节 态度量表的运用 第3节 概念的操作化 第4节 测量的信度和效度第1节 测量的概念与层次测量的概念社会现象的测量测量层次测量的概念所谓测量就是根据一定的规则,将某种物体或现象所具有的属性或特征用数字或符号表示出来的过程。测量的主要作用,在于确定一个特定分析单位的特定属性的类别或水平。几个需要加以说明的概念测量四要素测量的特点有效测量的三个条件测量的四个要素1测量客体,即测量的对象。它是客观世界中所存在的事物或现象,是我们要用数字或符号
2、来进行表达、解释或说明的对象。2测量内容,即测量客体的某种属性或特征。3测量规则,即用数字或符号表示事物各种属性或特征的操作规则。4数字或符号,即用来表示测量结果的工具。测量的特点测量的标准化和精确化程度较低。有时同一社会现象,不同的人会得出不同的测量结果。如态度、价值、兴趣等。测量不完全是数量化的,它可以是类别化的。如:是否入党、是否有某一种宗教信仰、是否接受过奖励或处分等。有效测量的三个条件准确性:如在一次考试中,甲得80分,乙得60分,这两个分数能否反映甲乙的水平差异,就取决于试题和判分标准的准确性。完备性:如人们外语能力有高有低,如果一份试卷不能测出外语水平的最低程度或最高程度,那它就
3、是不完备的;又如“政治面貌”这一变量,如果只设“共产党员”和“非党员”两个取值,那么就把其他党派成员排除在外了,这也是不完备的。互斥性:它是指一个观测对象(或分析单位)的属性和特征都能以一个而且只能以一个数字或符号来表示。如:在观测人们的不同身份时,若按工人、农民、城镇居民、干部划分,就不具有互斥性。城镇居民可以是工人或干部,那就无法准确说明一个人的身份。社会现象的测量1社会测量的特殊性首先在与其标准化和精确化程度较低。2社会测量受人为因素的影响较大。3任何一种社会测量都会干扰和影响现实生活中它所希望或正在测量的现象,给实际工作带来许多困难。测量层次定类测量定序测量定距测量定比测量定类测量1.
4、定类测量也称为类别测量或定名测量,它是测量层次中最低的一种,大多数定性测量都使用定类尺度。其严格的区分由可分为标记和类别两种。(1)标记 如:足球运动员的号码仅用于区分运动员,而不可能出现3号运动员加上5号运动员等于8号运动员的情况。(2)类别 如:性别的区分,宗教信仰的区分,与标记不同,类别区分可说明观测对象的某些本质特征。定序测量 定序测量也称为等级测量或顺序测量。定序测量的取值可以按照某种逻辑顺序将研究对象排列出高低或大小,确定其等级及次序。如:对人的经济地位和文化程度的测量,对产品质量按一、二、三、四等级排列。定序测量程序有多种,最直接的一种是等第顺序法。它要求被试者对一组刺激(包括物
5、体事件或现象)依某种属性由高到低或由多到少的次序予以排列;第二种定序测量程序是配对比较法。它要求被试者在一定时间内就所有可能的配对,排列出每对刺激中的大小或多少的顺序。第三种定序测量程序是恒常刺激法,这种方法与配对比较法相类似,唯一不同之点是它以一种标准刺激连续地与一组恒常刺激的各个成员相配对地进行比较。最后一种是连续性类别法,它要求被试者把一群刺激分为若干显然不同的类别,这里的类别已按指定的属性而予以顺序排列。定类测量举例:性别定类测量举例:性别 女性女性 男性男性定序测量举例:对宗教的认知,定序测量举例:对宗教的认知,“对你来说,宗教有多重对你来说,宗教有多重要?要?”不重要不重要 一般一
6、般 比较重要比较重要 非常重要非常重要低低 高高图图 测量层次测量层次定距测量 定距测量也称为等距测量或区间测量。定距尺度具有定类尺度和定序尺度的特征,它不仅能够将社会现象或事物区分为不同的类别、不同的等级,而且可以确定它们之间不同等级的间隔距离和数量差别。此外,它还要求尺度上的间距代表所测量的特征的量的间距。即:定距尺度的每一等级之间的间距是相等的,它可以用来相减或相加。如:a b c d e1 2 3 4 5a到c的间隔为3-12c到d的间隔为4-31把这两个间隔相加,即2+13,就等于a到d的间隔,即4-13但是,我们不能说d的属性等于b的属性的2倍,因为在定距尺度上没有绝对的零点,所以
7、相加和相减是有意义的,但相乘或相除却没有任何意义。如:温度摄氏50度与40度之间的差距等于30度与20度之间的差距,但40度并不比20度热一倍,因为温度的摄氏零度并不表示没有温度,它是人为的规定。定比测量定比测量是一种能够测定事物之间比例、倍数关系的测量尺度。(1)定比尺度是测量中的最高层次,它除了定类、定序、定距尺度的特征之外,还具有实在意义的真正零点。定比尺度是研究者的理想尺度。(2)定比尺度下的数字是可以进行四则运算的,运算的结果都有实在意义。(3)一个变量能否以定比尺度测量,关键在于零点是否绝对。如:一群人的平均年龄是可以计算的,但其平均宗教信仰是不可以计算的,因为宗教信仰是定类变量。
8、定距测量举例:定距测量举例:IQ 定比测量举例:收入定比测量举例:收入 95115110105100¥0¥10,000¥20,000¥50,000¥40,000¥30,000图图 测量层次测量层次测量层次小结 在四种尺度中,定类尺度处于最低层,定比尺度处于最高层。从数学性质上看,高层次尺度都具有低层次尺度的一切特征,反之则不然。可以说,定距尺度也必然是定序尺度和定类尺度,定序尺度也必然是定类尺度,但反过来却不能成立。在选择测量层次时,要注意以下几点:(1)社会现象大多只能以定类或定序尺度测量,当将某些现象近似地视为定距或定比变量,这时要注意这种近似计算的合理性和可能出现的偏差,如“智力”测验。
9、(2)高层次尺度可能获得更多、更精确的信息,但调查和分析的工作量更大,因此选择尺度要注意结合课题要求与研究条件。(3)用较低尺度收集的资料不能用较高尺度的数字运算来处理,反过来则可以。(4)一种变量可能适合用各种尺度测量,选择何种尺度取决于研究所要求的精确度。定类测量 定序测量定距测量定比测量类别区分(、=)次序区分(、)距离区分()比例区分()有有有有有有有有有有、测量层次的数学特征小结补充材料 几种专题调查1、民意调查什么是民意调查?有什么特点?如何操作?如何看待它?等等什么是民意调查?也叫民意测验、舆论调查叫民生调查吗?二者有什么区别?是一种建立在现代抽样技术基础之上,系统地收集社会公众
10、对各种政治、社会、经济问题的意见、态度,精确的反映社会舆论和民意动向的调查方法。如何理解?或如何把握这个概念?如何理解?或如何把握这个概念?什么现代抽样技术?方法的科学性如何?调查的内容或重点是什么?系统地收集社会公众对各种政治、社会、经济问题的意见、态度调查的目的是什么?精确的反映社会舆论和民意动向有什么特点?选题应该是有意义的热点问题例如:您对政府的反腐败工作如何评价?(请在括号内打)非常得力,成绩巨大();开端良好,任务艰巨();雷声很大,雨点很小();是真是假,看看再说();无可奉告()。问题少,内容集中每次民意调查,最好只有一个主题,询问的问题一般应在10-20个之间。而且应以“民意
11、”包括观点、意见、看法、建议、态度、情感等各种主观认识和感受为主要内容。如果主题不突出或询问的问题过多,就会降低回答的质量,增加汇总的工作量,并影响调查的时效性。对调查对象的基本情况做必要的调查调查对象的基本情况:有自然属性,如:文化程度、行业和职业、职务或职称、经济状况、政治面貌、宗教信仰等。调查对象的基本情况是对不同类型人群的“民意”进行对比研究的客观依据,因此,它是任何民意调查问卷中不可缺少的调查项目。至于究竟调查哪些项目,则应根据调查的目的和要求具体设计。一般来说,这类项目不宜太多,只要能满足对比分析的需要就可以了。回答方式尽量简明一般应采用封闭型或半封闭型的回答方式,而不宜采用开放型
12、的回答方式。在答案中,一般都应设计“无所谓”、“不知道”之类的项目,以便持这类态度的人或真不了解情况的人能真实表达自己的看法和感受。样本少而精在美国,全国性民意调查的样本,一般是1500-3000人。中国社会调查系统成立后,第一次“全国城市居民社会舆论调查”仅调查了2576人,第二次“政治体制改革舆论调查”也只调查了2415人。这样的样本数量,对于全国10多亿人来说显然是极少的。所谓“精”是要有代表性。作为样本的被调查者的性别、年龄、文化程度、职业、经济状况、地区分布等基本构成,应该与被调查对象总体的构成相类似。为了做到这一点,应先采取文献调查法了解总体的构成状况,然后再用配额抽样方法来抽取样
13、本。只有做到少而精,才能既保证民意调查结果的准确性,又节省人力、财力和时间。讲求时效民意调查要讲求时效。这是因为,民意是不断变化发展的。有时一个重大事件的发生、一个重要问题的处理,往往会使社会舆论在短短几天内发生显著的、甚至根本性的变化。如果民意调查总是落在社会舆论变化的后面,放“马后炮”,那就失去了进行民意调查的意义。为了提高时效,民意调查应尽可能采用先进的通讯工具和计算工具来传递和处理信息。如何操作?民意调查是一种间接的书面调查,是问卷调查的一种形式。与问卷调查相类似,民意调查的基本程序是:选择调查课题,设计调查问卷,抽取调查样本,征询被调查者的意见,整理调查资料,进行统计分析,最后得出调
14、查结论。如何看待它?能比较及时地反映民意,比较准确地推论总体,而且比较省时、省力;一般也为公众乐意接受。民意调查的这些优点,使得它具有比较广泛的社会功能,它可以成为党和国家联系群众,了解民意或民心,正确制定路线、方针、政策,克服官僚主义的重要方法;可以成为企事业单位证询民意,不断改进工作的重要工具;可以成为人民群众参与国家和社会管理,监督公职人员的重要途径;可以成为引导社会舆论、影响社会舆论向一定方向发展的重要形式;还可以成为社会科学工作者了解实际情况,进行科学研究的重要手段。总之,民意调查是发扬民主,培养人民群众民主意识的一种重要形式。目前,民意调查在我国还刚刚起步,它的潜在的社会功能还有待
15、于我们去大力地开发和利用。局限性揭示问题的深度有限;民意的多寡并不等同是非或正误。由于民意调查的问题较少,回答方式比较简单,因而提示问题的深度有限。被调查者往往在从众心理或崇拜权威心理的驱使下,说一些“随大流”的话、自认为“正确的”漂亮话、“符合身份”的话、与“权威标准”相一致的话,从而使民意失真。局限性同时,被调查者为其客观地位所限制,再加上主观上不可避免的某些缺陷,就使得他们的民意有可能与社会生产力发展的客观要求不一致。这就是说,作为总体的民意可能是正确的,也可能是不正确的。民意调查的结果只能说明某种民意的多寡和强弱,而不能证明某种民意的是非或正误。小组汇报要求:多向汇报小组提建议帮他们破
16、题,找到好的研究切入点例如:社会保障-养老-地点-居家还是社区等城市社区居家养老模式的调查第二节 态度量表的运用一、量表的概念二、几个具体量表介绍1、李克特量表2、累积量表3、语义差异量表一、量表(scales)的概念什么是量表?是适用于较精确地调查人们主观态度的测量工具,它由一组问题构成,用以间接测量人们对一事物的态度或观念。关于量表要注意几点被测概念是通过一组问题表达出来的量表测量概念是通过间接的方法达到的量表有多种用途态度量表能力量表智力量表性格量表工作成绩量表等二、几个具体量表介绍1、李克特量表2、鲍格达斯社会距离量表3、语义差异量表1、李克特量表李克特量表的概念李克特量表的制作李克特
17、量表的特点李克特量表的概念李可特量表是目前使用最广泛的总加量表的一种特定形式它是由美国社会心理学家李可特于1932年在原有的总加量表基础上改进而成的。总加量表由一组反映人们对事物的态度或看法的陈述构成,每一陈述有“同意”、“不同意”二种回答。李可特量表由一组陈述组成的,每一陈述有“非常同意”、“同意”、“不一定”、“不同意”、“非常不同意”五种回答,分别记为1,2,3,4,5,每个被调查者的态度总分就是他对各道题的回答所得分数的加总,这一总分可说明他的态度强弱或他在这一量表上的不同状态。看一个例子人际关系量表李克特量表的制作李可特量表的制作程序是:(1)根据所要测量的内容或变量收集大量与这一内
18、容有关的问题,然后初步筛选出一组问题(在社会调查中,一般为10-30个)作为量表草案。(2)确定问题的类别和计分标准。(3)试调查。李克特量表的制作(4)统计每位受测者在每条陈述上的得分以及每人在全部陈述上的总分。(5)计算每一条陈述的分辨力,删除分计算每一条陈述的分辨力,删除分辨力不高的陈述,保留分辨力高的陈述,辨力不高的陈述,保留分辨力高的陈述,形成正式的量表。(分辨力系数的计算)形成正式的量表。(分辨力系数的计算)李克特量表的特点李可特量表的最明显优点是容易设计其次,它的适用范围比其他量表要广,它可以用来测量其他一些量表所不能测量的某些多维度的复杂概念或态度。李克特量表的特点第三,通常情
19、况下,李可特量表比同样长度的量表具有更高的信度。最后,李可特量表的五种答案形式使回答者能够很方便地标出自己的位置。李可特量表的最主要的缺点是,相同态度得分者具有十分不同的态度形态。李克特量表示例假设我们要研究各阶层人在生育观念上受封建思想影响的情况.研究变量A是:“受封建的重男轻女思想的影响。”我们可以列出下列几个句子作为变量A的测量指标:a1:男子的社会地位要比女子高。a2:生儿子才能继承门第。a3:女儿终将是别人家的人。a4:多子才能多福。在上述这些问题中可选用“非常同意,同意,无所谓,反对,非常反对”五个选择答案请被测量者填答。测量指标填答结果5非常同意4同意3无所谓2反对1非常反对a1
20、a2a3a42、鲍格达斯社会距离量表要测量人们对黑人的态度,可用下面量表。愿意 不愿意 1.你愿意让黑人生活在你的国家吗?2.你愿意让黑人生活在你所在的城市吗?3.你愿意让黑人住在你们那条街吗?4.你愿意让黑人做你的邻居吗?5.你愿意与黑人交朋友吗?6.你愿意让你的子女和黑人结婚吗?用这种具有逻辑结构的量表,可以测得不同的人或不同的群体对一群体的态度。3、语义差异量表A语义差异量表也称为语义分化量表,是用一组意义相反的陈述或形容词构成一份评价量表,以用来测量人们对某一特定概念或事物的不同意识或感受。B量表的记分:其记分方法有两种,一种是将两陈述或两形容词间的七小段横线从一端到另一端分别记1到7
21、分;另一种则是分别记为-3,-2,-1,0,+1,+2,+3分。要特别注意的是,每一对陈述的记分方向要依据整个量表的方向来决定。C量表的计算方法(1)通过计算各个不同的群体在每一个单纯的陈述中的平均分(2)先将表格中的陈述对按所测的维度分成若干个小组,然后再按上法计算出各群体在这些小组的总平均分,并比较他们之间的差别。(3)将对于不同评价的对象或概念在各陈述对上的评分进行比较。语义差异量表示例 要了解人们对女性角色的理解或看法,可用语义差异量表对若干反映女性的概念,如母亲、妻子、姐妹、女儿、女朋友、女强人等等进行测量。下表就是这种测量的一种。姐妹热情的:_:_:_:_:_:_:_:冷漠的主动的
22、:_:_:_:_:_:_:_:被动的大方的:_:_:_:_:_:_:_:拘谨的强的:_:_:_:_:_:_:_:弱的快的:_:_:_:_:_:_:_:慢的善的:_:_:_:_ :_:_:_:恶的做个练习什么成熟?自立性?盲从性?他人观念?自我观念?行为多样性?行为有限性?精神集中?兴趣分散?工作计划?无计划第三节 概念的操作化1、三个需要明确的概念2、概念的具体化的过程3、操作定义4、测量指标5、建立综合指标1、三个需要明确的概念什么是概念?概念?是对现象的抽象,是一类事物的属性在人们主观上的反映。什么是变量?变量?具有一个以上取值的概念。什么是指标?指标?是表示一个概念或变量含义的一组可观察
23、到的事物。概念概念(对事物或现象的(对事物或现象的抽象)抽象)变量变量(具有多个取值的概念)(具有多个取值的概念)指标指标(表示变量含义的具体事(表示变量含义的具体事物)物)取值:取值:事物事物 1 事物事物 2 事物事物 n常量常量(仅有一个取值的概念)(仅有一个取值的概念)例:例:社会阶层社会阶层问:是变问:是变量还是概量还是概念?念?上、中、下上、中、下职业评分职业评分教育程度教育程度收入水平收入水平图图3-3示例示例大家晚上好 20110930今天课程安排:1、讲第三节中的概念操作化的方法;第四节测量的信度和效度(第一节)2、请几个小组汇报本组课题中核心概念的操作化情况(第二节)温馨小
24、提示:10月6日课串到10月8日上下面开始讲课2、概念操作化的方法概念-概念化-理论定义-操作化-操作定义-现实世界中的测量a概念化-确定概念的内涵b操作化-将概念的理论陈述转化为经 验陈述2、概念操作化的方法a概念化-确定概念的内涵对概念给出理论陈述即对概念下理论定义。如“组织”查字典或文献或研究者自己界定有什么用?b操作化-将概念的理论陈述转化为经 验陈述所谓操作化,就是要把我们无法得到的有关社会结构、制度或过程,以及有关人们行为、思想和特征的内在事实,用代表它们的外在事实来替换,以便于通过后者来研究前者。操作化一词首次使用与直接的物理测量有关,后被广泛的应用与定量研究。它是连接抽象层次的
25、理论和经验层次的事实之间的桥梁。社会学的许多理论术语,运用于经验研究时,必须通过操作化给出操作定义,制定出相应的测量指标 操作化一般分两步:一是列出概念的维度二是发展测量指标测量指标这一阶段是确定如何测量变量,选用哪些指标来测量。指标是概念内涵的指示标志,它们直接表示经验层次的现象。发展测量指标第一种方式是寻找和利用前人已有的指标,尤其是对于一些测量人格、态度方面的量表,往往经过多次的运用和修改,常常可以成为我们可用的指标;第二种方式是研究者先进行一端时间的探索性研究。采用实地观察和无结构式访问的方式,进行资料收集的初步工作。建立综合指标有三种方法a类型法:是将各指标交互分类,然后建立新的类型
26、,以形成一个新的指标。它的基本方式是:A(a3)=a1,a2。b指数法:用简明合理的公式综合各指标,以建立一个新的指标。c量表法:a、类型法举例1经济收入高,,教育水平高3经济收入低,,教育水平高2经济收入高,,教育水平低4经济收入低,,教育水平低教育高低社会地位=经济收入a1,,教育水平a2 高 低 经济收入b、指数法举例失业率=失业人数/(就业人数+失业人数)100%人口密度=年中人口数/总面积父母平均教育水平=父母就学年数总和/父母总数下面看几个具体的例子现代化的生存环境概念维度指标时间维度年龄空间维度城乡社区社会经济地位维度教育程度职业地位父母投资(陈皆明)早期家庭帮助 被访者早期对家
27、庭的依赖 父母为孩子结婚所花费用 教育水平 婚后居住情况近期给予的帮助 照看孩子 做家务 给予经济上的帮助正在给予的帮助 照看孩子 给予经济上的帮助图图3-7操作化操作化 同情心同情心(抽象概念)(抽象概念)主动帮助盲人过街主动帮助盲人过街主动给讨饭者钱物主动给讨饭者钱物主动向灾区捐款主动向灾区捐款 (具体指标)(具体指标)操作化操作化图图3-4操作化操作化 生活满意度生活满意度(抽象概念)(抽象概念)操作化操作化饭菜的质量与服饭菜的质量与服务态度务态度宿舍的人均面积宿舍的人均面积娱乐活动场所的娱乐活动场所的多少多少 (具体指标)(具体指标)图图3-5操作化操作化 溺爱孩子溺爱孩子(抽象概念)
28、(抽象概念)不注意培养孩子的不注意培养孩子的生活自理能力生活自理能力不注意培养孩子的不注意培养孩子的劳动习惯劳动习惯对孩子过分迁就对孩子过分迁就物质上尽量满足物质上尽量满足操作化操作化图图3-6操作化操作化练习1 每组说说你们题目中抽象概念是任何操作化的?第一组:影视节目?第二组:消费走向?第三组:教育观?第四组:饮食习惯?第五组:早生活?第六组:重视程度?第七组:兼职?第八组:上课情况?练习1 每组说说你们题目中抽象概念是任何操作化的?第九组:毕业后走向?第十组:消费观?第十一组:身体素质?第十二组:影响?第十三组:兼职类型?第十四组:基础硬件设施?第四节 测量的信度和效度1、测量的信度2、
29、信度的类型3、影响信度的因素4、测量的效度5、信度和效度的关系6、提高信度和效度的主要途径1、测量的信度a、信度的概念b、信度系数a、信度的概念所谓信度是指测量数据(资料)与结论的可靠性程度,即测量工具能否稳定地测量到它要测量的事项的程度。也就是说,信度是指测量的稳定性与一致性而言。如:一个人站在测量体重的磅秤上,前后几次称出几个明显不同的重量,那么磅秤本身必定有问题,说明这架磅秤是不可靠的。测量的信度有问题!b、信度系数信度系数是同一样本所得到的两组资料的相关系数。例如,当r0.90时,可以认为实得分数中有90%的差异来自测量对象本身的差异,只有10%来自测量误差。当r0.80,即可以认为测
30、量是达到了足够的信度。2、信度的类型 a再测信度:同一种测验,同一群受试者,前后测验两次计算相关系数,即为“再测信度”。b复本信度:一套测验,两种以上复本,同一群受试者计算两种复本测验的相关系数。一般认为,复本测验是检验信度的最好方法。2、信度的类型 c.折半信度:分成两半计分,计算两半部分的相关系数,即折半信度。记作rhhd评分者信度:可计算一个评分者的一组评分与另一个评分者的同一组评分的相关系数。如国际体操比赛中,减少这种主观影响的方法是删除极端的评分或评分者,由多人评分并计算平均值。3、影响信度的因素a测验的长度在适当的长度内,且合乎同质性的要求,一项测验的题数越多,其信度也越高。b受试
31、人员的变异性在其它条件相等的情况下,团体内成员特质的分布范围越广,其信度系数也越大。3、影响信度的因素c间隔的时间如果用再测法或复本法去求信度,两次测验相隔的时间短一点,其信度较高。d调查者调查者是否按程序和标准,是否有意或无意对被调查者施加影响,记录的认真程度等,都会影响信度。e测量的环境被调查者是否受到较大的“干扰 4、测量的效度a效度的定义效度指调查结果说明调查所要说明问题的正确程度。一般地,在选择测量工具和设计问卷、表格时,首先要考虑其效度。也就是说,要考虑“测量出来的东西是否真的是研究者想要得到的东西”,所测得的结果是否能正确、有效地说明所要研究的现象。4、测量的效度b效度评价的三个
32、方法:(1)经验评价:请专家或有经验的人来评价调查结果的有效性和正确性。(2)逻辑检验:对调查结果的逻辑分析,凡没有逻辑错误的就可以认为效度是较高的。(3)效标比较:选择某些权威性的基准或资料作为效度的标准,然后将调查结果与之比较,并作出有效程度的正确程度的结论。C、检查效度的三种程序内容效度(表面效度)准则效度(效标效度)建构效度(理论效度)内容效度(表面效度)内容效度主要考虑:a.测量工具所测量的是否正是调查人员所想要测量的那种行为?b.测量工具是否提供了有关那种行为的适当样本?例如,政治知识的考试。其不能列出所有的内容,但是考试中必然对政治知识的每一部分都列出几道试题,作为这一部分的样品
33、。这样就能通过考察这些样品是否代表了变量的各个部分来评判考卷的内容效度。因此,检查内容效度就是检查由概念到指标的经验推演是否符合逻辑,是否有效。准则效度(效标效度)准则是被假设或被定义为有效的测量标准,符合这种标准的测量工具可以作为测量某一特定现象或概念的效标。对同一概念的测量可以使用多种测量工具,其中每种测量方式与效标的一致性称为准则效度。准则效度分:预测效度、共变效度、实用效度准则效度(效标效度)a预测效度将已经得到的测量结果与未来实际发生的情况进行比较,以检查两者的一致性。例如:设计一种预测学生学习成绩的测验,用它来测量学生毕业时的学习成绩。如果在学生毕业时,实际的成绩确实与预测相一致,
34、那么这一测验就具有预测效度。b共变效度共变效度是判断其他的测量工具是否可以取代作为效标的测量工具。准则效度(效标效度)例如:假如有一种心理测验方法能高度精确地鉴别出某种精神疾病,但就是这种测验太费时、费力,在短期内不可能完成检查。如果能够设计出另一种简单的、自我填写的量表,而且这一量表的测量结果与心理测验的结果高度相关的话(即具有共变效度),那么它就可以替代原先的心理测验方法。c实用效度通常用来检查测量工具的实际效果。建构效度(理论效度)考察建构效度是要了解测量工具是否反映了概念和命题的内部结构。它通常用于理论性研究中,由于它是通过与理论假设相比较来检查的,因此建构效度也称为理论效度。内在效度
35、和外在效度如果在一项具体的研究中,对上述三种效度的检查没有发现问题的话,就可以认为这一研究具有内在效度,即它的资料和结论可以有效地解答所研究的问题。但是,这一研究结论的有效性是否可以适用于其他时间、地点和对象呢?这就涉及外在效度的问题了,即这种研究结论的普遍有效性。例如:在美国的一些城市抽取几百名工人进行研究发现,“当代工人的阶级意识普遍淡漠”,考查它的外在效度,就是看它是否在超越具体的时间、地点之后是否具有代表性,是否具有普遍意义。5、信度与效度的关系信度与效度的关系缺乏信度肯定无效度;有信度不一定有效度。缺乏信度效度不高缺乏信度效度不高信度高但缺乏效度信度高但缺乏效度信度和效度皆高信度和效度皆高图图3-8 信度与效度的关系信度与效度的关系6、提高信度和效度的主要途径a.科学设计调查指标和调查方案是其基础(1)慎重提出研究假设;(2)形成一个能正确说明调查主题的完整的指标系统;(3)对每一个调查指标,设计出相对称的操作定义,即建立一些具体的程序来说明如何测量一个概念。b.认真培训调查人员和调查对象是其关键c.切实做好各个阶段、各个环节的工作是其必要条件