1、第四章第四章 变量测量变量测量1PPT学习交流测量的信度和效度概念的具体化与操作化测量的概念与层次2PPT学习交流测测量的量的概概念念与层与层次次一一、所谓、所谓测量测量(MeasurementMeasurement) 定义定义:根据一定的法则,将某种物体或现象所具:根据一定的法则,将某种物体或现象所具有的属性或特征用数字或符号表示出来的过程。有的属性或特征用数字或符号表示出来的过程。 作用作用:确定一个特定分析单位的特定属性的类别:确定一个特定分析单位的特定属性的类别或水平。或水平。3PPT学习交流二二、测测量的四量的四个个要素要素测量客体测量客体测量内容测量内容测量法则测量法则数字和符号(
2、测量结果)数字和符号(测量结果)4PPT学习交流(1)测测量客体量客体即即测量的对象测量的对象 用数字或符号来进行表达、解释和说明的用数字或符号来进行表达、解释和说明的对象。对象。 “测量谁测量谁”5PPT学习交流(2)测测量量内内容容 测量客体的测量客体的某种属性或特征某种属性或特征 “测量什么测量什么”桌子桌子高度、宽度、颜色等高度、宽度、颜色等人人性别,年龄,社会背景等性别,年龄,社会背景等6PPT学习交流(3)测测量法量法则则 用数字和符号表达事物各种属性或特征的用数字和符号表达事物各种属性或特征的操作操作规则规则。 是不同特征或属性的标准是不同特征或属性的标准 “怎么测怎么测” 例:
3、身高例:身高7PPT学习交流有效测量法则的条件:有效测量法则的条件: 准确性准确性所指派的数字或符号能够真实、可靠、有效地反所指派的数字或符号能够真实、可靠、有效地反映调查对象在属性和特征上的差异。映调查对象在属性和特征上的差异。如,英语如,英语8080分与分与6060分分 完备性完备性能够包括研究变量的各种状态或变异。能够包括研究变量的各种状态或变异。如,中共党员和非党员如,中共党员和非党员 互斥性互斥性每一个观测对象(分析单位)的属性和特征都能每一个观测对象(分析单位)的属性和特征都能以一个而且只能以一个数字或符号来表示。以一个而且只能以一个数字或符号来表示。如,工人、农民、城市居民、干部
4、如,工人、农民、城市居民、干部8PPT学习交流(4)数数字和符字和符号号(测测量量结结果)果) 用来表示测量结果的用来表示测量结果的工具工具 “如何表示如何表示”收入状况:教师、公务员(测量客体);收入状况:教师、公务员(测量客体); 每月实际收入(测量内容);每月实际收入(测量内容); 工资条加上奖金(测量法则);工资条加上奖金(测量法则); 3000元、元、5000元(数字和符号)。元(数字和符号)。9PPT学习交流测测量量图图例例 1 1分析单位测量法则测量内容符号(数字)按政治兴趣问卷的回答得分个人N1(政治兴趣)(政治兴趣)最强最强一般一般较强较强较弱较弱最弱最弱54321N2N3N
5、410PPT学习交流测测量量图图例例 2 2分析单位测量法则测量内容符号(数字)按社保法企业N1N3N2五险一金五险一金实行实行未实行未实行YN11PPT学习交流测测量量图图例例 3 3分析单位测量法则测量内容符号(数字)按国家统计局的统计标准城市ACBD(规(规 模)模)700万万100万万15 万万50 万万12PPT学习交流三、社三、社会现会现象的象的测测量量 人一方面作为测量的客体或对象,而另一方面又作为测量人一方面作为测量的客体或对象,而另一方面又作为测量过程的主体,因而给社会现象的测量带来了无法回避的过程的主体,因而给社会现象的测量带来了无法回避的主主客观矛盾客观矛盾 社会测量的社
6、会测量的内容内容常常是社会中人们的行为,以及由人们的常常是社会中人们的行为,以及由人们的行为所构成的各种社会现象行为所构成的各种社会现象 在社会科学中,由于测量的对象十分复杂,因而测量的在社会科学中,由于测量的对象十分复杂,因而测量的量量化的程度比较低,可重复性也比较差化的程度比较低,可重复性也比较差 13PPT学习交流四、四、 测测量量层层次(尺度)次(尺度) 定类测量定类测量定类变量定类变量 定序测量定序测量定序变量定序变量 定距测量定距测量定距变量定距变量 定比测量定比测量定比变量定比变量14PPT学习交流测测量量层层次小次小结结定类变量定序变量定距变量定比变量类别区分(=、=)次序区分
7、(、)距离区分(+、)比例区分(、 )有有有有有有有有有有 概念概念 变量变量 指标指标 2 概概念的具体化念的具体化与与操作化操作化一、概念、变量与指标16PPT学习交流概概念念(1)概念()概念(concept)概念是对现象的一种抽象,它是一类事物的属性概念是对现象的一种抽象,它是一类事物的属性在人们主观上的反映。在人们主观上的反映。物质需求物质需求生活用品生活用品家具家具凳子凳子高高低低小小大大明确明确含糊含糊抽象层次抽象层次涵盖面涵盖面特征特征17PPT学习交流变变量量 变量(变量(Variable):包括若干个范畴、值或亚概):包括若干个范畴、值或亚概念的概念。念的概念。取取值值的的
8、穷尽穷尽性性取取值值的互斥性的互斥性常量常量(仅有一个取值的概念)(仅有一个取值的概念)18PPT学习交流指指标标 指标指标(Indicators):表示一个概念或变量含义的:表示一个概念或变量含义的一组可一组可观察到的事物观察到的事物,称为这一概念或变量的一组指标。,称为这一概念或变量的一组指标。研究社会现象时,就是把社会现象所涉及的概念当做一研究社会现象时,就是把社会现象所涉及的概念当做一个变量,然后通过操作化具体用一组指标来测量反映其个变量,然后通过操作化具体用一组指标来测量反映其特征或属性。特征或属性。屌丝屌丝19PPT学习交流20PPT学习交流概概念、念、变变量、指量、指标标及取及取
9、值关值关系系概念概念(对事物或(对事物或现象的抽象)现象的抽象)变量变量指标指标取值:取值:事物事物1 1事物事物2 2事物事物n具有多个取值具有多个取值的概念的概念表示变量含义表示变量含义的具体事物的具体事物21PPT学习交流二、操作化的含义与作用二、操作化的含义与作用 所谓所谓操作化操作化,就是要把我们无法得到的有关社会结构、,就是要把我们无法得到的有关社会结构、制度或过程,以及有关人们行为、思想和特征的制度或过程,以及有关人们行为、思想和特征的内在事实内在事实,用,用代表它们的代表它们的外在事实外在事实来替换,以便于通过后者来研究前者。来替换,以便于通过后者来研究前者。(1)(1)操作化
10、操作化就是将抽象的概念转化为可观察的具体指标的过就是将抽象的概念转化为可观察的具体指标的过程。程。(2)(2)是对那些抽象层次较高的概念进行具体测量所采用的程是对那些抽象层次较高的概念进行具体测量所采用的程序、步骤、方法、手段的详细说明。序、步骤、方法、手段的详细说明。22PPT学习交流 操作化是社会研究中由理论到实际、由抽象到具体这一过操作化是社会研究中由理论到实际、由抽象到具体这一过程的程的“瓶颈瓶颈”。 操作化过程,就是沟通抽象的理论概念与具体的经验事实操作化过程,就是沟通抽象的理论概念与具体的经验事实的一座桥梁,它为我们在社会研究中实际地测量抽象概念的一座桥梁,它为我们在社会研究中实际
11、地测量抽象概念提供了关键的手段。提供了关键的手段。测量什么怎样测量 概念的形成 概念的界定 选择测量指标 编制综合指标23PPT学习交流三、操作化的方法三、操作化的方法 概念澄清与界定概念澄清与界定 (1)收集和查询有关这一概念的各种不同的定义)收集和查询有关这一概念的各种不同的定义(2)对这些定义分类)对这些定义分类(3)决定一个定义)决定一个定义l可以用现成的定义可以用现成的定义l也可以在现有定义的基础上创造一个新的定义也可以在现有定义的基础上创造一个新的定义例:社区,有例:社区,有94种定义,分类后发现有三项基本元素:地种定义,分类后发现有三项基本元素:地域、共同的纽带、社会互动,定义为
12、一定地域中人们的域、共同的纽带、社会互动,定义为一定地域中人们的生活共同体生活共同体24PPT学习交流l 发展测量指标发展测量指标(1)列出概念的维度)列出概念的维度(2)建立测量指标()建立测量指标(把表示一个概念或变量含义把表示一个概念或变量含义的一组可观察到的事物,称做这一概念或变量的一的一组可观察到的事物,称做这一概念或变量的一组指标。)组指标。)如妇女社会地位,可分为政治地位、经济地位、如妇女社会地位,可分为政治地位、经济地位、法律地位、教育地位、家庭地位这几个维度法律地位、教育地位、家庭地位这几个维度 a.寻找和利用前人已有的指标,可以作一定寻找和利用前人已有的指标,可以作一定的修
13、改和补充,如一些量表的使用的修改和补充,如一些量表的使用 b.研究者先行进行一段时间的探索性研究研究者先行进行一段时间的探索性研究25PPT学习交流指指标标体系体系 设计调查指标,一般都是以一定的理论假设为指导,每一设计调查指标,一般都是以一定的理论假设为指导,每一个理论假设是由若干个概念组成的,每一个概念又需要通个理论假设是由若干个概念组成的,每一个概念又需要通过若干个调查指标来反映社会现象,这样就形成一个完整过若干个调查指标来反映社会现象,这样就形成一个完整的的调查指标体系调查指标体系。26PPT学习交流 设计设计指指标标的的过过程,就是由程,就是由“ “理理论论概概念念指指标标” ”的的
14、分解分解过过程。程。 概念1(智力)理论理论(人的素质)(人的素质)概念2(体力)概念3(思想)指标1(记忆)指标2(思维)指标3(观察)指标4指标5指标6指标7指标8指标927PPT学习交流指指标设计标设计的原的原则则 科学性科学性 完整性完整性 准确性准确性 可行性可行性28PPT学习交流四、指四、指标选择标选择的多的多样样性性 有些抽象概念往往很难、甚至不可能在具体现象中找到其所对应的指标,而且在许多情况下,一个操作性定义往往不能够完全代表一个概念 对这种抽象概念进行操作化时,往往在具体方法和测量指标方面,存在多种不同的选择 对同一个概念进行测量时,可能会产生出不同的测量指标 29PPT
15、学习交流以以“ “夫妻夫妻权权力力” ”的的测测量量为为例例1960年,美国社会学者布拉德和沃尔夫的八个指标 丈夫的职业选择 买什么样的汽车 是否买人寿保险 到什么地方度假 l 买什么样的房子 l 妻子是否应该参加社会工作 l 家里有人生病时,应去看哪位医生 l 全家每周在食品方面应花多少钱 30PPT学习交流1971年年森特斯森特斯增加了下面六个指标增加了下面六个指标 请谁来做客和与谁一起出门 怎样装饰房间和摆设家具 收看什么电视节目和广播节目 家庭的正餐吃什么 买什么样的衣服 配偶应买什么样的衣服 31PPT学习交流结结果比果比较较 在在森特斯森特斯的研究中,前八个问题的调查结果与的研究中
16、,前八个问题的调查结果与布拉德布拉德等人等人的研究结果几乎完全一致,但加上六个新问题时,丈夫的的研究结果几乎完全一致,但加上六个新问题时,丈夫的权力下降了权力下降了 结果表明,结果表明,夫妻权力的对比和分布随着所考察的决策方面夫妻权力的对比和分布随着所考察的决策方面的不同而不同的不同而不同 32PPT学习交流台台湾湾社社会学会学者者陈陈明穗明穗1986年的年的15项项指指标标 丈夫的职业选择 妻子的职业选择 家人生病该看哪个医生 家庭生活费的支配 度假、旅游及休闲活动 子女的教育 谁代表参加婚丧喜庆 谁决定送礼与回赠礼物 生育子女数目 购买贵重物品 置产(买房子、土地等) 房子布置及购买家具
17、订阅报刊、选择电视节目等 是否买保险 何种家电用品该淘汰换新 33PPT学习交流例例1“ “现现代化的生存代化的生存环环境境” ” 李银河博士在研究浪漫爱情时,试图检验这样一个假设:人们的生存环境越接近现代化,则他们越会看重浪漫爱情 为此,她需要对“现代化的生存环境”进行操作化 五、操作化的几五、操作化的几个个例子例子34PPT学习交流“现现代化生存代化生存环环境境” ”的的操作化操作化 概 念 维 度 指 标 时间维度年龄现代化的 空间维度城乡社区生存环境 社会经济地位维度教育程度 职业地位 例例2“ “溺溺爱爱孩子孩子” ” 风笑天教授在研究独生子女的教育问题时,需要了解和比较独生子女父母
18、与非独生子女父母在溺爱孩子方面的行为表现和心理状态 研究中,风笑天教授将“溺爱孩子”的概念操作化为四个不同维度 36PPT学习交流“溺溺爱爱孩子孩子” ”的四的四个个不同不同维维度度 不注意培养孩子的生活自理能力 不注意培养孩子的劳动习惯 对孩子过分迁就 物质上对孩子尽量满足 37PPT学习交流概概念念的操作化(的操作化(续续) 假假设设的操作化的操作化 即将抽象假设转换为具体假设的过程。它是经验推论的组成部分,同时又是以概念的操作化为基础。例:在“为什么近来亲戚关系越来越淡漠”课题中,研究假设:“工业化的发展导致亲戚关系的淡漠”的操作化过程: A、找出其中的关键性关联概念:“工业化”、“亲戚
19、关系” B、将这些概念具体化和操作化: “工业化”的测量指标有:“工业生产总值”、“人均收入”、“人均汽车拥有量”等。 “亲戚关系”的测量指标有:“每年走亲戚的次数”、“亲戚间互助行为的多少”、“亲戚间经济关系的强弱”等。38PPT学习交流 如果这些指标确实反映了概念的内含,那么研究假设中如果这些指标确实反映了概念的内含,那么研究假设中所说明的概念间的关系也必然会存在于指标之间。也就所说明的概念间的关系也必然会存在于指标之间。也就是说,如果研究假设说明两个概念间具有相关关系,那是说,如果研究假设说明两个概念间具有相关关系,那么具体假设则说明两概念间具有相关关系,由概念所推么具体假设则说明两概念
20、间具有相关关系,由概念所推演的指标间也具有相关关系演的指标间也具有相关关系。所以,所以, C C:陈述各指标间的关系假设,形成具体假设,完成:陈述各指标间的关系假设,形成具体假设,完成假设的操作化:假设的操作化: 研究假设:研究假设:“工业化的发展导致亲戚关系的淡漠” 具体假设:具体假设: (1)“工业产值越高,每年亲戚见面次数越少” (2)“人均收入越高,亲戚间经济联系越弱” (3)“人均汽车拥有量越高,亲戚间互助行为越少” 39PPT学习交流练练 习习 1 1、对、对“文明素质文明素质”这一概念进行操作化这一概念进行操作化 2 2、如果我们现在研究父母投资和子女赡养关系的、如果我们现在研究
21、父母投资和子女赡养关系的研究,其中对于研究,其中对于“父母投资父母投资”这一概念,请进行这一概念,请进行操作化操作化40PPT学习交流“父母投父母投资资” ”的操作化框架的操作化框架父母投资早期家庭帮助近期给与的帮助正在给与的帮助被访者早期对家庭帮助的依赖被访者早期对家庭帮助的依赖父母为子女结婚所花的费用父母为子女结婚所花的费用被访人的教育水平被访人的教育水平婚后的居住情况婚后的居住情况是否在家做作业是否在家做作业在升学上是否得到帮助在升学上是否得到帮助在就业上是否得到帮助在就业上是否得到帮助在换工作上是否得到帮助在换工作上是否得到帮助在分房上是否得到帮助在分房上是否得到帮助照看孩子照看孩子做
22、家务做家务提供经济上的帮助提供经济上的帮助照看孩子照看孩子做家务做家务提供经济上的帮助提供经济上的帮助41PPT学习交流六、量表六、量表 调查中,常常要测量人们的态度、看法、意见、调查中,常常要测量人们的态度、看法、意见、性格等主观性较强的内容,它们往往比较复杂,一性格等主观性较强的内容,它们往往比较复杂,一般很难用单一的指标进行测量。对此类般很难用单一的指标进行测量。对此类概念需进行概念需进行复合测量,通常借助量表。复合测量,通常借助量表。量表量表:是一种具有结构强度顺序的复合测量,即全部陈述或项是一种具有结构强度顺序的复合测量,即全部陈述或项目是按一定的结构顺序来安排,以反映出所测量出的概
23、目是按一定的结构顺序来安排,以反映出所测量出的概念或态度具有的各种不同的程度。念或态度具有的各种不同的程度。42PPT学习交流 (1)量表的主要作用在于能间接的、定量的方式测量那些难以直接观测和客观度量的人们的主观态度,特别是测量态度和观念的不同程度和差异; (2)量表通常由多项测量内容综合而成,它测量的是变量的综合指标; (3)量表通过对变量的不同变异赋予相应的分值,使不同选项能够反映变量变异的强弱,量表所列指标的指标值必须按一定强度顺序排列的分值来表示,这是量表和问卷等其他测量工具之间的最大的区别。 主要特点:43PPT学习交流量表的量表的类类型型: 从内容上分 从形式上分 态度量表 能力
24、量表 性格量表 工作成绩量表 社会地位量表 总加量表 语义差异量表 社会距离量表44PPT学习交流几几种种常常见见的量表的量表 1、总总加量表(原始)加量表(原始) 就是由多个不同的回答所构成的一个简单就是由多个不同的回答所构成的一个简单累加的分数。累加的分数。 它是由一组有关事物的态度或看法的陈述它是由一组有关事物的态度或看法的陈述构成,回答者分别对这些陈述发表同意或不同构成,回答者分别对这些陈述发表同意或不同意的意见,然后按某种标准将回答者在全部陈意的意见,然后按某种标准将回答者在全部陈述上的得分加起来,就得到了该回答者对这一述上的得分加起来,就得到了该回答者对这一事物态度的量化结果。事物
25、态度的量化结果。 指数:指数: 贝贝利生育意愿量表(指利生育意愿量表(指数数)同意不同意1. 结婚的主要原因之一是要生孩子。102.只生一个孩子是错误的,因为独生子女是在孤独中成长,且由于无兄弟姐妹而忧郁。103.生育孩子是一个妇女所能具有的最深刻的经历之一104.两种性别的孩子至少都有一个比仅有一种性别的孩子好。105.没有孩子的妇女决不会感到完全的满足。106.男人直到他业已证明自己成为了孩子的父亲时,才算是“真正的男人。107.(由于生育控制、绝育或年老等因素)不能导致怀孕的性生活是不道德的。108.未结婚的、或者结了婚而没有孩子的男人可能是同性恋者。109.妇女的首要职责是做母亲,只有
26、在不影响其母亲职责时,才谈得上她的事业。1010.没有孩子的夫妇实在可怜。10 李克特量表可以说是前述指数的一种特定李克特量表可以说是前述指数的一种特定形式,它是由美国社会心里学家李克特(形式,它是由美国社会心里学家李克特(Likert Scaling)于)于1932年在原有的指数形式的基础年在原有的指数形式的基础上改进而成的。上改进而成的。 回答者对陈述的回答由两类改进成五类。 2、李克特量表、李克特量表48PPT学习交流请你对请你对下列看法下列看法发发表意表意见见非常同意同意无所谓不同意很不同意1、婚事应该尽量办得简单一些2、结婚是人生一件大事,婚事应该办得隆重、热闹、花再多钱也值。3、就
27、是有钱,婚事也不应大操大办。4、为了不让别人笑话,就是借钱也要把婚事办得像个样子。然后对回答者的得分加总,测量出该回答者对某事物的态度。李克特量表的制作程序:李克特量表的制作程序:1、根据所要测量的内容或变量收集大量与这一内容有关的问、根据所要测量的内容或变量收集大量与这一内容有关的问题,然后初步筛选出一组问题(一般题,然后初步筛选出一组问题(一般1030个)作为量表草个)作为量表草案。案。2、确定问题的类别和计分标准、确定问题的类别和计分标准注:在给答案赋值时,一定要注意每条陈述的逻辑,如果逻辑相反,则应调整赋值。3、试调查、试调查4、计算各题的分辨力,删去分辨力不高的题目,保留分辨力较、计
28、算各题的分辨力,删去分辨力不高的题目,保留分辨力较高的题目(一般高的题目(一般520个)组成正式量表。个)组成正式量表。 检查分辨力的方式是检查分辨力的方式是:将试调查中得分最高的:将试调查中得分最高的25%的人与得分的人与得分最低的最低的25%的人进行比较,然后计算出每道题的分辨力。的人进行比较,然后计算出每道题的分辨力。 每题的分辨力系数每题的分辨力系数=得分最高的得分最高的25%的人在这一道题上的平均分的人在这一道题上的平均分-得分最低的得分最低的25%的人在这一题上的平均分的人在这一题上的平均分分辨力系数绝对值越小,说明这一题的分辨力越低,这种题目应分辨力系数绝对值越小,说明这一题的分
29、辨力越低,这种题目应当删除。当删除。5、量表设计好后,就开始正式调查、量表设计好后,就开始正式调查3、鲍鲍格格达达斯社斯社会会距离量表距离量表 定量测量人们相互间交往的程度、相互关定量测量人们相互间交往的程度、相互关系的程度或者对某一群体所持的态度及所保持系的程度或者对某一群体所持的态度及所保持的距离。例如,要测量人们对黑人的态度。的距离。例如,要测量人们对黑人的态度。52PPT学习交流愿意愿意不愿意不愿意1 1、你愿意让黑人生活在你的国家、你愿意让黑人生活在你的国家吗?吗?2 2、你愿意让黑人生活在你所在的、你愿意让黑人生活在你所在的城市吗?城市吗?3 3、你愿意让黑人住在你们那条街、你愿意
30、让黑人住在你们那条街吗?吗?4 4、你愿意让黑人做你的邻居吗?、你愿意让黑人做你的邻居吗?5 5、你愿意与黑人交朋友吗?、你愿意与黑人交朋友吗?6 6、你愿意让你的子女和黑人结婚、你愿意让你的子女和黑人结婚吗?吗?4、语义语义差差异异量表量表 应用应用: : 主要用于文化的比较研究、个人及群体间主要用于文化的比较研究、个人及群体间差异的研究,以及人们对周围环境或事物的态差异的研究,以及人们对周围环境或事物的态度、看法的研究等等。度、看法的研究等等。 语义差异量表也称语义分化量表,它主要用来研究概念对于不同的人所具有的不同含义。54PPT学习交流例如例如: :要了解人们对女性角色的理解和看法(女
31、同学)要了解人们对女性角色的理解和看法(女同学)热情的:冷漠的主动的:被动的大方的:拘谨的强 的:弱 的快 的:慢 的善 的:恶 的 语义差异量表所采用的数对形容词要能够考察被调查者对研究对象的感觉和态度的各种要素或各种维度。55PPT学习交流 对于任何一种测量工具或测量手段来说,都会涉对于任何一种测量工具或测量手段来说,都会涉及到这样一些基本问题:及到这样一些基本问题: 测量所得的数据或资料是否与人们感兴趣的特征有关?测量所得的数据或资料是否与人们感兴趣的特征有关? 测量所得的结果是否正是人们所希望测量的东西?测量所得的结果是否正是人们所希望测量的东西? 当这种测量的时间、地点及操作者发生改
32、变时,测量的当这种测量的时间、地点及操作者发生改变时,测量的结果将会受到什么样的影响?结果将会受到什么样的影响? 3 测测量的信度量的信度与与效度效度56PPT学习交流效度?效度?信度?信度?whats reliability? whats validity?57PPT学习交流一、信一、信 度度 (reliability)(reliability)(一)(一)信度的定义信度的定义它指的是采取同样的方法对同一对象重复进行测量时,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。其所得结果相一致的程度。(reliability)(reliability)即可靠性即可靠性 信度
33、信度是指测量结果的一致性或稳定性,即测量工具是指测量结果的一致性或稳定性,即测量工具能否稳定地测量所测的事物或变量。能否稳定地测量所测的事物或变量。 能否减少随机误差对问卷测验结果的影响能否减少随机误差对问卷测验结果的影响测验结果是否随时间和地点等因素而变化测验结果是否随时间和地点等因素而变化58PPT学习交流五名五名学学生生两两次次测验测验的成的成绩绩平时名次排列甲测验乙测验学生实得分数名次实得分数名次ABCDE 12345 9385786961 12345 7468856480 34152 信度系数信度系数 即用同一样本所得到的两组资料的相关系数作为测量即用同一样本所得到的两组资料的相关系
34、数作为测量一致性的一致性的指标。用指标。用r来表示 一般来说,r0.8,即可认为该测量是达到了足够的信度。 (二)信度的类型(二)信度的类型 再测信度(重测信度)再测信度(重测信度) 复本信度复本信度 折半信度折半信度 克隆巴赫信度系数克隆巴赫信度系数 (cronbachs ) 60PPT学习交流 (1 1)重测信度)重测信度( (test-retest reliability) ) 假定短时间内一批对象的状况并没有改变,对每个对象用同一个问卷先后测验两次,两次测验得分的相关系数就称为重测信度。重测信度是用皮尔逊积差相关系数r公式计算的。 61PPT学习交流重测信度也存在着局限性:重测信度也存
35、在着局限性: 间隔时间长,环境影响; 如果间隔时间短,记忆影响。62PPT学习交流(2)(2)复本信度(复本信度(alternate form reliability) 复本通常是根据相同的设计说明分别独立编制的两个平行问卷,即题目不同但是内容相似的两份问卷。复本信度也叫等值性系数(coefficient of equivalence)。两个复本间隔一定时间或同时施于同一答卷者所得分数的相关系数就是复本信度。注:注:使用的复本必须是真正的复本,即在题数、形式、使用的复本必须是真正的复本,即在题数、形式、内容、难度及鉴别度等方面都与原本一致,仅只在内容、难度及鉴别度等方面都与原本一致,仅只在问法
36、与用词方面与原本不同。问法与用词方面与原本不同。63PPT学习交流 缺点: 如复本编制不容易,易出现顺序效应,受练习的影响; 复本信度只能反应问卷内容所造成的误差,无法反应答卷者本身所造成的误差等。测量工具的一致性测量工具的一致性64PPT学习交流(3)(3)分半信度分半信度( (split-half reliability) ) 当测验没有复本且测验不可避免地受到时间的影响,只适合用于一次测验时,可用分半信度。 分半的方法很多,一般是将奇数题和偶数题各作为一半,而非前后分半,目的是避免顺序效应。分半信度也叫折半信度,其计算方法是将问卷的题目分成对等的两半,分别求出两半题目的总分,再计算两部分
37、总分的相关系数。65PPT学习交流 使用分半信度时要注意两个问题: 一是问卷题目所测的应是同一种事物或概念; 二是两半题目应是等值的。两半内容相同,表达形式不同。问卷内部的一致性问卷内部的一致性66PPT学习交流(4)克隆巴赫信度系数克隆巴赫信度系数 (cronbachs ) Cronbachs 系数是Cronbach于1951年创立的,用于评价问卷的内部一致性。系数取值在0到1之间,系数越高,信度越高,问卷的内部一致性越好。Cronbachs 系数不仅适用于两级记分的问卷,还适用于多级计分的问卷。 67PPT学习交流其其计计算公式算公式为为: )1 (1212XniiSSnn式中n为问卷包含
38、的题目数,2iS为答卷者在第i题得分的方差,2XS为答卷者问卷测验总得分的方差。 系数是所有可能的分半信度的平均值68PPT学习交流 低信度:0.35 中信度: 0.350.70 高信度: 0.70 一般地,问卷的系数在0.8以上,该问卷才具有使用价值。Cronbachs 值皆值皆达达0.85以上,以上,表明表明问卷问卷信度良好。信度良好。69PPT学习交流 问卷的信度越高,受到人、时、地、物的干扰就越低,其所能反应事实或让人相信的程度越高,因此在问卷实施前如何有效提高信度是问卷测验成败的关键。通常提高问卷信度的方法为:(三)提高信度的方法(三)提高信度的方法70PPT学习交流(1)适当延长问
39、卷的长度 问卷题目较多,其在一定程度上排除了偶然因素的影响,从而提高了问卷的信度。 但是问卷长度的增加与问卷的信度的增加并不总是成正比的,当信度系数较小时,延长问卷长度,问卷的信度系数增加较大;而当信度系数较大时,延长问卷长度对信度系数的影响就较小。71PPT学习交流(2)问卷的难度适中 当问卷题目难度太大时,问卷得分普遍过低;当问卷题目难度太小时,问卷得分普遍较高。问卷题目太难或太易都会使问卷得分差异减小,使实得分数方差减小,从而降低了问卷的信度。 72PPT学习交流(3)问卷的内容尽量同质 内容同质的问卷,要求答卷者具有相同的能力、知识和技能。因而为了提高问卷的信度,问卷的内容应尽量保持同
40、质。 73PPT学习交流(4)测验的时间要充分 一份问卷应保证绝大多数答卷者在规定的时间内能完成测验。当答卷者不能从容地回答所有题目时,问卷的得分就不能反映答卷者的真实情况。 74PPT学习交流(5)测验的程序要统一 问卷题目要统一,指导语、回答问题的方式、分收试卷的方法和问卷测验的时间等都要统一,这些是问卷有较高信度的基本保证。 75PPT学习交流 效度(validity)通常是指问卷的有效性和正确性,亦即问卷能够测量出其所欲测量特性的程度。 对于一个标准测验来说,效度比信度更为重要。二、效二、效 度度 (validity)76PPT学习交流1.效度分析的意义 效度是问卷调查研究中最重要的特
41、征,问卷调查的目的就是要获得高效度的测量与结论,效度越高表示该问卷测验的结果所能代表要测验的行为的真实度越高,越能够达到问卷测验目的,该问卷才正确而有效。 问卷的准确性或称为有效性是用问卷的效度加以刻划的,它反映了对问卷的系统误差的控制程度。 77PPT学习交流2 2、效度的定义、效度的定义 效度是指问卷测验的准确性,即测验能够反映所要测量特性的程度. 其包括两个方面的含义:一是问卷测验的目的;二是问卷对测量目标的测量精确度和真实性。效度是一个具有相对性、连续性、间接性的概念。78PPT学习交流 3.常用的效度指标 确定一个问卷效度的方法,通常是以答卷者的问卷得分和另一个效度标准求相关,以其相
42、关系数的大小来表示效度。如果相关系数高,则该问卷的效度就高。 一般常用的效度指标有内容效度、结构效度、准则效度。79PPT学习交流(1)内容效度 (content validity) 内容效度是指问卷内容的贴切性(relevance)和代表性(representativeness),即问卷内容能否反应所要测量的特质,能否达到测验目的,较好地代表所欲测量的内容和引起预期反应的程度。内容效度常以题目分布的合理性来判断,属于命题的逻辑分析,所以,内容效度也称为“逻辑效度” (logical validity)、“内在效度(intrinsic Validity)”、“循环效度(circular val
43、idity)”。80PPT学习交流 内容效度的评价主要通过经验判断进行,通常考虑3方面的问题: 其一是项目所测量的是否真属于应测量的领域; 其二是测验所包含的项目是否覆盖了应测领域的各个方面; 其三是测验题目的构成比例是否恰当。 测量内容或测量指标与测量目标之间的合适性和逻辑相符性81PPT学习交流 常用的内容效度的评价方法有两种: 一是专家法,即请有关专家对问卷题目与原来的内容范围是否符合进行分析,作出判断,看问卷题目是否较好地代表了原来的内容。 二是统计分析法,即从同一内容总体中抽取两套问卷,分别对同一组答卷者进行测验, 两种问卷的相关系数就可用来估计问卷的内容效度。 计算某个问题与去掉此
44、问题后总得分的相关性情况,分析是否需要被剔除(敏感性分析)。 82PPT学习交流(2)结构效度(Construct Validity) 结构效度又称构想效度,是指问卷对某一结构效度又称构想效度,是指问卷对某一理论概念或特质测量的程度,即某问卷测验的理论概念或特质测量的程度,即某问卷测验的实际得分能解释某一特质的程度。如果我们根实际得分能解释某一特质的程度。如果我们根据理论的假设结构,通过问卷测验得到答卷者据理论的假设结构,通过问卷测验得到答卷者实际分数,经统计检验,结果表明问卷能有效实际分数,经统计检验,结果表明问卷能有效解释答卷者该项特质,则说此问卷具有良好的解释答卷者该项特质,则说此问卷具
45、有良好的结构效度。结构效度。测量值同理论假设的符合程度83PPT学习交流常用的确定结构效度的方法有:常用的确定结构效度的方法有: (1)根据文献、前人研究结果、实际经验等建 立假设性理论建构; (2)对问卷题目进行分析。主要是分析问卷的 内容,答卷者对题目所作的反应,问卷题 目的同质性以及分项目之间的关系来判断 问卷的结构效度; (3)根据建构的假设性理论编制适当的问卷; (4)计算与同类权威问卷的相关; (5)以统计检验的实证方法去考查问卷是否能 有效解释所欲建构的特质。 84PPT学习交流3效标效度(Criterion Validity) 效标效度也称为准则关联效度(Criterion-R
46、elated Validity)、经验效度(Empirical Validity)、统计效度(Statistical Validity)。效标效度是说明问卷得分与某种外部准则(效标)间的关联程度,用问卷测量得分与效度准则之间的相关系数表示。 与已有的效度较高的测量的相关程度85PPT学习交流一般估计效标效度的主要方法有:一般估计效标效度的主要方法有: (1)相关法,即求某问卷分数与效标间的相关,所得结果即效标效度。 (2)区分法,即看问卷分数是否可以区分由效标所划分的团体。 可以运用t检验对先后两次问卷结果平均分数进行差异性检验。若差异有统计学意义,说明问卷是有效的;若差异无统计学意义,说明问
47、卷是无效的。 86PPT学习交流6.效度的评价 Spitzer认为如果满足以下几个条件就可以认为问卷由效: (1)问卷有内容效度和结构效度; (2)在问卷制定阶段应当请有关人员提出意见,供修正和提高内容效度; (3)问卷经过反复使用证明了其可靠性;87PPT学习交流7.7.提高问卷效度的方法提高问卷效度的方法 (1)理论正确,解释清楚。问卷内容要适合问卷测验的目的,题目要清楚明了,易于理解,问卷的排列要由易到难,题目的难度和区分度要合适; (2)操作规范以减少误差; (3)控制系统误差。它主要包括仪器不准,题目和指导语有暗示性,答案安排不当(被试可以猜测)等, 控制这些因素可以降低系统误差,
48、提高效度; 88PPT学习交流 (4)样本适宜且要预防流失。重视问卷调查的回收率。样本容量一般不应低于30; (5)适当增加问卷的长度。增加问卷的长度既可提高问卷的信度,也可以提高问卷的效度,但增加问卷的长度对信度的影响大于对效度的影响; (6)排除无关因素干扰。认清并排除足以混淆或威胁结论的无关干扰变量。 89PPT学习交流三、信度三、信度与与效度的效度的关关系系 缺乏信度的测量是无效度的测量;而具有高信度缺乏信度的测量是无效度的测量;而具有高信度的测量并不意味着同时是高效度的测量,也许是的测量并不意味着同时是高效度的测量,也许是有效的,也许是无效的。有效的,也许是无效的。两者的关系是:两者的关系是:(1)信度低,效度不可能高)信度低,效度不可能高(2)信度高,效度未必高(有可能很低)信度高,效度未必高(有可能很低)(3)效度低,信度可能高)效度低,信度可能高(4)效度高,信度必然也高)效度高,信度必然也高90PPT学习交流高信度,低效度高信度,低效度( (可信但无效可信但无效 ) )91PPT学习交流高效度,低信度高效度,低信度( (有效但不可信有效但不可信) )92PPT学习交流高效度,高信度高效度,高信度(可信可信并并有效有效 )93PPT学习交流此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!