1、L/O/G/O测量与量表、信度与效度第四组Contents Measurement and Scaling (测量和量表) Basic concepts in measurement (基本概念) Measurement (测量) Scaling techniques (量表技术) Reliability and Validity (信度和效度) Potential Sources of Error on Measurement (测量误差) Reliability (信度) Validity (效度)1.Measurement and Scaling Basic concepts in me
2、asurement(1)Constructs(结构或概念)(2)Theoretical definitions(理论定义)(3)Operational definitions(操作定义)(4) variable(变量)Scaling techniques: Comparative vs. Noncomparative scaling techniques (比较量表技术和非比较量表技术)决定测量水平的四个尺度特征:Description(属性)Order(顺序)Distance(距离)Origin (零点)主要的四类测量尺度类型Nominal(定类尺度)Ordinal(定序尺度)Interva
3、l(定距尺度)Ratio(定比尺度) 1相关概念 Title in here3量表技术2测量1.1相关概念Constructs(构造):l我们想要测量的属性以及对概念及结构精确含义的定义l构造在科学哲学是一个理想的对象,它的存在取决于一个主题的思想。而不是一个真正的、真实的对象(真正对象的存在并不取决于思想的存在)l构造是一个不能直接观测的解释变量。l“概念”,科学假设和理论(如:进化理论, 引力理论), 以及分类(例如:在生物分类法概念性的实体)是构造。真正的对象(这不是构造):律师、汗衫.l创建构造是操作化的一部分,特别是创建theoretical definitions理论定义.一个概念
4、化的有效性在很大程度上取决于建构效度。1.1相关概念Theoretical definitions(理论性定义):l对一般期望和行为品质方面的定义l理论性定义是在特定的学科理论的方面上定义出一个词的含义l理论定义包含内置的理论。l如:重量的理论定义:测量重力作用于一个物体Operational definitions(操作性定义):l是根据可观察、可测量、可操作的特征来界定变量含义的方法。从具体的行为、特征、指标上对变量的操作进行描述,将抽象的概念转换成可观测、可检验的项目。从本质上说,下操作性定义就是详细描述研究变量的操作程序和测量指标。l下操作性定义的方法: 条件描述法:饥饿-指连续24小
5、时没进食物的状态 指标描述法:青少年-可界定为年龄在7岁以上,18岁以下的人 行为描述法:合作- 对别人的活动给予支持并直接参与活动,成为其中一员l如:重量的操作性定义:在牛顿弹簧秤 测量一个对象的结果1.1相关概念variable(变量):Discrete variable (离散变量):l在一个有限的,通常小数量的可能的值。l其数值只能用自然数或整数单位计算l例如:企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得. Continuous variable(连续变量):理论上可以承担无限数量的值。在一定区间内可以任意取值,其数值是连续不断的,相邻两个数值
6、可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.1.2Measurement测量1.2.1Definition of measurement测量:按照特定的规则对测量对象(目标、人物或事件)的某种属性赋予数字或符号,将其属性量化的过程。是调研者对研究对象某些特征的数量或强度的度量。测量的特点:测量是有对象的,其对象为事物的特征。具有客观特征和主观特征两种形式测量要依据一定的法则测量要使用特定的量具测量是对物体属性的定量描述1.2Measurement测量特征测量结果张先生李女士王先生年龄岁 354221年收入/
7、元550005000024000性别男女男目前购买的品牌富康赛欧无对富康轿车的评价非常好一般好实例:1.2Measurement测量u客观特征是指研究对象的物理特征,它是比较简单、容易理解的,如上表中消费者的年龄、年收入、性别、目前购买的品牌等。u营销调研人员常常希望能测量研究对象的主观特征,这些主观特征不能通过直接的观察获得,因为它们属于人们思想方面的东西,包括人们的态度、偏好、生活方式等,如表消费者对富康轿车的评价。u在这种情况下,要求将研究对象的主观特征转化为可以用数字表示的强度关系。为了做到这一点,营销诃研人员必须构建能够让研究对象清楚分辨的问答形式,这一过程就称为量表设计。1.2Me
8、asurement测量尺度特征Distance(距离)描述符之间的差异是已知的Description(说明)使用一个描述符,或标签,代表每个“单位”的规模Origin (零点)绝对的起点Order(顺序)相对大小描述符,允许我们说一个是“大/小于“另一个1.2.2Scale characteristics determine the level of measurement (决定测量水平的四个尺度特征):例如在冬天,我们可以测得北京的气温为0,但它却并不是表示北京“没有温度”,而只是代表北京的气温达到了水的“结冰点温度”。从测量的角度看,此时的“0”只不过是一个特定的数字而已,它是人们主观认
9、定和选取的。因为在另一种温度量表中(华氏温度计中),0度则是冰点下32。Yes no male female1.2Measurement测量Nominal Scales(定类尺度)Ordinal Scales(定序尺度)Interval Scales(定距尺度)Ratio Scales(定比尺度)41231.2.3Primary Scales of Measurement (主要的四类测量尺度类型)Nominal Scales(定类尺度)定义: 也称类别尺度或名义尺度,是将调查对象分类,标以各种名称,并确定其类别的方法。它实质上是一种分类体系。即将调查对象的不同属性或特征加以区分,标以不同的名
10、称或符号,确定其类别。数学特征: 主要是:“等于”与“不等于”(或者“属于”与“不属于”)例子: 人们的性别、职业、婚姻状况、宗教信仰等特征的测量,都是常见的定类尺度的测量。 Ordinal Scales(定序尺度)定义: 也称为等级尺度或顺序尺度。按照某种逻辑顺序将调查对象排列出高低或大小,确定其等级及次序的一种尺度。不仅能够像定类尺度一样,将不同的事物区分为不同的类别,而且还能反映事物或现象在高低、大小、先后、强弱等序列上的差异。数学特征: 大于()或小于(、) 无有有有距离区分(+、-) 无无有有比例区分(X、) 无无无有 四种测量尺度的特征总结:定类尺度定序尺度定距尺度定比尺度Desc
11、ription(说明)有有有有Order(顺序)无有有有Distance(距离)无无有有Origin (零点)无无无有练习:判断下列问题所使用的尺度类型并解释1、请根据你的偏好对下列活动分配15的等级顺序(定序) a.阅读杂志 b.购物 c.看电视 d.约会 e.在餐馆吃饭2、你的性别是(定类)3、你平均每天花多少时间做家庭作业(定距)a.少于15分钟 b.1530分钟 c.3160分钟d.61120分钟 e.多于120分钟4、上个月你在娱乐方面花了多少钱(定比)课堂活动1.3Scaling techniques量表技术1.3Scaling techniques量表技术 比较量表Compara
12、tive scaling techniques : 涉及到对刺激物体的直接比较;其数据必须以相对的关系来解释,且只有定序或等级顺序的性质 非比较量表Noncomparative scaling techniques : 在此量表中,每个物体被独立于刺激物背景中的其他物体而计量;结果数据通常被假定为定距或定比的1.3Scaling techniques量表技术1.配对比较量表1.3Scaling techniques量表技术 表中每一行列交叉点上元素表示该行的品牌与该列的品牌进行比较的结果,元素“1”表示受测者更喜欢这一列的品牌,“0”表示更喜欢这一行的品牌。将各列取值进行加总,得到表中合计栏,
13、表明各列的品牌比其它品牌更受偏爱的次数。 从表看到受测者在华夏牙膏和靓妹牙膏中更偏爱前者(第二行第一列数字为1)在“可传递性”的假设下,可将配对比较的数据转换成等级顺序。 将表的各列数字分别加总,计算出每个品牌比其他品牌更受偏爱的次数,就得到该受测者对于5个牙膏品牌的偏好,从最喜欢到最不喜欢,依次是两面针、华夏、靓妹、洁齿灵和白珊瑚。 “可传递性”是如果一个人喜欢A品牌甚于B品牌喜欢B品牌甚于C品牌,那么他一定喜欢A品牌甚于C品牌。1.3Scaling techniques量表技术 在配对比较量表中,受测者被要求对一系列对象两两进行比较,并根据某个标准在两个被比较的对象中做出选择,是一种使用很
14、普遍的态度测量方法,获得的数据具有顺序尺度。 优点: 配对比较量表在操作上简单易行 配对比较也可以避免等级量表的顺序误差 缺点: 当要评价的对象的个数太多时,配对比较法使用很麻烦 对象列举的顺序可能影响受测者,造成顺序反应误差 配对比较量表的另一个缺点是“可传递性”的假设可能不成立 “2中选1”的方式和实际生活中作购买选择的情况也不太相同,受访者可能在A、B两个品牌中对A要略为偏爱些,但实际上却两个品牌都不喜欢。1.3Scaling techniques量表技术2.等级顺序量表 等级顺序量表是将多个评价对象同时展示给受测者,并要求他们根据某个标准对这些对象排序或分成等级 例如: 以下是一些彩色
15、电视机的品牌名称,请将它们按你所喜好的程度排序。(其中1表示你最喜欢,2表示其次喜欢,以此类推,5表示你最不喜欢。)长虹()康佳()TCL()厦新()熊猫()1.3Scaling techniques量表技术3.常量和量表 常量和量表要求受测者根据一些标准在评价对象的一组属性中分配一个固定的常量(如一百分) 以反映受测者对这些属性的相对偏好或重要性。 一百分数为例,如果某项属性比另一项更重要,就给这项属性更多的分数,如果认为这项属性的重要性是另一项属性的两倍,那么给这项属性的分数就是另一项属性的分数的两倍。无论如何,各项属性分配的分数总和是常数100.1.3Scaling techniques
16、量表技术3.常量和量表 优点: 不需要太多时间就能得到刺激物体之间的微小差异 缺点: 调查对象分配的单位可能会比指定的多或少 使用单位过少,产生舍入误差;过多则会加重被调查者负担,混淆或疲劳 1.3Scaling techniques量表技术4.连续评分量表 又称为图示评价量表。一般图示评价量表,要求应答者在一个有两个固定端点的图示连续体上进行选择;评价量表获得的数据通常作为和表等距数据使用和处理。 调查对象通过在一条直线上的适当位置作出标记来为物体评分,这条直线从某个标准的一个极端到另一个极端。 1.3Scaling techniques量表技术5.列举评价量表 列举评价量表是要求应答者在有
17、限类别的表格标记中进行选择。下面我将向您列举一些白酒品牌,当我提到某一种品牌时,请您告诉我您认为该品牌的电视广告是非常差的、差的、一般的、好的还是非常好的起始位置 孔府家酒 秦池古酒 喜临门酒 五粮液1 非常差 2 差 3 一般 4 好 5 非常好 1.3Scaling techniques量表技术6.沙氏通量表 在市场营销研究中,经常涉及到对某一主题的态度测量如:人们对于电视广告的态度、对人寿保险的态度等。 沙斯通量表通过应答者在若干(一般915条)与态度相关的语句中选择是否同意的方式,获得应答者关于主题的看法。 局限性: 是顺序量表,可以用两个受测者的态度分数比较他们对某一问题所持态度的相
18、对有利和不利的情况,但不能测量其态度的差异大小。 不同的人即使态度完全不同,也有可能获得相同的分数。 使用沙斯通量表无法获得受测者对各条语句同意或不同意程度的信息 。1.3Scaling techniques量表技术6.沙氏通量表基本步骤:1、收集大量的要测量的态度语句(一般应在100条以上),保证其中对主题不利的、中立的和有利的语句都占有足够的比例,并将其分别写在特制的卡片上;2、选定20人以上的评定者,按照各条语句所表明的态度有利或不利的程度,将其分别归入十一类别。第一类代表最不利的态度,依此类推,第六类代表中立的态度,第十一类代表最有利的态度3、计算每条语句被归在这11类中的次数分布;4
19、、删除那些次数分配过于分散的语句;5、计算各保留语句的中位数,并将其按中位数进行归类,如果中位数是n,则该态度语句归到第n类;6、从每个类别中选出一、两条代表语句(各评定者对其分类的判断最为一致的),将这些语句混合排列,即得到沙氏通量表。 1.3Scaling techniques量表技术6.沙氏通量表如:电视商业广告态度测量的沙氏通量表1、所有的电视商业广告都应该由法律禁止2、看电视广告完全是浪费时间3、大部分电视商业广告是非常差的4、电视商业广告枯燥乏味5、电视商业广告并不过分干扰欣赏电视节目6、对大多数电视商业广告我无所谓好恶7、我有时喜欢看电视商业广告8、大多数电视商业广告是挺有趣的9
20、、只要有可能,我喜欢购买在电视上看到过广告的商品10、大多数电视商业广告能帮助人们选择更好的商品11、电视商业广告比一般的电视节目更有趣1.3Scaling techniques量表技术7.李克特量表 李克特量表形式上与沙斯通量表相似,都要求受测者对一组与测量主题有关陈述语句发表看法。 使用沙斯通量表仅要求受测者选出同意的陈述语句,而李克特量表要求受测者对每一个与态度有关的陈述语句表明他同意或不同意的程度。另外,沙斯通量表中的一组有关态度的语句按有利和不利的程度都有一个分值,而利克特量表仅仅需要对态度语句划分是有利还是不利,以便事后进行数据处理。例如:测量对商场态度的李克特量表新一佳出售高质量
21、的商品12345 新一佳的服务很热情12345我喜欢在新一佳买东西12345 新一佳的信用制度很糟糕12345我不喜欢新一佳所做的广告12345 新一佳出售的商品种类很多12345新一佳的商品价格公道12345 新一佳的购物环境很差12345大多数人都爱在新一佳买东西123451.3Scaling techniques量表技术7.李克特量表基本步骤:1、拟定若干条关于态度对象的语句。将每个测量的项目划分为“有利”或“不利”两类;2、选择部分受测者对全部项目进行预先测试,要求受测者指出每个项目是有利的或不利的,并在下面的方向强度描述语中进行选择,一般采用所谓“五点”量表:对每个回答给一个分数,如
22、从非常同意到非常不同意的有利项目分别为1、2、3、4、5分,对不利项目的分数就为5、4、3、2、1分;3、根据测者的各个项目的分数计算代数和,得到个人态度总得分,并依据总分多少将测者划分为高分组和低分组;4、选出若干条在高分组和低分组之间有较大区分能力的项目,构成一个利克特量表。1.3Scaling techniques量表技术8.语意差异量表 语意差异法是一种常用的测量事物印象的方法。在设计语意差异量表时,首先要确定与要测量对象相关的一系列属性,对于每个属性,选择一对意义相对的形容词,分别放在量表的两端,中间划分为个连续的等级。受访者被要求根据他们对被测对象的看法评价每个属性,在合适的等级位
23、置上作标记。优点: 可以清楚有效地描绘形象。如果同时测量几个对象的形象,还可以将整个形象轮廓进行比较。从中可以清楚地、直观地看到消费者对各商场的不同印象。 由于功能的多样性,语意差别量表被广泛地用于市场研究,用于比较不同品牌商品和厂商的形象,以及帮助制定广告战略、促销战略和新产品开发计划等。1.3Scaling techniques量表技术8.语意差异量表 下面是一个应用语意差异法测量受访者对商场印象的例子。例:你对商场的看法怎样?下面是一系列评价标准,每个标准两端是两个描述它的形容词,这两个形容词的意义是相反的。用这些标准来评价商场,在你认为合适的地方打钩。请注意不要漏掉任何一项标准。 你认
24、为商场是 可靠的-不可靠地 时髦 -过时 方便-不方便 态度友好 -不友好 昂便 -宜贵 选择多-选择少1.3Scaling techniques量表技术9.斯坦普尔量表 一个单级的评分量表,有10个从-5到+5编号的类别,没有中立点。这种量表通常被垂直的展示,要求调查对象通过选择一个适当的数字答案类别,来指出每一项目中对物体的描述的精确程度例:百货商店顾客调查项目提示:请评价每个单词或短语对于每家百货商店描述的精确程度,对你认为精确描述了这家商店的短语选择一个加号数字,你认为这个短语描述这家商店越精确,你就应该选择越大的加号数字。你应该为你认为没有精确描述的短语选择一个减号数字,你认为短语描
25、述越不精确,就应该选择越大的减号数字。你可以选择-5到+5中的任意数字,+5表示你认为非常精确,-5表示你认为非常不精确 +5 +5 +4 +4 +3 +3 +2 +2 +1 +1 高品质 糟糕的服务 -1 -1 -2 -2 -3 -3 -4 -4 -5 -51.3Scaling techniques量表技术总结:量表选择时应考虑的一些基本因素: 量表种类的选择 平衡量的选择 所谓平衡量表,就是在量表中肯定态度的答案数目与否定态度的答案数目相等,否则就称为非平衡量表。 量级层次的个数 层次个数太少,量表就过于粗略而不够全面。然而, 量表层级太多,又可能超出了人们的分辨能力。 量级层次的奇数与偶数选择 强迫性与非强迫性量表的选择 与上面的奇数和偶数量表有关,通常强迫选择就是剔除量表中的中立答案,使受测者被迫给出正面的或负面的答案。 L/O/G/OThank You!