ImageVerifierCode 换一换
格式:PPT , 页数:82 ,大小:7.74MB ,
文档编号:5006059      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-5006059.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(晟晟文业)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(信度和效度专题知识专业知识讲座课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

信度和效度专题知识专业知识讲座课件.ppt

1、第四讲 人员测评技术之 测评信度与效度 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。测评信度及检验 1、测评信度及检验 2、测评效度及检验 本讲内容 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。5.1测评信度及检验 5.1 测评效度的概念 1、信度概念:测评结果的前后一致性。又称可靠性程度。2、信度系数:用一样本在两种不同时间、不同情景条件下或两组不同评价材料的评定结果之间的相关系数(rxx)。信度系数越大,则说明该测量或评定方法的可靠性越强,反之,则可靠性弱。简单地说信度就是指测量

2、数据和结论的可 靠性程度,也就是说测量工具能否稳定地 测量到它要测量的事项的程度。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。我们可以举例说明信度的问题:如果想知道 某人的体重,我们可以叫两个人来估计,一 个人的估计为150镑,另一个人的估计为300 镑,那么我们就可以认为,叫别人来估计体 重是非常不可信的方法。如果用磅秤,连续 测量两次的结果都是相同的,因而我们可以 说,在测量体重方面,用磅秤的方法要比叫 人来估计更可信。我们可以用信度系数来表 示信度的大小。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,

3、请联系本人或网站删除。对信度系数要注意三点:对信度系数要注意三点:第一,在不同情况下,对不同样本,采用不同方法会得到不同的信度系数,因此一个测验可能不止一个信度系数;第二,信度系数只是对测量分数不一致程度的估计,并没有指出不一致的原因;第三,获得较高的信度系数并不是心理测量追求的最终目的,它只是迈向目标的一步,是使测验有效的一个必要条件。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。信度系数要达到多高才可以接受呢?信度系数要达到多高才可以接受呢?一般能力与学绩测验的信度系数在 0.90 以上;人格测验的信度系数通常在 0.80 以上。当rx

4、x 0.70时,不能用测验对个人作评价,也不能在团体间作比较;当 rxx 0.70时,可用于团体间比较;当rxx 0.85 时,可用于鉴别个人。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。为何要进行信度的衡量?我们知道在进行测量时,误差是难免的,这就使得真实值和测量值之间是不可能完全一致。我们可以这样来表示真实值和测量值之间的关系。X=T+B+E T表示真实值,B表示偏差即系统误差,E表示测量误差即随机误差。由于系统误差很难分解,因而有些书中的分解式将系统误差包括在真实值之中,因而X可以简单地概括为X=T+E 本文档所提供的信息仅供参考之

5、用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。5.1.2 测评信度的分类测评信度的分类(一)重测信度 又称稳定性信度,它用于分析两次间隔一定时间的评定或测定结 果之间的相关关系。这种方法通常是重复同样的测量来检验信度 信度系数可以用相关系数来表示。假如我们第一次测量时的观测 值是X,第二次的观测值是Y,那么重测信度就等于X与Y的相关系 数。但重复测量时,我们要注意两次测量的时间间隔要恰当。如果时 间间隔太久,可能会发一些变故,影响到被调查者的态度,那么 前后的测量就会有很大的差异。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人

6、或网站删除。5.1.2测评信度的分类测评信度的分类 (二)折半信度 通常是在无副本且不准备重测的情况下,我们就用折半信度来计 算信度系数。举例来说,如果有一份问卷,其中有十个问题涉及到女性歧视现 象。利用折半信度时,可将是个问题随机分成两组,每组有五个 问题,然后根据每组的测量结果来计算两组的相关系数,就 是折半信度,Rhh。但整个问卷的信度需要用校正公式来得到:Rxx=2Rhh/(1+Rhh)本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。5.1.2 测评信度的分类测评信度的分类(三)等值信度(复本信度)等值信度是指以两个平行型的测评量表在

7、最短时距内施行两次所的结果的相关系数来评估的。什么是平行型量表:内容、形式和长度相同,难度(即有相同的平均数)和差异程度(相同的标准差)也相同。A型量表 B型量表 最短时距 相关系数为等值信度 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。5.1.2 测评信度的分类测评信度的分类 等值信度的实施技巧:为了抵消测评先后顺序效应,一 般要求有一半人先用A型量表进行测定,然后再用B型量 表进行测定;另一半人则先用B型,再用A型。二者间隔 时间要求保持在最短时距内。其范围为几分钟到几小时。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。

8、文档如有不当之处,请联系本人或网站删除。5.1.3影响信度的因素影响信度的因素 主体 客体 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。影响信度的主体的因素 不严格按照规定实施测验、制造紧张气氛、给予特别协助、评分主观 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。来自客体的影响因素:被试方面:身心健康状况、动机、注意力、持久性、求胜 心、作答态度等均随时在变化中 测验内容方面:试题取样不当、内部一致性较低、题数过少、题 意模糊等 施测环境方面:施测现场条件,如通风、温度、光线、噪音、

9、桌面好坏、空间的阔窄等 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。另外几个重要的影响因素:一、分数分布范围 二、测验长度 三、测验的难度 四、间隔时间 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。误差变异越大,信度越低。除前面谈到的几种误差来源外,还有以下几个因素会影响信度系数的大小:一、被试样本(分数分布范围)(一)团体的异质性 信度系数受分数的分布范围(全距)的影响,而分数范围与被试团体的异质程度有关。一个团体越异质,其分数范围越大,信度系数也就越高。相反,相对同质的团体分数则

10、较为均匀。如图所示:本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。图中大方框显示的是一个较大的异质团体在图中大方框显示的是一个较大的异质团体在两次施测中的分数分布两次施测中的分数分布,显然有很高的正相关显然有很高的正相关.在在小方框中显示的是一个高度同质的亚团体小方框中显示的是一个高度同质的亚团体,两次两次分数几乎呈随机变化,相关接近于零.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(二)团体的平均水平 对于不同的团体,题目具有不同的难度。每个题目在难度上的微小差异积累起来便会影响信度

11、。例如,同一量表对不同年龄,不同IQ水平的被试,信度则不尽相同。因此,我们在编制测验量表,抽选被试时,往往要考虑选取不同层次的被试,以使得测验团体呈异质性,从而使得信度提高。反之,当需要同质团体的信度时,就应该尽量选取同一层次的被试。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。二、题目的数量二、题目的数量 一般说来,在一个测验中增加同质的题目,可以使信度提高。即测验越长,信度越高。这是因为测验加长,加大了分数分布的范围,可能改进项目取样的代表性,从而能更好地反映受测者的真实水平。即测验的项目越多,在每个项目上的随机误差就可以互相抵消。本文

12、档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。增加测验长度的效果可以用斯皮尔曼 布朗公式来计算:来计算:rxx=Krxx/1+(K-1)rxx 式中,K为改变后的长度与原来长度之比,rxx为原测验的信度,rxx为测验长度是原来的 K倍时的信度估计。一般来说,题目数量对相关系数的影响是递增的。如表所示 题目数量 相关系数 10 50 100 200 300 400 500 0.50 0.83 0.91 0.95 0.968 0.976 0.980 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。

13、但是,增加测验长度的效果遵循报酬递减率,但是,增加测验长度的效果遵循报酬递减率,测验过长是得不偿失的,可以通过上式确定一个测验究竟要增长多少才能达到理想的信度水平。注意:只有当新题目是与原题目选自同一总体,增长测验才能改进信度。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。随堂练习随堂练习 1.假设有一份由20题组成的测验,rxx=0.50,若测验增加同质性题目80道,则增长后的测验信度rxx是多少?按照公式:rxx=Krxx/1+(K-1)rxx=0.8 5.0*)12080(1205.0*80?本文档所提供的信息仅供参考之用,不能作为科

14、学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。随堂练习随堂练习 2.假设有一个包括 10个题目的测验,信度为 0.60,若把测验增加到 80个题目,其信度将增加到多少?3.一个包含40个题目的测验信度为 0.8,欲将信度提高到0.90,需要增加多少题目?本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。5.1.4信度检验:计算不同的信度系数 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。一、重测信度(稳定性系数)(一)定义与计算 定义 用同一种测验,对同一组受试者,前后施测两次,

15、再根据受试者两次测验分数计算其相关系数,即得重测信度。即 测验 时距(几分几年)再测验 此种信度能表示两次测验结果有无变动,反映测验分数的稳定程度,故又称稳定性系数。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。计算方法计算方法 计算使用皮尔逊积差相关公式的变式:计算使用皮尔逊积差相关公式的变式:212121SSXXNXXrxx?本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(二)误差来源(二)误差来源 1.测验本身:测验所测的特性本身就不稳定,例如情绪。2.被试方面:成熟、知识的发展并

16、非人人都等量增长,且练习因素、记忆效果也存在个体差异。3.施测情境:偶发因素的干扰,如计时错误,情绪波动,健康状况,动机变化等。重测信度高,说明分数受被试状况和测验情境变化影响小。这里题目取样并不影响重测信度。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。所测量的特性必须是 稳定的;遗忘与练习的效果相同;两次施测期间被试的学习效果没有差别。(三)计算重测信度的几个假设 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(四)使用重测信度的优缺点(四)使用重测信度的优缺点 优点:能提供有关测验

17、结果是否随时间而变异的资料,可作为预测受测者将来行为的依据。缺点:容易受练习和记忆的影响,前后两次施测间隔的长短必须适度;第一次尝试所发现的错误也可能导致第二次反应的变化而增加误差变异。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(五)注意事项(五)注意事项 两次测验的时间间隔要适当。最适宜的时距随测验目的、性质及被试特点而异;此方法适用于速度测验或人格测验,不适于难度测验;注意提高被试的积极性。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。二、复本信度(等值系数)二、复本信度(等值系

18、数)(一)定义与计算 1.定义 根据一组被试在两个平行(等值)测验上的得分计算相关系数。测验复份A 测验复份B 因为它反映的是两个测验之间的等值程度,故又称等值系数。最短时距 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。2.计算方法 AB A B/N rxx =NAB 式中,A、B为同一被试在两个测验复份A、B上的分数,A、B为A、B两型测验的平均分数,A、B为A、B两型测验的标准差,N为被试人数。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(二)误差来源(二)误差来源 1.测验两种

19、形式是否等值:(1)测题取样是否匹配;(2)格式是否相同;(3)内容、题数、难度、平均数、标准差是否一致。2.被试方面情绪波动、动机变化等。3.测验情境的变化,偶发因素的干扰。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(三)等值测验应符合的条件(三)等值测验应符合的条件 等值测验可避免重测法的缺点,但所使用的必须是真正的复本。复本应符合以下条件:1.各份测验测量的是同一种心理特性;2.各份测验具有相同的内容和形式;3.各份测验的题目不应有重复的地方;4.各份测验题目数量相等,并且有大体相等的难度、区分度;5.分数分布(平均数和标准差)大

20、致相等。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(四)注意事项(四)注意事项 1.两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似;2.两次测验的时间间隔要适当,若太短,由于测验太相似被试可能厌倦,若太长可能又会因新的学习而产生干扰。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(五)使用复本信度的局限(五)使用复本信度的局限 1.只能减少但不能完全消除练习和记忆的影响;2.由于第二个测验只改变了题目的具体内容,已经掌握的解题原则可以很容易地迁移到同类问题。

21、3.对许多测验来说,建立复本是十分困难的。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。三、分半信度三、分半信度 (一)定义和计算 在测验无复本且只能施测一次的情况下,通常用分半法估计信度,即将测题分成对等的两半,根据各人在这两半测验的分数,用皮尔逊积差相关公式计算其相关系数,作为信度指标。分半信度考察的是两半题目之间的一致性,故这种信度系数也称内部一致性系数。计算分半信度仍然可用积差相关方法。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(二)分半的方法(二)分半的方法 要计算分半信度

22、,首先是如何将测验分半,以便得到最接近的可比较的两半。通常采用奇偶分半法。使用此方法应注意:1一组解决同一问题或互相有牵连的题目应尽量安排在同一半内。2当试卷中有任选题时不宜使用分半法,速度测验也不宜用。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。(三)校正公式(三)校正公式 分半法求得的相关仅是半个测验分数相关,应使 用“斯皮尔曼布朗”公式加以校正,藉以估计整个测验的信度。1.斯皮尔曼布朗公式 rxx=2rhh/(1+rhh)其中,rhh为两半分数的相关系数,rxx为测验在原长度时的信度估计。此法假设:两半测验分数的变异性相等,但实际资

23、料此法假设:两半测验分数的变异性相等,但实际资料未必符合此假设。当两半不等值时,即上述假设不满足时,可采用下面两公式之一:本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。例题:例4:有一个由100题构成的量表施测于10个高三学生。测验一次后,应试者即毕业离校。现在怎样评介测验结果的信度?解:因不能再次测验,只能求分半信度。步骤:(1)计算出每个应试者的奇数题总分(X1)和偶数题总分(X2),见下表 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。得分 被试 1 2 3 4 5 6 7 8 9

24、 10 X1 38 37 38 41 40 36 38 39 40 35 X2 37 37 36 39 39 34 38 39 39 36 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。随堂练习随堂练习 1.假设有一份主观幸福感调查表,先后两次施测于10名学生,时间间隔为半年,结果如表所示,求该测验的重测信度。测验 X1 16 15 13 13 11 10 10 9 8 7 X2 16 16 14 12 11 9 11 8 6 7 被 试 1 2 3 4 5 6 7 8 9 10 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。

25、文档如有不当之处,请联系本人或网站删除。解:用计算器算出 S1=2.82,S23.38,把以上数据代入公式,可得 20.111?X00.112?X?132421XX97.038.382.200.1120.11101324?xxr本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。2.假设用A、B两型创造力复本测验对初中一年级10个学生施测。结果如表所示,X1,X2 分别代表A、B两型测验。求该测验的复本信度。测验 被 试 1 2 3 4 5 6 7 8 9 10 X1 20 19 19 18 17 16 14 13 12 10 X2 20 20

26、18 16 15 17 12 11 13 9 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。解:先用计算器计算得出以下值:,8.151?X1.152?X22.31?S22.32?S?249421XX94.059.322.31.158.15102494?xxr代入公式可得:本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。5.2测量的效度及检验 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。案例一 美国杜克能源公司某蒸气站被 12 名黑人雇

27、工告上了法庭,缘由是该公司把他们都当勤杂工使用,每天的任务就是扫地和清洁,他们原本指望能被提升到像运煤工这样层次更高的岗位上,但公司说他们的智力测验分数不够,而该公司的14 个黑人员工中有13 个做勤杂工,诉讼的理由是智力测验有种族歧视。而公司说没有任何歧视,岗位安排完全根据测验结果来定,没有歧视黑人。法庭要求公司提供测验对职位胜任的预测力。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。案例二 某大学学生期终考试后向校方提出某大学学生期终考试后向校方提出质疑,说教授给出的考试范围是教科书中的110章,但考试内容却都集中于前三章,这样的考试无

28、法检验真实的学习成绩,也就是考试并没有提供一个让我展现所学全部知识的机会。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。5.2.1 效度概述效度概述 定义:测评实际上能够测得所测评对象的真实程度.也就是测评本身所能达到期望目标的程度有多大。效度反应了测验的准确性 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。与目的有关的真分数在实测分数中所占的比例例 (在实测分数中有效真分数所占的比率)实

29、测分数=真分数+误差(随机误差)与目的 与目的 有关 无关(系统误差)本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。一个稳定但无效的智力测验 1.你出生在几月份?2.你母亲姓什么?3.1+1=?4.一个星期有几天?5.下面哪个是三角形?A.B.C.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。信度与效度的关系信度与效度的关系 信度是效度的必要条件,但不是充分条件.要想一个测验的效度高,其信度必须得高;但信度高,效度未必高.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如

30、有不当之处,请联系本人或网站删除。影响效度的误差来源影响效度的误差来源 1.测验题目不能反应要测量的特征.2.实施过程偏离了标准化的程序.3.被试不能如实回答.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。5.2.1 测验效度的类型测验效度的类型 效标效度 内容效度 结构效度 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。第二节 效标效度(准则关联效度准则关联效度)什么是效标:是假定的客观标准,反应测验目的的行为参照.它作为测评有效性的指标。什么是效标效度:寻求测评结果与某项效标的相关程

31、度来度量的效度。也称经验效度或统计效度。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。理想效标的四大条件理想效标的四大条件 1.有效性 2.可靠性 3.可操作性 4.实用性 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。预测性和同时性效度预测性和同时性效度 预测性效度:测验分数和以后的某个效标之间的相关 同时性效度:同时获得测验分数和某个效标之间的相关 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。如何选择效标如何选择效标 上级部门或

32、领导的评估 工作实绩 总结评比的结果 综合标准 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。效标效度的计算方法效标效度的计算方法 1.相关法 求取测验分数与效标变量之间的相关程度,即效度系数.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。1)积差相关 在两组数据都是连续变量,且两者存在线性关系时使用 公式:本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。被被 试试 1 2 3 4 5 6 7 8 9 10 测验(x)20 34 32

33、47 20 24 27 25 22 16 销售额(y)2.5 3.8 3 4 0.7 1 2.2 3.5 2.8 1.2 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。2.命中率命中率 测验有效性的指标之一就是作出正确决定的比率,即决策的命中率.效标成绩 测验预测 失败 成功 成功(A)失误(B)命中 失败(C)命中(D)失误 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。例题 某工交公司

34、对240名司机进行了反应速度的测验,用1,8区间的不同数值代表个体反应时的差异。把三年中未发生事故的司机定义为成功,把发生一次以上事故的司机定义为不成功。240人成绩与安全性水平的分布如下表所示 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。测验成绩 成功(未发生)失败(发生1次以上)总人数 8 9 0 9 7 17 0 17 6 37 0 37 5 45 4 49 4 45 7 52 3 27 9 36 2 8 12 20 1 4 16 20 总人数 192 48 240 如果把反应时的测验成绩以5分及以上为标准界限,则该表可以转换为下表

35、 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。安全水平 反应时 成功成功 不成功 成功 108 4 不成功 84 44 按照公式可得:Rct=24044108?本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。第三节第三节 内容效度内容效度 定义:测验题目对所要测量的内容范围的代表性程度,考验题目样本是否代表了内容总体目样本是否代表了内容总体。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。内容效度的两个要点内容效度的两个要点 1.测题对

36、测量对象的有效性 2.全部测题对测量对象的涵盖程度 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。例子例子 对一个优秀篮球运动员技能的测量对一个优秀篮球运动员技能的测量 测量目的:一个优秀篮球运动员需要具备的技能 对内容领域的描述:投蓝,运球,抢篮板。测验A:在各个位置上投蓝40次;测验B:各种情景下的运球30次.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。确定内容效度的方法确定内容效度的方法 专家判断 请某领域里的专家来评判测验的内容是否编排的合理.缺点:1)没有量化指标;2)对内容

37、效度的判断不一致;3)教育思想或心理学观点不同,所以对内容范围的理解也不同.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。内容效度比(CVR)内容效度比低的题目就应该被淘汰.然后计算全部测题的内容效度比的平均数,作为内容效度的指标.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。其他辅助的方法其他辅助的方法 2.统计分析法 3.再测法 4.经验法 5.内在一致性 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。内容效度与表面效度的区别内容

38、效度与表面效度的区别 表面效度是指测验看起来所要测量的东西,是被试或外行看来是有效的测验.表面效度与内容效度并不总是一致的.表面效度能间接影响测验的效度,所以测验编制时也要适当关注表面效度.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。提高内容效度的有效方法:提高内容效度的有效方法:编制命题的双向细目表编制命题的双向细目表 记忆 了解 应用 分析 综合 评价 合计 第一章 8 2 10 第二章 12 6 2 10 30 第三章 4 4 2 2 6 18 第四章 2 10 12 8 4 6 42 合计 6 26 28 14 20 6 100

39、本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。第四节第四节 结构效度结构效度 定义:根据测评所假定的结构予以解释的程度,主要用于人员功能结构的理论概括和探讨。本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。某一智力理论的四项假设:1.智力随年龄而增长;2.智商是稳定的;3.智力与学业成绩有密切关系;4.智力受遗传的影响.本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。某注意力的理论,注意有如下特征:1.稳定性 2.集中性 3.转移性 4.

40、分配 5.范围 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。收集结构效度资料的方法收集结构效度资料的方法 1.测验内方法 研究测验的内部构造来界定所测量的结构范围.1)内容效度 2)内在一致性 3)因素分析 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。2.测验间方法 研究几个同类测验间的相互关系来考察它们是否测量相同的心理结构.1)相容效度 2)会聚效度和区分效度 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。谢谢!本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不当之处,请联系本人或网站删除。

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|