1、认知诊断理论认知诊断理论课程说明时间段授课内容上 午8:3011:30认知诊断理论概述晚 上认知诊断理论应用:认知诊断计算机化自适应测验(CD-CAT)认知诊断实操部分:MATLAB软件的使用认知诊断理论概述认知诊断理论的背景与基础1Q矩阵的重要地位与规则空间模型2常见认知诊断模型介绍3认知诊断评估的结果报告4认知诊断评估对我国学业评价的启示51、认知诊断理论的背景与基础、认知诊断理论的背景与基础认知诊断理论的背景v 教育问责制教育问责制(accountability in education)p 问责的含义问责的含义 Account:会计、账目清算;说明、解释:会计、账目清算;说明、解释 A
2、ccountability vs.Responsibilityp 教育问责的发展的脉络教育问责的发展的脉络 80s欧美教育文献的高频词欧美教育文献的高频词 No Child Left Behind Act(2002)Educational Accountability vs.Educative Accountability认知诊断理论的背景v 教育问责制教育问责制(accountability in education)p 问责制涉及的核心问题问责制涉及的核心问题 明确可行的教育目标和标准明确可行的教育目标和标准 相应的法律法规体系相应的法律法规体系 责任共担的教育性问责取向责任共担的教育性问
3、责取向 教育评测(教育评测(AssessmentAssessment)的作用)的作用 客观可靠的数据系统客观可靠的数据系统认知诊断理论的背景v 教育问责制教育问责制(accountability in education)No Child Left Behind Act(2002):强化测验在评估:强化测验在评估中的作用;中的作用;加强结果评估加强结果评估(consequential assessment)与教学之与教学之间的联系间的联系 学生学生(测验分数测验分数)学校与教师学校与教师v 形成性评估形成性评估(formative assessment)K-12评估的革新教育评估应该更好地反映
4、学生的教育评估应该更好地反映学生的学习,为教学提供反馈信息:学习,为教学提供反馈信息:l Cronbachs(1957):The Two Disciplines of Scientific Psychologyl Glasers(1976):conceptualization of an instructional psychology that would adapt instruction to students individual knowledge statesl 认知理论与心理计量模型的结合(Glaser&Silver,1994;Pellegrino,Baxter,&Glaser,
5、1999;Pellegrino,Chudowsky,&Glaser,2001)CTT与与IRT分数的局限分数的局限经典测验理论:1:X=T+E2:信度、效度、难度和区分度为指标传统统计分数项目反应理论:1:项目水平模型项目反应函数2:基于IRT的认知诊断模型的基础CTT和和IRT都只能将被试进行排序,无法获得更多的测验信息!都只能将被试进行排序,无法获得更多的测验信息!认知心理学的发展v 对被试问题解决过程的心理揭示 认知心理学认知心理学 学科心理学学科心理学 教育心理学教育心理学 学习心理学学习心理学v 认知属性(attribute)知识点知识点 技能技能 心理过程心理过程认知心理学的发展(
6、续)v 认知诊断的定义 对被试在测验所测属性或知识点对被试在测验所测属性或知识点(如通分、借位与约如通分、借位与约分等分等)上的掌握水平进行分类上的掌握水平进行分类(掌握还是未掌握掌握还是未掌握)通过认知诊断方法或模型确定被试的不可直接观测的通过认知诊断方法或模型确定被试的不可直接观测的认知结构或知识状态,认知结构或知识状态,确定被试已经掌握哪些属性,确定被试已经掌握哪些属性,哪些属性未掌握需要补救哪些属性未掌握需要补救除了二分,还可除了二分,还可以是多分的情况以是多分的情况测验分数的实质解构测验分数的实质解构传统测验认知诊断测验单个总分,21K每个属性都有一个分数90Messi90.Rona
7、ldoC1101110 0111010 传统测验理论传统测验理论认知诊断理论认知诊断理论20世纪80年代20世纪60年代传统测验理论认知诊断理论认知诊断理论(CDT)项目反应理论项目反应理论(IRT)概化理论概化理论(GT)经典测验理论经典测验理论(CTT)2、Q矩阵的重要地位与规则空间模型矩阵的重要地位与规则空间模型题目属性关联矩阵Q1111111011111100111110001111000011100000110000001题目属性关联矩阵Q77 (行代表属性,列代表题目)非统计的诊断方法v 教师观察:教师根据学生作业或考试表现主观判断;v 出声思维:根据Q矩阵界定的属性,对学生进行出
8、声思维考察;v 费时费力,难以区分随机因素对被试作答造成的影响;v 统计方法或测量方法:CTT&IRT CDT。认知诊断评估的基本过程模型选择模型选择分数报告分数报告认知分析认知分析认知属性分析:属性提取 属性层级关系界定 测验Q矩阵标识测验题目编制 认知诊断模型:模型选择 参数估计 统计收敛性 模型数据拟合检验分数报告:属性掌握概率 学习之路 学习优势剖面图常见的认知诊断模型认知诊断模型(Cognitive Diagnostic Model,CDM)线性逻辑斯蒂克测验模型(LLTM)(Fischer,1973)规则空间模型规则空间模型(RSM)(Tatsuoka,1983)统一模型(UM)(
9、DiBello,Stout,&Roussos,1995)融合模型(FM)(DiBello,Stout,&Roussos,1995)“噪音输入,确定性与门”模型(NIDA)(Maris,1999)“确定性输入,噪音确定性输入,噪音与与门门”模型模型(DINA)(Junker&Sijstma,2001)属性层级模型属性层级模型(AHM)(Leighton,Gierl,&Hunka,2004)“确定性输入,噪音或门”模型(DINO)(Templin&Henson,2006)广义的广义的DINA模型模型(G-DINA)(de la Torre,2011)认知诊断模型分类没有显式的项目特征函数(ICF)
10、p 规则空间模型(RSM)p 属性层级模型(AHM)p 严格意义上讲,RSM和AHM都不是统计模型而是分类模型有显式的ICFp 潜类别模型 DINA、DINO、NIDA、G-DINA,等等p 多维项目反应理论(MIRT)模型 补偿型模型:多维两参数逻辑斯蒂克模型(M2PLM)(Reckase,2009)非补偿型模型:多成分潜在特质模型(MLTM)(Whitely,1980)验证性的多验证性的多维模型有效维模型有效认知诊断模型分类(续)图示认知认知诊断诊断模型模型多维IRT模型:非补偿性模型:非补偿性模型:Whitely(1980):多成分潜在特质模型(MLTM)补偿性模型:补偿性模型:多维正态
11、肩形模型(MNO)多维Logistic模型(Reckase&McKinley,1982,1991,1997)潜类别模型:DINA模型 统一模型(Unified Model)融合模型(Fusion Model)规则空间模型规则空间模型属性层级模型属性层级模型认知诊断模型分类(续)值得注意的几点:p 与CDM一样,MIRT模型也具有认知诊断功能(Embretson&Yang,2013)p MIRT除了能够提供被试总的测验分数,还能提供被试在每个 维度上更为精细的领域分数(domain score)p 通过MIRT分析可以得到被试在每个分量表上的连续估计值用于 替代CDM提供的二分诊断结果(掌握/未
12、掌握)丁树良等(2012)认为CDM 特别适用于形成性评估,因为它涉及的属性较少且属性粒度也较小;但对于总结性评估(如学年测验、高校招生考试),由于涉及的属性较多,往往使用能力(能力粒度比属性粒度大)而非属性来标注Q矩阵,这时使用MIRT 进行诊断分析更为合适。认知诊断模型规则空间模型RSM的提出的提出p Tatsuoka(1981,1983)对被试的错误规则进行分析,提出了一种 叫做规则空间的剖面图分析方法,成为了最初的规则空间思想的 雏形 从带符号的减法例子中找出47种规则,其中27种是错误规则p Tatsuoka(1985)提出了RSM的成型构念认知诊断模型规则空间模型最初的错误规则分析
13、最初的错误规则分析错误规则1:改变括号里的符号,再按照正常的加法来完成题目错误规则2:通过大的减去小的得到结果,然后用第一个数的符号作为结果符号错误规则3:除简单的减法外,一律将减号变成加号处理错误规则4:一律拿大数减去小数,然后将大数的符号作为结果符号认知诊断模型规则空间模型认知诊断问题对应于统计模式分类问题认知诊断问题对应于统计模式分类问题p 将可观测的反应模式(ORP)与不可观测的认知结构(CS)或知识 状态(KS)或属性掌握模式(AMP)建立联系 由KS和测验蓝图Q可以确定理想反应模式(IRP)。如果Q中包括可达 矩阵R,可保证KS与IRP之间的一一对应 规则空间模型(RSM)通过维度
14、化简技术将m维(m代表题目数)IRP/ORP约简到二维的笛卡尔空间,从而建立ORP与IRP的关系认知诊断模型规则空间模型点击添加标题3PLM题目参数值题目参数值被试作答模式被试作答模式理想反应模式理想反应模式匹配分类RSM(Tatsuoka,1983,1985)广义距离广义距离(孙佳楠孙佳楠,2011,2013)直接匹配:匹配作答模式间接匹配:匹配(,)对认知诊断问题对应于统计模式分类问题认知诊断问题对应于统计模式分类问题(续续)p 被试分类的基本思想认知诊断模型规则空间模型规则空间模型的主要步骤规则空间模型的主要步骤p Q矩阵理论部分1.确定属性与题目间的关系并编制事件Q矩阵(inciden
15、ce Q matrix)2.界定属性间的先决关系(prerequisite)3.确定可能的属性掌握模式(AMP)4.计算理想反应模式(IRP)p 模式分类部分5.估计题目参数和被试参数6.建立二维的规则空间7.对实际作答模式进行分类并计算属性掌握概率8.检验分类的效度认知诊断模型规则空间模型1 确定属性与题目间的关系确定属性与题目间的关系p 邀请学科专家、教学专家及测量学家对已编制好已编制好的测验进行分析 确定属性与题目之间的关系 编制事件Q矩阵(incidence Q matrix)p 假设有K个属性和m个题目,可将Q矩阵记为QKm 题目1考核属性1和3,题目2测量属性2,题目5考核最后1个
16、属性10001001100110153Q认知设计认知设计矩阵矩阵认知诊断模型规则空间模型2 界定属性间的先决关系界定属性间的先决关系p 通过Q矩阵中行与行之间的关系比较得出属性间的先决关系 确定邻接矩阵A:仅反映属性间的直接先决关系 确定可达矩阵R:反映属性间的直接先决关系、间接关系及自反关系 对于不断增大的正整数n(n是1到K之间的数),当(A+I)n不再变化时,即可 得到R矩阵:R=(A+I)n Tatsuoka使用的理论有:图论(计算邻接矩阵与可达矩阵等)集合论(确定偏序关系与包含关系等)抽象代数(格、布尔格或布尔代数)布尔描述函数(BDF)认知诊断模型规则空间模型2 界定属性间的先决关
17、系界定属性间的先决关系(续续)p 给出属性先决关系,容易写出A矩阵和 R矩阵某属性先决关系图与右侧属性先决关系图相对应的A矩阵与R矩阵认知诊断模型规则空间模型3 确定可能的属性掌握模式确定可能的属性掌握模式(AMP)p 考查K个属性,最多有2K-1种AMP(不包括不掌握任何属性的零 向量)p 将每种AMP看成矩阵的1列,所有2K-1种AMP构成Qc矩阵p 删除Qc矩阵中不符合属性先决关系的列,得到简化事件Qr矩阵 (reduced Q matrix)p Qr可通过Tatsuoka(1995)的“删除法”或丁树良等丁树良等(2009)的的“扩扩 张法张法”(基于基于R矩阵直接扩充矩阵直接扩充)得
18、到Qr总共包括7种AMP,虚线左侧为R矩阵内容,虚线右侧为根据R矩阵“扩张”生成的新AMP认知诊断模型规则空间模型4 计算理想反应模式计算理想反应模式(IRP)p “理想”是指在不存在失误(slipping)和猜测(guessing)的情况下,被试作答反应完全由“被试有且只有掌握题目的所有属性,才 能正确作答该题目”的原则确定p 确定IRP有4种方法 符号说明 qi:Qr的第i列,代表第i个理想被试的AMP pj:Q的第j列,代表第j个题目的属性向量 方法1认知诊断模型规则空间模型4 计算理想反应模式计算理想反应模式(IRP)(续续)p 确定IRP有4种方法 方法2 方法3 方法4认知诊断模型
19、规则空间模型RSM中基于中基于AMP和和Q计算计算IRPSN掌握属性掌握属性属性掌握模式属性掌握模式 理想反应模式理想反应模式1none(0,0,0)(0,0,0,0)2A1(1,0,0)(0,0,0,0)3A2(0,1,0)(0,0,0,0)4A3(0,0,1)(0,1,0,0)5A1 A2(1,1,0)(0,0,0,1)6A1 A3(1,0,1)(1,1,0,0)7A2 A3(0,1,1)(0,1,1,0)8A1 A2 A3(1,1,1)(1,1,1,1)i1i2i3i4A11001A20011A31110Q矩阵认知诊断模型规则空间模型5 估计题目参数和被试参数估计题目参数和被试参数p 将
20、所有ORP与所有IRP合并成一个大的作答矩阵U 样本量越大,反应模式越丰富,参数估计也就越准确p 采用参数估计软件(如BILOG或PARSCALE)估计 所有题目的题目参数 所有被试的能力参数 包括IRP所对应的理想被试的能力值认知诊断模型规则空间模型6 建立二维的规则空间建立二维的规则空间p 将所有IRP和ORP都降维到二维的笛卡尔空间,再进行判别分类判别分类 定义能反映被试作答反应模式异常程度被试作答反应模式异常程度的指标f(X)()()()(XPPXf)(.,),(),()(21mPPPP)(.,),(),()(TTT.,21mxxxXmjjPmT1)(1)(认知诊断模型规则空间模型6
21、建立二维的规则空间建立二维的规则空间(续续)不失一般性,假设题目由易到难排序对于正常反应模式,被试在前t个题上的作答应该以1为主(xj前面的系数为正),在后m-t个题上的作答应该以0为主(xj前面的系数为负)。f(X)值越小,被试作答模式越正常;反之,被试作答模式越异常。mjjjxTPPPXf1)()()()()()()()()()(321mPPPP)()()()()()(121mttPPTPPP认知诊断模型规则空间模型6 建立二维的规则空间建立二维的规则空间(续续)p f(X)只能衡量当前被试总体中被试反应模式的异常程度p 为衡量当前被试总体以外被试的反应模式异常程度,需要对 f(X)进行标
22、准化0)(XfEmjjjjTPQPXfVar12)()()()()(2/1)(var()(XfXf可得到与所有IRP和ORP对应的点集),(认知诊断模型规则空间模型6 建立二维的规则空间建立二维的规则空间(续续)规则空间,圆卷对应IRP,十字星对应ORP认知诊断模型规则空间模型7 分类并计算属性掌握概率分类并计算属性掌握概率p 每个纯规则点对应一种认知错误类型(或认知结构)p 采用计算马氏距离的方法,将各个真实点判归到纯规则点p 为消除马氏距离带来的误判,可使用贝叶斯判别分析 qt为先验概率,一般为一致性分布或正态分布 若点击添加标题21()()xrjtjtDXRXR(,)jxjxjX(,)t
23、rtrtR1/()00var()tIf x 1(x)(R|X)(x)tttTtttq fPq f(|)(|)(,1,.),tltP RXP RXlt lTXR则认知诊断模型规则空间模型7 分类并计算属性掌握概率分类并计算属性掌握概率(续续)p 为消除马氏距离带来的误判,可使用贝叶斯判别分析 假设先验分布为正态分布点击添加标题11/2/21()exp(0.5()()(2)Tttttmtf xxx21/2/21/2/21exp(0.5(,)(2)(|)exp(0.5(,)(2)ttmttTttmttqMdx RP RXqMd x R认知诊断模型规则空间模型8 检验分类的效度检验分类的效度p KS是
24、潜在的,很难确认被试是否被正确分类p 最直接做法:比较RSM的分类结果与学生口头报告的结果 缺点是成本太高p 替代方法是控制补救法 首先诊断被试的KS,对学生没有掌握的属性或知识点进行补救教学,然后进行后测 如前测中未掌握的属性在后测中得到掌握,则说明RSM的分类有效p RSM假设:没有掌握的属性或知识点,如不补救不会自动掌握认知诊断模型规则空间模型小结:小结:RSM的贡献的贡献p RSM中提出的Q矩阵已成为认知诊断理论中的核心概念p RSM的图形化方法与分类的思想形象、直接、易于理解p RSM中的Q矩阵可用于构建潜在特质空间 之后的认知诊断模型无一例外地采用或借鉴这种做法 DiBello、R
25、oussos和Stout(2007)的综述中,明确指出有十四种 认知诊断方法使用Q矩阵,目前更多认知诊断模型属性层级模型AHM与与RSM的关系的关系p AHM是RSM的一种重要变式p AHM用于对层级相关的认知属性进行建模p AHM与RSM的相似点 AHM在“将ORP分类到IRP”方面类似于RSM AHM在生成IRP的过程中也采用了Tatsuoka的矩阵,如邻接矩阵A、可达矩阵R、事件矩阵Q以及简化Qr矩阵等认知诊断模型属性层级模型AHM与与RSM的关系的关系(续续)p AHM与RSM的不同点 对要求建模的认知属性所作的假设不同 AHM假设:认知属性层级相关,因此属性间相互依赖 RSM假设:认
26、知属性在建模时不需要存在层级关系或依赖关系 事件时间顺序上存在差异 AHM中,属性及属性层级关系必须在测验题目开发之前测验题目开发之前确定 RSM中,属性一般在测验题目构建之后测验题目构建之后再进行标识 对属性层级关系的敏感程度不同 AHM中,认知属性按层级组织,任何测验都对属性层级关系敏感 RSM中,通过分析已有题目标识属性,对某完整的属性层级关系不敏感认知诊断模型属性层级模型属性层级关系的重要性属性层级关系的重要性p AHM中,属性层级关系是测验表现的基础p AHM中,认知属性必须按层级关系组织的两大原因 认知技能不能孤立地进行操作,而属于某个相互关联的加工网络 A矩阵与R矩阵的产生是属性
27、层级关系的数字表现p 属性层级关系定义解决测验问题所需属性间的心理顺序 由经验确定(通过协议分析得到有着良好定义的、有序的认知步骤)由理论获得(如皮亚杰的发展序列:预操作、具体操作、正式操作)p 属性层级关系可看成认知模型,它代表结构或测验表现背后的认 知能力认知诊断模型属性层级模型属性层级关系的重要性属性层级关系的重要性(续续)使用6个属性的4种属性层级结构(线型、收敛型、发散型、无结构型)6.将实际反应模式与理想反应模式将实际反应模式与理想反应模式进行比较,并将实际反应模式归类进行比较,并将实际反应模式归类1.确定属性、属性个确定属性、属性个数以及属性层级关系数以及属性层级关系5.由测验题
28、目和属性掌由测验题目和属性掌握模式,确定期望的被握模式,确定期望的被试反应模式试反应模式4.对对Qr矩阵进行转置得到矩阵进行转置得到E矩阵矩阵2.定义定义A矩阵、矩阵、R矩矩阵、阵、Q矩阵及矩阵及Qr矩阵矩阵3.根据根据Qr矩阵编制矩阵编制测验题目测验题目AHM认知诊断模型属性层级模型AHM的主要步骤的主要步骤注:Qr矩阵的列代表符合属性层级关系的不同题目类别,E矩阵的行代表符合属性层级关系的不同属性掌握模式认知诊断模型属性层级模型AHM的分类方法的分类方法(详见详见Leighton et al.(2004)p 方法A:初始分类 将某个ORP与所有期望被试反应模式(ERP)进行比较,对01和1
29、 0型的误差进行标识 计算所有误差概率的乘积可得到“该ORP由某个ERP得到的概率”记Vj是第j个ERP,记X为有着相同长度的ORP)(1011)(1010jmjkjjPPXVd概率为型误差,概率为型误差,没有误差Pjk():被试在第k个题目上的期望作答是错误的、但实际作答是正确的概率(即01型的误差),1-Pjm():被试在第m个题目上的期望作答是正确的、但实际作答是错误的概率(即10型的误差)认知诊断模型属性层级模型AHM的分类方法的分类方法(续续)p 方法A:初始分类 对于特定的,有K个01型误差和M个10型误差的概率为 当PjExpected()最大时,被试的ORP被归类到与第j个ER
30、P所对应的属性 掌握模式MmjmKkjkExpectedjPPP11)(1)()(认知诊断模型属性层级模型AHM的分类方法的分类方法(续续)p 方法A:初始分类 以ORP为(111100000000000)的被试分类问题为例进行说明有有1个个01型的误差出现在题目型的误差出现在题目4上上认知诊断模型属性层级模型AHM的分类方法的分类方法(续续)p 方法B:初始分类方法(方法A)的修改(较方法A更为保守)通过“标识所有逻辑包含于逻辑包含于某ORP的ERP”来对ORP分类 对于ORP(111111111111101),ERP(111000000000000)逻辑包含于该ORP,而ERP(11011
31、0110110110)不是逻辑包含于该ORP 当ERP包含于该ORP时,标注一个“匹配”记号(即“”),对应的 属性掌握模式视为被被试掌握 当ERP不包含于该ORP时,仅标识仅标识10型的误差型的误差并计算其概率的乘积认知诊断模型属性层级模型AHM的分类方法的分类方法(续续)p 方法B 以ORP为(111111111111101)的被试分类问题为例进行说明被试掌握了从第被试掌握了从第2行行(100000)到第到第14行行(100111)的属性掌握模式。被试也有可能掌握第的属性掌握模式。被试也有可能掌握第15行的行的属性掌握模式属性掌握模式(110111),但是不太可能掌握第,但是不太可能掌握第
32、16行所示的属性掌握模式行所示的属性掌握模式(111111)3、常见认知诊断模型介绍、常见认知诊断模型介绍认知诊断模型DINA模型重要符号说明重要符号说明第i个被试的知识状态i=(i1,i2,iK)T 可以记为100011010010101001100110Q属性 1 2 3 4 5 6题目123Nelse,attributekththemastersiexamineeifik0,1核心概念多种作答策略认知诊断模型DINA模型DINA模型简介模型简介(*)p DINA模型是非常简单的、容易解释的非补偿性模型p 对每个题目只需要估计两个参数失误参数和猜测参数p DINA模型的失误参数和猜测参数都
33、建模于题目水平,其复杂性 不受属性数量的影响p 基于被试的知识状态i和Q矩阵可以得到一个潜在的反应向量 的取值只有4种情况:10=1,11=1,00=1和01=0 ij=0:被试i没有掌握题目j涉及的所有属性 ij=1:被试i除了掌握题目j涉及的属性,还可能掌握其未涉及的属性Kkqijjkik1jkqik认知诊断模型DINA模型DINA模型的题目参数模型的题目参数p 如果没有误差或非随机因素,被试的ORP会与某个IRP重合p 潜在的过程是随机的,过程中难免会出现“失误”(slipping)和 “猜测”(guessing)等噪音 掌握题目所有属性的被试也可能失误,并错误作答该题目 未掌握题目所有
34、属性的被试也可能猜测,并以非零概率答对该题p DINA模型中,题目j的失误参数sj和猜测参数gj定义为 被试掌握题目j的所有属性,但错误作答题目j的概率 被试未掌握题目j的所有属性,但正确作答题目j的概率)1|0(ijijjXPs)0|1(ijijjXPg认知诊断模型DINA模型DINA模型的项目特征函数模型的项目特征函数p 也即p 如果没有猜测(gj=0)或没有失误(sj=0),正确作答题目的概率 就为0或1p 猜测参数gj还可解释为“成功依赖其他智力源的概率”(Maris,1999)jjiijijgsXPPijij1)1()|1()(0,1,1)1()(1ijjijjjjijgsgsPij
35、ij当当认知诊断模型DINA模型DINA模型的联合似然函数模型的联合似然函数(基于局部独立假设基于局部独立假设)1()1(00,110,01,11,1)1()1()1()1()(1()();,(11111111111111111111jxjxIiJjjxjxijijjijijjijijjijijjjxjxIiJjjxjxjjxIiJjjjyijxIiJjijxggssxgxgxsxsggssgsgsPPgsLikeijijKkjkqikijijKkjkqikijijijijijijijijijijijijijij且且且且认知诊断模型DINA模型DINA模型的参数估计模型的参数估计(de la
36、Torre,2009)p 先基于作答反应采用MMLE/EM算法估计题目参数)0()0(jjjIRg)1()1()1(jjjjIRIs认知诊断模型DINA模型DINA模型的参数估计模型的参数估计(续续)p 再基于题目参数估计值及作答反应,采用贝叶斯众数估计法 (MAP)或边际后验概率估计法(MPP)估计被试的估计状态 MAP MPP)|(maxarg2,.,2,1iliXPKlKtitkkXPmp21)|1(cutscorempcutscorempkkik小于如果大于等于如果,0,1Kk.,2,1认知诊断模型DINA模型DINA模型参数估计流程图模型参数估计流程图认知诊断模型DINA模型DINA
37、模型的特点模型的特点p 每个题目将所有被试仅分为两类 第一类:掌握题目所有属性的被试 第二类:没有掌握题目所有属性的被试在DINA模型中,“只有1个属性没有掌握”等价于“所有的属性都没有掌握”,这时候的正确作答概率都等于gj,这种做法过于简单。认知诊断模型NIDA模型NIDA模型简介模型简介p 与DINA模型一样,也是非补偿性模型p 不同于DINA模型的参数建模于题目水平,NIDA模型的参数建模 于属性水平(每个属性都有一个猜测和失误参数)认知诊断模型NIDA模型NIDA模型项目特征函数模型项目特征函数),1,1|0(jkikijkkqPs)1,0|1(jkikijkkqPgjkikikqKk
38、kkKkkkikijkiijgsgsPgsXP1111),|1(),|1(NiJjxKkqkkKkqkkijjkikikijxjkikikgsgsgsL1111111111);,(,1)0|1(jkijkqPKkijkijY1认知诊断模型DINO模型DINO模型简介模型简介p 不同于DINA模型和NIDA模型,它属于补偿性模型p DINO模型的参数建模于题目水平认知诊断模型DINO模型DINO模型项目特征函数模型项目特征函数)1()1()(1()();,(1111111111jjIiJjjjijIiJjijggssPPgsLikeijxijxKkjkqikijxijxKkjkqikijxijx
39、jjiijijgsXPPijij1)1()|1()(else,jitembyrequiredattributeoneleastatmastersiexamineeifKkqikijjk0,1)1(11)0|1(ijijjXPg)1|0(ijijjXPs认知诊断模型G-DINA模型G-DINA模型简介模型简介p G-DINA模型是DINA模型的一般化p 通过设计矩阵和矩阵的转换,G-DINA模型可以简化为其他一些 常用的模型,如DINA和DINO等p G-DINA模型可以将所有潜大类分为 个潜在组(是正确作 答题目j所需要的属性个数)p 每个潜在组表示一种简化的属性向量p 每个潜在组都有相伴随的
40、正确作答概率jK2*jK*lj)(*ljP 认知诊断模型G-DINA模型G-DINA模型简介模型简介认知诊断模型G-DINA模型G-DINA模型的项目特征函数模型的项目特征函数p 对于identity链接方式,G-DINA模型的正确作答概率公式可以分 解为属性的主效应以及属性间的交互效应之和*1121110*)(jjjjjKkljkKjKkKkkKkkljljkkjkljkjkjljP维交互效应的是的交互效应和是的主效应是基线概率是截距项*21120*,)(jKKjkkkjkkjkjKjj红框标识的系数一般为非负,蓝框标识的可取任意值认知诊断模型G-DINA模型G-DINA模型的其他链接方式及
41、特例模型的其他链接方式及特例p 除了identity链接方式,还有log和logit链接方式p identity链接方式下的全模型等价于log和logit链接下的全模型p DINA模型和DINO模型是全模型的特例p A-CDM、RRUM和LLM分别是identity、log和logit链接方式下的 加法模型认知诊断模型G-DINA模型G-DINA模型的其他链接方式及特例模型的其他链接方式及特例(续续)p DINA 可通过在G-DINA中设定“除了 和 ,其他参数都为0”得 到,并令 和p DINO 可通过在G-DINA中设定 (其中,)得到,并令 0j*12jKj0jjg*1201jKjjjs
42、001jjjjjkgs和认知诊断模型G-DINA模型G-DINA模型的参数估计模型的参数估计p 也采用MMLE/EM算法,但与DINA的稍有不同 DINA模型中是将似然函数直接对参数求偏导,令其为0解得参数值 G-DINA模型的参数比较多,直接对参数求偏导的方法计算量太大太 复杂,于是采用两阶段的方法计算 先将似然函数对概率值P求偏导,令其为0,求出P的估计值 再在所有掌握模式下用最小二乘法获得参数估计值认知诊断模型模型数据拟合12()hH 12hHppppp 认知诊断模型模型数据拟合221()HhhhhpN212ln()HhhhhpGNp 认知诊断模型模型数据拟合(0,0,0)1(1,0,0
43、)2(0,1,0)31(0,0,1)1,22(1,1,0)1,33(1,0,1)2,31,2,301001101001010110001011100001001000001010000001100000001(0,1,1)(1,1,1)认知诊断模型模型数据拟合(0,0,0)(1,0,0)1(0,1,0)2(0,0,1)312(1,1,0)1,22(1,0,1)1,3(0,1,1)2,3(1,1,1)010011010010101100010111000010010000010100000011认知诊断模型模型数据拟合 222222()()MNpC p22RMSEAMax,0MdfNdf认知诊断
44、理论的研究主题认知诊断理论的研究主题完善构建完善构建4、认知诊断评估的结果报告、认知诊断评估的结果报告学生编号学生编号 12345题目反应模式题目反应模式 00000000100101000000学生的坐标学生的坐标 (-1.048,-.602,.131)属性掌握概率属性掌握概率 (.550.098.665.605 0.172.605.828)KS D2 属性模式属性模式 项目得分模式项目得分模式 坐标坐标 类别概率类别概率49 .448 00010011 00000101000100000000 (-1.02,-,656,.128).33551 .571 01100001 000001010
45、00001000000 (-.968,-.372,.188).28055 1.07 01110110 00000000000000000001 (-1.29,.010,.091).17254 1.25 00100001 00000101000000000000 (-1.33,-.530,.027).11538 1.69 01110011 00010101000001000000 (-.818,-.265,.251).098某被试的分析结果的例子认知诊断评估的结果报告认知诊断评估的结果报告RSMRSM的例子的例子Attributes A1:Separate the whole part from
46、 the fraction part when a0 or d0 A2:Get the common denominator(CD)when cf A3:Convert the fraction part before getting CD A4:Reduce the fraction part before getting CD A5:Answer to be simplified认知诊断评估的结果报告认知诊断评估的结果报告RSMRSM的学习之路的学习之路认知诊断分析认知诊断分析分数报告举例分数报告举例注:摘自Rupp et al.(2010)美国最大自适应学习平台美国最大自适应学习平台Kn
47、ewtonKnewtonLauren与William两位同学有着不同的学习路径或进阶路径美国最大自适应学习平台美国最大自适应学习平台KnewtonKnewton“A is for Adaptive-Personalized learning is poised to transform education.Can it enrich students and investors at the same time?”(Time,June 17,2013)5、认知诊断评估对我国学业成就、认知诊断评估对我国学业成就评价的启示评价的启示认知诊断评估对我国学业成就评价的启示v充分挖掘考试信息,体现学业评
48、价的诊断功能 考试更重要的价值在于诊断考试更重要的价值在于诊断被试对试卷的反应中包含丰富的信息被试对试卷的反应中包含丰富的信息充分挖掘这些信息对学生学习与教师有针对性的指导至关充分挖掘这些信息对学生学习与教师有针对性的指导至关重要重要 认知诊断理论为我们的这种需求提供了技术支持认知诊断理论为我们的这种需求提供了技术支持谢谢 谢!谢!典型的认知诊断模型典型的认知诊断模型 DINA 模型:只包含失误和猜测参数 具有较高的判准率(Cheng,2008;Rupp&Templin,2007)基于心理学理论识别了正确作答测验项目必须的认知成分 对项目的测量结构有了深入理解 从多个因素来分析项目难度的思想类
49、似于认知诊断中的Q矩阵 提高项目编写与测验开发的效果(Sheehan&Mislevy,1990)LLTMDINARSM提取第一阶段:测验的Q矩阵计算可达到矩阵R计算属性掌握模式计算理想反应模式第二阶段:参数估计与计算警戒指标计算马氏距离与贝叶斯后验概率认知诊断理论思想的雏形LLTMv 模型中的能力并不是一个多维认知技能向量;模型中的能力并不是一个多维认知技能向量;v 项目难度项目难度难度因子难度因子“认知过程认知过程”;v 难度分解:难度分解:v Q矩阵:确定了每一个项目涉及到的认知属性;矩阵:确定了每一个项目涉及到的认知属性;v LLTM:单维:单维IRT模型模型认知诊断模型的关键一步;认知
50、诊断模型的关键一步;1KiikkkbqcRSMRSM规则空间的建立规则空间的建立失误的随机化定义失误的随机化定义 观察反应模式与理想得分模式之间不一致观察反应模式与理想得分模式之间不一致维度问题维度问题-统计分类统计分类维度问题维度问题-解决的方法解决的方法 题目反应模式题目反应模式 规则空间规则空间 (1,0,1,(1,0,1,0),0)(,),):1.7()1()1abcPce 1()()njjPTn()fxP()-T()P()-x21()0()()(1()()()njjjjE fVar fPPPTxx121()()(1)()()()njjjjnjjjjPTPXPPPTfVar fxxRS