1、第22章 一致性检验kappa 学习目标v熟悉Kappa值的判断标准;v掌握Kappa值的计算以及检验方法;v掌握二分类资料和有序分类资料的一致性分析;Kappa检验v在诊断试验中,研究者希望考察不同的诊断方法在诊断结果上是否具有一致性。诊断试验的一致性检验经常用于下列两种情况:一种是评价新的诊断试验方法与金标准的一致性;另一种是评价两种诊断试验方法对同一个样本或研究对象的化验结果的一致性、两个医务工作者对同一组病人的诊断结论的一致性、同一医务工作者对同一组病人前后进行两次观察作出诊断的一致性等。1960年Cohen等提出用Kappa值作为评价判断的一致性程度的指标。实践证明,它是一个描述诊断
2、的一致性较为理想的指标,因此在临床试验中得到广泛的应用。 Kappa检验vKappa是评价一致性的测量值。检验是否沿对角线格子中的计数(接收比率一样的零件)与那些仅是偶然的期望不同。设Po =对角线单元中观测值的总和,Pe=对角线单元中期望值的总和。则Kappa =(Po - Pe)/(1 - Pe)。Kappa是测量而不是检验。其大小用一个渐进和标准误差构成的t统计量决定。一个通用的经验法则是Kappa大于0.75表示好的一致性(Kappa最大为1);小于0.4表示一致性差。Kappa不考虑评价人间的意见不一致性的程度,只考虑他们一致与否。 Kappa检验v对于用Kappa值判断一致性的建议
3、参考标准为:vKappa =+1,说明两次判断的结果完全一致;vKappa =-1,说明两次判断的结果完全不一致;vKappa =0,说明两次判断的结果是机遇造成;vKappa0,此时说明有意义,Kappa愈大,说明一致性愈好;vKappa0.75,说明已经取得相当满意的一致程度;vKappan)。v系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。概述vK(抽样距离)=N(总体规模)/n(样本规模)v前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可
4、以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。概述v分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。v分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。概述v分层标准为:v以调查所要分析和研究的主要变量或相关的变量作为分层的标准。v以保证各层内部同质性强、各层之
5、间异质性强、突出总体内在结构的变量作为分层变量。v以那些有明显分层区分的变量作为分层变量。概述v分层的比例问题:v按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。v不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。概述v整群抽样:抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成
6、调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法。v优点:简便易行、节省费用,特别是在总体抽样框难以确定的情况下非常适合。v缺点:样本分布比较集中、代表性相对较差。v一般来说,类别相对较多、每一类中个体相对较少的做法效果较好。概述v多阶抽样(分段抽样):按照元素的隶属关系后层次关系,把抽样过程分为几个阶段进行。适用于总体规模特别大,或者总体分布的范围特别广时。v二重抽样(又称两相抽样):就是先抽取一个容量比较大的初始样本,用初始样本估计总体的某些参数或某些必要的信息作为分层的比例或再次抽样的标志,然后将抽出的初始大样本作为“总体”,从中抽取容量合适的样本进行比较详细的调查
7、。特点是,适合用于对总体信息了解比较少的调查。概述v比率抽样(PPS抽样):就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。概述v在抽样调查的实际工作中,经常是要将几种抽样方法结合起来应用。比如,城市居民的收支调查,是将二重抽样、多阶段抽样、分层抽样、机械抽样等多种方法结合起来使用。 在现实的商业性的市场调查中也有非概率抽样的应用。如,配额抽样、随意抽样、志愿者抽样、判断抽样、修正的概率抽样和滚雪球抽样等等,由于这些抽样方法容易出现偏差,所以只在对共性特别强的群体的商业性调查中应
8、用。简单随机抽样及SAS程序 vSAS系统中利用SURVEYSELECT过程步进行简单随机抽样。vSURVEYSELECT过程的语法格式如下:vPROC SURVEYSELECT DATA= OUT= METHOD= SAMPSIZE= SAMPRATE= REP= SEED= NOPRINT;vID variable;vRUN;简单随机抽样及SAS程序vDATA语句指定要分析的数据集名及一些选项;vOUT选择项指定输出结果的SAS数据集名,用来保存抽样输出的结果;vMETHOD选择项指定抽样方法,其中SRS(simple random sampling)为简单随机抽样,SYS(system
9、random sampling)为系统随机抽样,等等;vSAMPSIZE选择项指定需要抽样的样本量;简单随机抽样及SAS程序vREP选择项指定可以重复抽样的次数;vSAMPRATE选择项指定抽样的比例;vSEED选择项指定产生随机随机数字的初始数,缺省是0或负值;vNOPRINT选择项指定不对输出结果进行打印;vID语句指定数据集中需要包含的变量指标。系统(机械、等距)抽样及SAS程序 v把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。在SURVEYSELECT过程步中,只需要将METHOD选择项设定为SYS(systemati
10、c random sampling)即可,通过CONTROL语句设定某个变量作为抽样距离参考变量,即抽样之前按照CONTROL变量对原始样本进行排序,然后按照规定的样本量确定抽样距离,随机选取第一个样本并进行系统抽样。整群抽样及SAS程序 v整群抽样抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查的样本。把“成群的个体”当作个体来看待,那么整群抽样与简单随机抽样的原理就是一样的。多阶抽样及SAS程序 v是将总体分成若干小的群体,但并不在每一小的群体中抽取一个样本,而是将这些小群体称为第一性抽样单元,将它们看作个体进行抽样
11、,然后,再对抽中的第一性抽样单元中的个体抽样,这样的抽样当然可以不止二阶而是多阶的,先抽第一性样单元,再在第一性样单元钟抽第二性样单元,再在第二性样单元中抽第三性样单元,如此直至最基层的个体。 多阶抽样及SAS程序v当总体中个体数量太大,或其他技术上的原因,无法直接对个体编号时,可以采用多阶抽样,先按第一性单元编号,抽取若干个,再在抽得的第一性单元内编号,抽取下一级单元。多阶抽样会使现场观测的样本单元比较集中,有利于节省调查费用。v多阶抽样的SAS程序也是以简单随机抽样和系统性抽样为基础的,只是每一次抽样过程编写一个SAS程序而已,即需要编写多个SAS程序以进行多次抽样。本章小节 v现代被广泛
12、应用的抽样调查是概率抽样。因此,现代的抽样调查是指概率抽样,其定义为:抽样调查,又称抽样推断,是一种重要的、科学的非全面调查方法。它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据来推断总体。本章小节 v概率抽样的原则,就是总体中的每一个样本被选中的概率相等。概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。本章小节 v简单随机抽样:按照等概率的原则,直接从含有N个元素的总体中抽取n个元素组成的样本(Nn);系统抽样(等距抽样
13、或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取;分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本; 本章小节v整群抽样:抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法;多阶抽样(分段抽样):按照元素的隶属关系后层次关系,把抽样过程分为几个阶段进行。适用于总体规模特别大,或者总体分布的范围特别广时。