1、第九章 等级相关(定序-定序)第一节第一节 gamma相关系数和相关系数和dy系数系数 第二节第二节 肯德尔肯德尔Tau系数系数 第三节第三节 spearman相关系数相关系数第一节第一节 gamma相关系数相关系数和和dy系数系数 一、基本概念和基本思路一、基本概念和基本思路o统计学家统计学家Goodman和和Kruskal的的Gamma系数和萨系数和萨默斯默斯(Somers)的的dy系数系数,用于两个定序变量,系数,用于两个定序变量,系数都介于都介于-1和和+1之间,绝对值越大表示相关程度越强,之间,绝对值越大表示相关程度越强,正的表示正相关,负的表示负相关,这两个系数都具有正的表示正相关
2、,负的表示负相关,这两个系数都具有消减误差意义消减误差意义o基本思路:根据任何两个个案在某变量上的等级来预测基本思路:根据任何两个个案在某变量上的等级来预测他们在另一个变项上的等级时,可能减少的误差比例他们在另一个变项上的等级时,可能减少的误差比例o个案对数个案对数 同序对:某对个案在两个变量上的相对等级是相同的同序对:某对个案在两个变量上的相对等级是相同的 异序对:某对个案在两个变量上的相对等级是不同的异序对:某对个案在两个变量上的相对等级是不同的1(1)2nn sdnn代表同序对的总数代表异序对的总数 1 1、同序对、同序对(same ordered pair)(same ordered
3、pair)设个案设个案A在变量在变量x和和y具有等级具有等级(xi,yi),个案,个案B在变量在变量x和和y具有等级具有等级(xj,yj),如果,如果xixjyiyj,则称则称A和和B为同序对,记作为同序对,记作Ns 2 2、异序对、异序对(different ordered pair)(different ordered pair)设设A(xi,yi)和和B(xj,yj),如果,如果xixj,yiyj则则称称A和和B为异序对,记作为异序对,记作Nd3 3、同分对、同分对(tied pair)(tied pair)X同分对:设同分对:设A(xi,yi)和和B(xj,yj),如果,如果xi=xj
4、,yi yj,则称,则称A和和B为为x同分对,记作同分对,记作TxY同分对:设同分对:设A(xi,yi)和和B(xj,yj),如果,如果xi xj,yi=yj,则称,则称A和和B为为y同分对,记作同分对,记作Ty X、Y同分对:设同分对:设A(xi,yi)和和B(xj,yj),如果,如果xi=xj,yi=yj,则称,则称A和和B为为xy同分对,记作同分对,记作Txyo试就以下数据,列举其中的试就以下数据,列举其中的同序对、异序对和同分对同序对、异序对和同分对casex yABCDE3 243 153 161 172 3AB、AC:x同分对,同分对,AD:同序对,:同序对,AE:异序对:异序对B
5、C:xy同分对,同分对,BD:y同分对同分对BE:异序对:异序对CD:y同分对,同分对,CE:异序对:异序对DE:同序对:同序对根据列联表中的频次计算Ns和Nd合合计计高高中中低低高高910625中中830 12 50低低3517 25合计合计20 45 35100教育程度教育程度经济经济收入收入对于对于“高高高高”9人来说,人来说,共可得同序对数为:共可得同序对数为:9(30+12+5+17)=576根据列联表中的频次计算Ns和Nd高高中中低低高高f11f21f31中中f12f22f32低低f13f23f33xyNs=f11(f22+f23+f32+f33)+f12(f23+f33)+f21
6、(f32+f33)+f22(f33)Nd=f31(f12+f22+f13+f23)+f21(f12+f13)+f32(f13+f23)+f22(f13))1(21)1(21)1(21333312121111ffffffTxyTy=f11(f21+f31)+f21(f31)+f12(f22+f32)+f22(f32)+f13(f23+f33)+f23(f33)Y同分对(根据列计算同分对(根据列计算):xy同分对(根据每个条件次数计算同分对(根据每个条件次数计算):高高中中低低高高f11f21f31中中f12f22f32低低f13f23f33四名学生的成绩等级四名学生的成绩等级 数学和英语成绩两个
7、变量:数学和英语成绩两个变量:数学和统计学成绩两个变量:数学和统计学成绩两个变量:数学和心理学成绩两个变量:数学和心理学成绩两个变量:学学 生生成绩等级成绩等级数学数学英语英语统计学统计学心理学心理学A4241B3332C2123D141424sdnn,60sdnn,06sdnn,11(1)4(4 1)622n n个案对数sdsdsdsdnnnnnnnn和相差越大,表示两个变量的相关越强和相差越小,表示两个变量的相关越弱大于表示两变量成正相关,小于表示两变量成负相关二,二,Gamma相关测量法相关测量法SdSdNNGNN0G,无 相 关0G1,正 相 关-1GZ0.001/23.30结论是拒绝
8、原假设结论是拒绝原假设,认为认为s不等于不等于0.斯皮尔曼等级相关系数斯皮尔曼等级相关系数例:例:1)婚姻中的门当户对:)婚姻中的门当户对:高配高、低配低高配高、低配低 完全正等级相关完全正等级相关高配低、低配高高配低、低配高 完全负等级相关完全负等级相关2)家庭背景与事业成就)家庭背景与事业成就rs第三节第三节 spearman相关系数相关系数现在,作如下调查:x=父亲的身高;y=本人的身高;yx矮 1中 2高 3矮1中2高3o每对父子(女)作为一个观测单元,将其等级写成一个集合:如(1,2)o将等级差平方后求和o其极值会是怎样?1、相关系数o以等级差的平方和为基础来讨论等级相关。o设样本共
9、有n对单元,x、y均有n个等级o没一个单元x和y的观察值为:o等级差的平方和为:o则:rs(,)iixyni 321,yxdiii22161212ndrnniis 练习练习 外貌等级:外貌等级:1;2;3;4;5;6;恋爱的;恋爱的6对男女对男女学生配对如表:学生配对如表:求求rs 并分析结果并分析结果男xi女yi1322344561562、的取值范围:o完全正等级相关:完全正等级相关:(1;1)()(2;2)o完全负等级相关:完全负等级相关:(1;n)()(2;n-1)o取值范围为:取值范围为:oSpearman等级相关是以变量没有相同等级为前提等级相关是以变量没有相同等级为前提的,如果相同
10、等级不太多的话,可采用平均等级的来的,如果相同等级不太多的话,可采用平均等级的来计算计算rs1rs1rs1,1变量变量等级等级学习时数学习时数平均成绩平均成绩学习时数学习时数平均成绩平均成绩243.667.5-1.52.25172.02.511.52.25202.74400413.687.50.50.25523.710911233.15500463.8910-11172.52.53-0.50.25152.11211293.37611 didi2yixi00.9练习练习 某大学调查学生每周学习时间与得分的平均等级之某大学调查学生每周学习时间与得分的平均等级之间的关系,抽查的学生资料如下:间的关系,抽查的学生资料如下:3,的统计检验目的:通过对抽样数据的检验,确认总体中也存在等级相关。:总体变量x与变量y等级相关 :统计量:当 时,统计量 当 时,统计量rs0ps0(00)sssppp或H0H110n30nrrssnt212110nzrs练习练习:学生工作能力与智商调查数据如下:二者是否有:学生工作能力与智商调查数据如下:二者是否有显著差异?(显著差异?(a=0.05)学生学生活动能力名次活动能力名次智商智商11110221103310544955512066947710088105991051010110