1、第五章 相关系数第一节 相关、相关系数与散点图n什么是相关n相关系数n散点图一、什么是相关n事物之间的相关关系因果相关共变相关相关关系n相关的类别正相关负相关零相关二、相关系数n两列变量间相关程度的数字表示形式,或者说是用来表示相关关系强度的指标。n取值情况:-1.00r 1.00三、散点图n通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系作出直观而有效的预测和解释。n线性相关n曲线相关第二节 积差相关n概念n适用条件n公式n例题一、概念n积差相关,又叫积矩相关,是英国统计学家皮尔逊在20世纪初提出的一种计算相关的方法,故而也被称为皮尔逊相关法,是求直线相关
2、的最基本的方法。二、适用条件n两列变量均是由测量得到的连续变量n两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布n变量必须是成对的数据n两变量间为线性关系三、计算公式n计算公式1n计算公式2n计算公式3xyxyrN1xyrN 2222/XYXYNrXXNYYN2222/XYXYNrXXNYYN四、例题n例5-1第三节 等级相关n斯皮尔曼等级相关n肯德尔等级相关一、斯皮尔曼等级相关n概念n适用条件n公式n例题1、概念n两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,计算这样两变量的相关,称为等级相关,又叫斯皮尔曼相关。2、适用条件n两变量的资料为等级测量数据,且
3、具有线性关系n连续变量的测量数据,按其大小排成等级,亦可用等级相关法计算n不要求总体呈正态分布3、公式nN为等级个数nD指二列成对变量的等级差数22611RDrN N 与 为两列变量各自排列的等级顺序43(1)11XYRR RrNNN NXRYR4、例题n例5-3出现相同等级时:n用它们所占等级位置的平均数作为它们的等级二、肯德尔和谐系数n概念n适用条件n公式n例题1、概念n肯德尔和谐系数又称肯德尔W系数。当多个变量值以等级顺序表示时,这几个变量之间的一致性程度,称为肯德尔和谐系数。2、适用条件n适用于两列以上等级变量。n如了解几个评定者对同一组学生学习成绩等级评定的一致性程度。3、计算公式n
4、 为R的离差平方和,K为等级变量的列数或评价者数目;n为被评价对象的数目23112RSSWKnnRSS222/RSSRRRRn4、例题n例5-6练习:n书后习题10、11第四节 质与量相关n一列为等比或等距的测量数据,另一列是按性质划分的类别,欲求这样两列变量的直线相关,称之为质量相关。n点二列相关n二列相关一、点二列相关n概念n适用条件n计算公式n例题1、概念n两列变量中,一列是正态连续性变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。n二分变量的种类 真正的二分变量 人为的二分变量2、适用条件n一列变量为正态连续变量,而另一列为真正的二分变量3、计算公式n 为二分称名变量
5、的一个值对应的连续变量的平均数n 为二分称名变量的一个值对应的连续变量的平均数np与q是二分称名变量两个值各自所占的比率,p+q=1nSt是连续变量的标准差pqpbxXXrp qpXqX4、例题5-9、5-10n149页二、二分变量n概念n适用条件n计算公式n例题1、概念n两列变量中,一列是正态连续性变量,另一列是人为的二分变量,描述这两个变量之间的相关,称为二列相关。2、适用条件n两列数据均属于正态分布,其中一列变量为等距或等比的测距数据,另一列变量为人为划分的二分变量。3、计算公式n 为二分称名变量的一个值对应的连续变量的平均数n 为二分称名变量的一个值对应的连续变量的平均数np与q是二分
6、称名变量两个值各自所占的比率,p+q=1nSt是连续变量的标准差pqpbxXXp qrSypXqX4、例题5-11n152页第五节 品质相关n品质相关用于表示RC(行列)表的两个变量的相关程度。n这种相关处理的数据类型一般都是计数数据,而非测量性数据n分类:四分相关、相关、列联表相关相关n概念n适用条件n计算公式n例题1、概念n当两变量均为真正的二分变量时,描述这两个变量之间的相关,称为 相关。A因素因素A非非AB因素因素Baba+b非非Bcdc+da+cb+d2、适用条件n两变量为真正的二分变量n两个分布都只有两个点值或表示某些质的属性3、计算公式adbcrabacbdcdA因素因素A非非AB因素因素Baba+b非非Bcdc+da+cb+d4、例题5-14复习: