1、主编主编 1谢谢观赏2019-8-235.1 直线相关直线相关 5.1.1 积矩相关系数积矩相关系数 定义定义1 设设X、Y服从正态分布,服从正态分布,EXX,EYY,DX0、DY0 变量变量X、Y的总体积矩相关系数的总体积矩相关系数 DYDXYXEYX )(2谢谢观赏2019-8-23E(X-x)(Y-y)称称X和和Y协方差协方差-11,X和和Y相关则相关则|=1,X和和Y独立则独立则=0 定义定义3 若若(x1,y1),(xn,yn)为为X,Y样本样本,则定义样本相关系数则定义样本相关系数 yyxxxylllr YXnXYYYXXlXY)(22)1()(XXXSnXXl22)1()(YYY
2、SnYYl1 r 1,适用双正态资料,用计算器,适用双正态资料,用计算器LR模式模式 3谢谢观赏2019-8-231r1|r|越接近于越接近于1,X和和Y之间的线性关系越之间的线性关系越密切密切|r|越接近越接近0,X和和Y的线性关系越不密切的线性关系越不密切 00;1r 0负相关负相关,拟合拟合直线斜率直线斜率0;r0零相关零相关,拟合曲线或杂乱无章拟合曲线或杂乱无章 1 rxOy01 rxOy0 rxOy0 rxOy5.1.2 相关系数的假设检验相关系数的假设检验 4谢谢观赏2019-8-23)2(212ntnrrt用用t统计量统计量(df=n-2)检验检验H0:=0,判断,判断Y与与X是
3、否线是否线性相关,称相关系数检验性相关,称相关系数检验 由由dfn2,查统计用表,查统计用表19,在,在P 时,以时,以 水准水准拒绝拒绝H0,认为,认为x与与y之间有直线相关关系之间有直线相关关系 例例1 测某地测某地10名三岁儿童的体重名三岁儿童的体重X(kg)与体表面)与体表面积积Y(101m2),计算样本相关系数),计算样本相关系数r,并检验是否,并检验是否来自来自0的总体的总体 5谢谢观赏2019-8-23计量资料,散点图直线趋势计量资料,散点图直线趋势 H0:总体相关系数:总体相关系数0 n10,SX1.6635,SY0.4142,XY775.3466 体重11.011.812.0
4、12.313.113.714.414.915.216.0体表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411121416566.55M1 1711M0 4400.13X7266.5Y9179.04142.06635.1)110(7266.54400.13103466.775r6谢谢观赏2019-8-23查统计用表查统计用表19,r0.01/2(8)0.7646,双侧,双侧P0.01,按,按 0.01水准双侧检验拒绝水准双侧检验拒绝H0,可认为该地三岁儿,可认为该地三岁儿童体重童体重X与体表面积与体表面积Y有正向直线相关关系有正向直线相关关系
5、5.1.3 秩相关秩相关 等级或相对数资料,或不服从正态分布资料,或总等级或相对数资料,或不服从正态分布资料,或总体分布类型不知资料,不宜用积矩相关系数作相关体分布类型不知资料,不宜用积矩相关系数作相关分析,可用等级相关系数作相关分析,称为秩相关分析,可用等级相关系数作相关分析,称为秩相关 常用秩相关分析方法有常用秩相关分析方法有Spearman法和法和Kendall法。法。两法分别将两个变量按原始数值由小到大编秩,用两法分别将两个变量按原始数值由小到大编秩,用等级相关系数等级相关系数rS和和rK作检验统计量作检验统计量 7谢谢观赏2019-8-23相同秩次较多时,检验统计量要换为校正值相同秩
6、次较多时,检验统计量要换为校正值rSC nndrS326126/)(26/)()(6/)(3323YXYXSCTnnTnndTTnnrd为每配对秩次之差,为每配对秩次之差,TX(或(或TY)(tj3tj)/12,tj为为X(或(或Y)中第)中第j个相同秩次的个数个相同秩次的个数 用用X与与Y的秩值,按积矩相关系数的公式也可计算的秩值,按积矩相关系数的公式也可计算出出rS,查统计用表,查统计用表20,在,在P 时以时以 水准拒绝水准拒绝H08谢谢观赏2019-8-23Kendall法是将法是将X的秩次按从小到大排列,计算配对的秩次按从小到大排列,计算配对Y的每个秩次下面大于自己秩次的秩次个数,合
7、计值的每个秩次下面大于自己秩次的秩次个数,合计值S 142nnSrK相同秩次较多时,检验统计量要换为校正值相同秩次较多时,检验统计量要换为校正值rKC 12/)(2/)(222YXKCUnnUnnSrUX(或或UY)=(tj2-tj)/2,tj为为X(或或Y)第第j个相同秩次个数个相同秩次个数 查统计用表查统计用表21,P 时以时以 水准拒绝水准拒绝H0:K0 9谢谢观赏2019-8-23例例2 测得测得27岁急性白血病患儿的血小板数岁急性白血病患儿的血小板数X与出血与出血症状症状Y资料,研究血小板数资料,研究血小板数X与出血症状与出血症状Y之间联系之间联系 编号XX秩YY秩秩差编号XX秩YY
8、秩秩差1542706+9-377424073.53.52137902+9-7810640083.54.531650037-4912617093.55.543105043.50.510129000103.56.55426005+9-4.01114388011+11.5-0.56121601+11.5-10.512200400123.58.510谢谢观赏2019-8-23等级资料,等级、,分别量化为等级资料,等级、,分别量化为0、1、2、3,散点图无直线趋势,不必直线相关分析,散点图无直线趋势,不必直线相关分析11谢谢观赏2019-8-23H0:0,H1:0 1105210523.50.5M1 22000030000M0 分别编秩,计算每对秩次之分别编秩,计算每对秩次之差差d,相同观察值取平均秩,相同观察值取平均秩,有有6个个-,3个个+,2个个+d2378,TY(63-6)+(33-3)+(23-2)/1220 4222.02026/)1212(026/)1212(378)200(6/)1212(333SCr查统计用表查统计用表20,0.42220.05,不能以不能以 0.05水准拒绝水准拒绝H0,不能认为血小板数与出,不能认为血小板数与出血症状之间有直线相关关系血症状之间有直线相关关系 12谢谢观赏2019-8-23