1、体育统计方法与实例体育统计方法与实例第8章相关与回归分析相关与回归分析 目标1 了解相关的意义 目标2 掌握直线相关分析的计算 目标3 能够制作相关系数矩阵表 目标4 熟悉一元线性回归分析学习目标:8.1.1相关的概念8.1相关分析图8-1-1 函数关系图图8-1-2 非函数关系图8.1 相关分析从图8-1-1看到确定性的函数关系,各对应点完全落在一条直线上。而由图8-1-2看到各对应点并不完全落在一条直线上,两个变量之间也不可能找到一个精确的函数关系式来描述。我们把这种变量间具有密切关联而又不能用函数精确表达的关系,称为变量间的相关。8.1.2相关散点图图8-1-3 无相关散点图图8-1-4
2、正相关和负相关散点图散点图可以定性的描述两个变量之间的相互关系,形式直观、简单,从图上,可以初步看出两个变量是否(线性)相关,相关的方向和相关的程度,但相关散点图不能进行定量研究。一、积差相关系数的计算公式 在实际工作中,我们通常只计算样本相关系数。其公式为:式中:,是变量的离均差平方和;,是变量的离均差平方和;,是变量X、Y的离均差积和。LLLyyxxxyrnxxxxLxx)()(222nyyyyLyy)()(222nyxxyyyxxLxy)(8.1.3相关系数检验方法 相关系数的显著性检验有t-检验和查r界值表两种方法。1、t-检验法 在 成立条件下,检验统计量tt(n-2),其中:选定显
3、著性水平 ,查书后附表2的值表得到双侧临界值 ,若 ,则拒绝 ,表明两变量间存在线性相关关系;若 ,则接受 ,表明两变量间不存在线性相关关系。rnrt212)2(2nttt2H0tt2H0(二)积差相关系数的检验2、直接查表检验法 本书附表中有相关系数的检验表。当我们结合自由度()计算出变量 与 相关系数的绝对值大于表中给定显著性水平 的临界值时,才可以认为 与 有线性关系。通常,如果 小于表上 =5%相应的值时,就认为 与 没有明显的线性关系;当 大于表上 =5%相应的值,但小于表上 =1%相应的值时,称 与 有显著的线性关系;当 大于表上 =1%相应的值时,称 与 有非常显著的线性关系。2
4、nnXYrXYrrXYrXY(三)应用举例【例8-1-1】在安徽省2016年高考体育加试中随机抽取45名考生(男)的百米跑和立定三级跳成绩,将立定三级跳记为;百米跑记为,数据见表8-1-1。试绘出百米跑成绩与立定三级跳成绩的散点图,求出它们之间的相关系数,并检验。表8-1-1 45名高考体育考生(男)加试100米和立定三级跳成绩1),(iyxii?n 1、绘出,2,的散点图,见图8-1-5。图8-1-5 百米跑和立定三级跳成绩的散点图解答如下:(四)SPSS软件操作步骤1、散点图图8-1-6 数据视图窗口图8-1-7散点图/点图对话框图8-1-8定义对话框2、积差相关系数图8-1-9 双变量相
5、关分析对话框图8-1-10 变量选择对话框二、Spearman等级相关(一)等级相关系数的计算设变量 和 的观测值是等级形式的,则等级相关系数为 式中 为等级相关系数,是 的差值,称为等级差,n为样本含量。等级相关系数的假设检验与积差相关系数的检验过程类似。X)1(61)1()(6121221nnDnnyxrniiniiisYsriDiiyx(二)应用举例(二)应用举例【例8-1-2】某次排球比赛中,前8名队伍的名次和扣球命中率排名如下表8-1-3。表8-1-3 排球比赛名次与扣球命中率名次数据rp表8-1-4 相关系数通过计算,得出=0.905,经过检验,=0.002。由此说明,排球名次和扣
6、球命中率排名的相关具有非常显著性意义。8.1.4相关分析的注意事项相关分析的注意事项1在相关分析中,变量 与变量 处于平等的地位。2相关分析主要是研究两变量之间线性相关的密切程度。3在做相关分析时,要建立在对所研究的领域深刻认识的基础之上,要充分考虑两个变量之间的研究是否具有实际意义和实用价值。4相关系数反映的是两个变量之间相关程度的大小,但仅仅知道相关系数是没有意义的,还需对其显著性进行检验。8.2 一元线性回归 8.2.1回归分析的概念 在研究两个变量之间的关系时,一般是先将两个变量的n对观察值所对应的点在直角坐标系中做出散点图,当散点图呈直线趋势时,也就是两变量具有直线相关关系时,从专业
7、知识角度分析两个变量间存在因果关系,常把其中的原因变量叫自变量,用X表示,而把结果变量(依赖于X而变化的量)叫因变量,用Y表示,这时可采用一元线性回归分析法。8.2.2 一元线性回归(1)一元线性回归模型因变量 与自变量 的线性关系可以用 YXXY10式中 是被解释的变量,为因变量,为解释变量,为自变量,和 是未知参数,称为回归系数,表示其他随机因素的影响,称为随机误差。YX01(2)一元线性回归方程一元线性回归方程表8-2-1 方差分析表(6)应用举例【例8-2-1】试求例8-1-1中百米跑对立定三级跳的一元线性回归方程,如某位考生百米跑成绩为12.5秒,该生的立定三级跳成绩估计值是多少?试给出95%的置信区间。表表8-2-2模型汇总模型汇总表表8-2-3 分差分析表分差分析表表表8-2-4系数系数a在表8-2-4中,得出回归方程的系数。在表8-2-3中,得出方差分析中的 值和检验概率F