1、统计学原理课程代码:00974第一节 变量间的相关关系一、相关关系的概念概念:统计学把现象之间在数量上非确定性的对应关系,叫做相关关系或统计关系。二、相关关系的种类 1、按相关的方向不同:正相关和负相关2、按相关的形式不同:线性相关和非线性相关3、按影响因素的数量不同:单相关、复相关和偏相关 第二节 简单线性相关分析 一、相关表与相关图1、相关表2、相关图二、相关系数含义:计算公式判定标准 一、相关表与相关图1、相关表把相关的两个变量的数值,相对应地排列而成的一张表。如教材P127(表5-1)2、相关图又称散点图,是在平面直角坐标中,以横轴表示变量X,以纵轴表示变量Y,将相关表中对应的资料数值
2、在图上标出坐标点所形成的图形。平均受教育程度与平均年收入散点图二、相关系数含义:是用于测定两个变量之间线性相关程度和相关方向的统计分析指标,用字母r表示。计算公式:判定标准:0.3以下,微弱线性相关0.30.5,低度线性相关0.50.8,显著线性相关0.8以上,高度线性相关相关系数计算公式则,Y)的一组样本观察值)是(X,y,设(xii2)y(y2)x(x)y)(yx(xn2)y(yn2)x(xn)y)(yx(xry的标准差x,yxy的协方差x,xy为x与y的相关系数yxxy2ryyxxxyLLLr的简化计算式2)y(y2)x(x)y)(yx(xyxxyrn2(y)2yn2(x)2xnxyxy
3、n2(y)2yn2(x)2xn)nxyn(xy2(y)2ny2(x)2nxxynxy2y2y2x2xyxxyyxyxxy举例:相关分析为了解餐饮业消费数额与小费之间的数额关系,特从若干名消费者中随机抽取10消费者调查,所得数据如下:例计算过程。解答2129.51987.59102883.987703.2310129.5883.913031.18102(y)2ny2(x)2nxxynxyr0.923234.995753.0915846.75答:即账单消费额与小费之间存在着高度的正相关关系。10n13031.18,xy1987.59,2y87703.23,2x129.5.8,y883.9,x第三节
4、 一元线性回归分析一、回归分析的概念二、回归分析的方法三、估计标准误差四、可化为线性回归的非线性回归五、相关分析与回归分析的特点一、回归分析的概念回归分析,描述的是一个变量怎样依赖于另一个变量,或者说,当一个变量发生一定的变动时,另一个变量将会发生怎样的数量变动。二、回归分析的方法一元线性回归分析方程式:式中,x为自变量,是可控变量(或称确定变量);a为直线截距;b为直线斜率,其含义:表示当x增加一个单位时y的平均增加数量。bxay回归参数计算式线性回归模型参数估计值计算公式:xbynxbnyan2(x)2xnxyxyb2(x)2nxxynxy回归分析解:通过散点图可近似看出用餐消费与小费支出
5、支出之间呈线性关系,故设两者有关系13031.18xy1987.59,y87703.23x129.5,y883.9,x10,n220.16695753.0915846.752883.987703.2310129.5883.913031.18102(x)2nxxynxyb1.72388.390.16612.95nxbnyxbya0.166x1.723bxay:回归方程经济意义:用餐消费每增加100元,小费支出平均增加16.6元。高度正相关0.925.8732.610.166yxbr三、估计标准误差计算:作用:表现为两方面,一是衡量回归模型的拟合优度;另一方面用来对实际值落在估计值周围的区间做出一
6、个大概的说明。n2xyybay2s例已知下列资料,试计算估计标准误差。2574xy701,2y9577,2x81,y293,x10,n4.2992bxyayy)y(y220.732104.29922n)y(yS2y0.2033b2.1726a答:观察值与回归值之间的平均离差为0.73五、相关分析与回归分析的特点四方面:注意现象质的界限及相关关系作用的范围;计算相关系数时,两个变量不必区分自变量和因变量,但在回归分析时,必须区分自变量和因变量;相关系数表示的是变量之间关系的紧密程度,回归分析反映的是变量之间相互影响关系和数量规律性。对“发现”机制的一种解释。本章要点相关与回归分析相关分析回归分析相关系数建立回归方程计算相关系数确定待定参数a、b相关图、表解释回归系数b经济意义拟合优度测定