1、【回顾导入】我们知道,函数关系是一种确定性关系,而相关关系是一种非确定性关系。【回顾导入】下列属于相关现象的有()(1)利息与利率(2)居民收入与存款(3)电视机的产量与苹果的产量(4)某种商品的销售量与销售价格(5)学生的身高与体重【回顾导入】回归分析(regression analysis)是对具有相关关系的两个变量进行统计分析的一种常用方法。在数学3中,我们利用回归分析的方法对两个具有线性相对关系的变量进行了研究,其步骤为画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报。例题1.从某大学中随机选取8名女大学生,其身高和体重数据如下表:求根据女大学生的身高预报体重的回归方程,
2、并预报一名身高为172cm的女大学生的体重。编号编号12345678身高身高/cm165165157170175165155170体重体重/kg 48 57 50 54 64 61 43 59【新知探究】由数学3的知识可知,未知参数b和a的最小二乘估计分别为 和 ,其计算公式如下:ba,)()(121xbyaxxyyxxbniiniii 其中 称为样本点的中心),.(1,111yxynyxnxniinii 【注】xbyaxbyDxxyyxxaxbyCaxbyByxaxbyAaxbyyxyxyxniiniiinn-.)()(.).,1212211的的纵纵截截距距为为直直线线;的的斜斜率率直直线线
3、一一个个点点;至至少少经经过过样样本本数数据据中中的的直直线线;,必必经经过过(直直线线)下下面面说说法法不不正正确确的的是是(那那么么),得得到到回回归归直直线线,(,),),(,据据(【练练习习】由由一一组组样样本本数数 探究身高为172 cm的女大学生的体重一定是60.316 kg吗?如果不是,你能解释一下原因吗?这时我们用下面的线性回归模型 y=bx+a+e,来表示,其中a和b为模型的未知参数,e称为随机误差(random error).产生随机误差项e的原因是什么?思考解释变量x (身高)随机误差e预报变量 y(体重)探究在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一
4、个不可观测的量,那么应该怎样研究随机误差呢?在实际应用中,我们用回归方程 中 的估计(1)中的bx+a.由于随机误差e=y-(bx+a),所以 是e的估计量.对于样本点而言,它们的随机误差为其估计值为 称为相应于点 的残差(residual).axby y yye ),(,),(),(2,211nnyxyxyx,2,1,niabxyeiii ,2,1,niaxbyyyeiiiii ie),(iiyx【思考】如何发现数据中的错误?如何衡量模型的拟合效果?.1.)-1 2222121222表表示示回回归归的的效效果果越越好好,越越接接近近于于的的贡贡献献率率,变变量量对对于于预预报报变变量量变变化
5、化表表示示解解释释在在线线性性回回归归模模型型中中,的的拟拟合合效效果果越越差差越越小小,模模型型越越好好;越越大大,模模型型的的拟拟合合效效果果(计计算算公公式式是是来来刻刻画画回回归归的的效效果果,其其我我们们用用RRRRyyyyRRniiniii 【练习】所有样本点都落在一条直线上,则残差平方和与解释变量和预报变量间的相关指数分别是()A.1,0 B.0,1 C.0,0 D.1,1【练习】甲乙丙丁四位同学各自对A、B两变量的线性相关性做实验,并用回归分析分别求得相关系数r与残差平方和Q,如下表:甲甲乙乙丙丙丁丁r0.820.780.690.85Q106115124103则()同学的试验结果体现A,B两个变量具有更强的线性相关性.【作业布置】同步导练第一课时