1.1回归分析的基本思想及其初步应用学习培训模板课件.ppt

上传人(卖家):林田 文档编号:4116027 上传时间:2022-11-11 格式:PPT 页数:25 大小:770.50KB
下载 相关 举报
1.1回归分析的基本思想及其初步应用学习培训模板课件.ppt_第1页
第1页 / 共25页
1.1回归分析的基本思想及其初步应用学习培训模板课件.ppt_第2页
第2页 / 共25页
1.1回归分析的基本思想及其初步应用学习培训模板课件.ppt_第3页
第3页 / 共25页
1.1回归分析的基本思想及其初步应用学习培训模板课件.ppt_第4页
第4页 / 共25页
1.1回归分析的基本思想及其初步应用学习培训模板课件.ppt_第5页
第5页 / 共25页
点击查看更多>>
资源描述

1、1.1 回归分析的基本思想及其初步应用1.相关关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系2.回归分析?统计中对具有相关关系的两个变量进行分析的一种常用方法。3.必修3中用回归分析的方法对具有线性相关关系的两个变量进行研究所经历的步骤有哪些?第一步:作散点图。第二步:求回归直线的方程。第三步:用回归直线的方程进行预报。例1 从某大学中随机选取8名女大学生,其身高和体重数据如表11所示。编号编号1 12 23 34 45 56 67 78 8身高/cm身高/cm165165165165157157170170175175165165155155170170体重/kg体重/

2、kg48 4857 5750 5054 5464 6461 6143 4359 59求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。40455055606570150155160165170175180身高/cm体重/kg解:由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y.作散点图(图1.1-1)由散点图可看出身高和体重有较好的线性相关关系。40455055606570150155160165170175180身高/cm体重/kg将回归直线添加到散点图中的效果图:xbyaxxyyxxbniiniii,)()(121借助必修3“

3、统计”一章中最小二乘法的思想及计算公式:计算得到:712.85,849.0ab所以线性回归方程为:712.85849.0 xaxbyy=0.849x-85.71240455055606570150155160165170175180身高/cm体重/kg由图中的点与回归直线的位置关系,我们发现女大学生的身高和体重的关系无法由一次函数 来严格刻画。abxy这表明女大学生的体重不仅受到身高的影响,而且还受到其它因素的影响。如:是否喜欢运动、饮食习惯、度量误差等,而且我们选用的模型往往只是一种近似的模型。我们把这些影响的结果e(即残差变量或随机误差)引入到线性函数模型中得到线性回归模型:eabxy其中

4、,a和b为模型的未知参数;残差变量e包含体重不能由身高的线性函数解释的所有部分,e是一个随机变量。提问:是什么因素引起了上述现象呢?线性回归模型和一次函数模型的区别和联系:区别:(1)线性回归模型增加了随机误差e,因此因变量 y的值由自变量x和随机误差e共同决定,即自变量即自变量x 只能解析部分只能解析部分y 的变化的变化.而一次函数模型因变量的值y由自变量x唯一决定。联系:当e=0 时,线性回归函数模型就是一次函数模型。因此,二者是一般与特殊的关系。(2)线性回归模型比一次函数模型的应用更为广泛。在统计中,我们也把自变量在统计中,我们也把自变量x称为解析变量称为解析变量,因变量因变量y称为预

5、报变量称为预报变量.同学们可否通过回归方程来预报身高为172cm的女生的体重?)(316.60712.85172849.0kgy提问:你认为身高为172cm的女大学生的体重一定是60.316kg吗?若不是,你能解释其原因吗?y=0.849x-85.71240455055606570150155160165170175180身高/cm体重/kg问题:由前述的分析我们知道女大学生的身高和体重具有线性相关关系,但相关关系的强弱如何刻画呢?必修3中给出了表示相关关系强若的量,即相关系数的计算公式:niniiiniiiyyxxyyxxr11221)()()(注意:该公式只适用于具有线性相关关系的两个变量

6、之间。图3图4由上面的散点图,我们不难看出:当r0时,两个变量具有正相关;当r0 时,两个变量具有负相关;r的绝对值越接近1,表明两个变量的线性相关性越强,r的绝对值接近0,表明两个变量几乎不存在线性相关关系。通常当r的绝对值大于0.75时,认为两个变量有很强的线性相关关系。同学们可以通过相关系数公式自行计算本例中两个变量的相关系数。结果:r=0.798.注意:应用回归分析的方法研究两个具有线性相关关系的变量时,应先计算相关系数,从而决定是否用回归方程进行拟合。假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相同。但这个值定为多少才合理呢?5.5485943616454505

7、74888182181yyyyyii请同学们看下图:上图表明:预报变量的值受到解释变量或随机误差的影响。40455055606570150155160165170175180身高/cm 体重/kgy=54.5提问:如何刻画预报变量的变化?这个变化在多大程度上与解释变量有关?在多大程度上与随机误差有关?总偏差平方和:niiyy12)(预报变量的变化=观察值 总的平均值=解释变量与随机误差的组合效应iiiyye残差:niiyy12)(残差平方和:回归平方和:niiyy12)(niiyy12)(总的偏差平方和如上,那么随机误差的效应是多少?如何表示呢?偏差平方和分解:nininiiiiiyyyyyy

8、111222)()()(相关指数():在线性回归模型中,表示解释变量对预报变量的贡献率。niiniiiniiniiniiniiiniiniiniininiiiinininiiiiiyyyyyyyyRyyyyyyyyyyyyyyyyyyyy12121212212121212121122111222)()(1)()()()()()()()()(1)()()(2R2R作用:刻画回归的效果。你可否总结一下在研究问题:“如何刻画预报变量的变化?这个变化在多大程度上与解释变量有关?在多大程度上与随机误差有关?”中指导我们分析问题的思想方法?要获悉变量1对变量2的效应(影响),可先假设变量1对变量2没有影响

9、,寻求假设前后变量2的差异,这个差异就是变量1对于变量2的效应。思想方法:残差分析:在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据。然后,我们可以通过残差:neee,21来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的工作称为残差分析。残差图:-8-6-4-202468012345678910编号残差用身高预报体重时,需要注意下列问题:1.回归方程只适用于我们所研究的样本的总体。2.我们所研究的回归方程一般都有时间性。3.样本取值的范围会影响回归方程的适用范围。4.不能期望回归方程得到的预报值就是预报变量的精确值。一般地,建

10、立回归模型的基本步骤为:1.确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量。2.画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否是线性关系等)。3.由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a)。4.按一定规则估计回归方程中的参数(如最小二乘法)。5.得出结论后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),若存在异常,则检查数据是否有误,或模型是否合适等。谢谢各位:再再 见见!例2.一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据于表1-5中,试建立y与x之间的回归方程。表1-5温度x/摄氏度21232527293235产卵数y/个711212466115325解:根据收集的数据作散点图:050100150200250300350400202224262830323436温度卵数观察发现:样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系。根据已有的知识

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(1.1回归分析的基本思想及其初步应用学习培训模板课件.ppt)为本站会员(林田)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|