选修1-2统计案例课件.ppt

上传人(卖家):晟晟文业 文档编号:4317483 上传时间:2022-11-29 格式:PPT 页数:26 大小:683KB
下载 相关 举报
选修1-2统计案例课件.ppt_第1页
第1页 / 共26页
选修1-2统计案例课件.ppt_第2页
第2页 / 共26页
选修1-2统计案例课件.ppt_第3页
第3页 / 共26页
选修1-2统计案例课件.ppt_第4页
第4页 / 共26页
选修1-2统计案例课件.ppt_第5页
第5页 / 共26页
点击查看更多>>
资源描述

1、复习回顾复习回顾1、线性回归模型:、线性回归模型:y=bx+a+e,其中其中a和和b为模型的未知参数,为模型的未知参数,e称为随机误差称为随机误差。2、数据点和它在回归直线上相应位置的差异、数据点和它在回归直线上相应位置的差异 是随机误差的效应,称是随机误差的效应,称 为为残差残差。)iiyy(iiieyy=3、对每名女大学生计算这个差异,然后分别将所得、对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号表示为:的值平方后加起来,用数学符号表示为:称为称为残差平方和残差平方和,它代表了随机误差的效应。它代表了随机误差的效应。21()niiiyy刻画模型拟合的精度刻画模型拟合

2、的精度相关指数:相关指数:22121()1()niiiniiyyRyy R2取值越大,则残差平方和越小,即模型的拟合效果取值越大,则残差平方和越小,即模型的拟合效果越好越好.1)1)确定解释变量和预报变量确定解释变量和预报变量;2)2)画出散点图画出散点图;3)3)确定回归方程类型确定回归方程类型;4)4)求出回归方程求出回归方程;5)5)利用相关指数或残差进行分析利用相关指数或残差进行分析.建立回归模型的基本步骤建立回归模型的基本步骤 问题:问题:一只红铃虫的产卵数一只红铃虫的产卵数y与温度与温度x有关有关,现收现收集了集了7组观测数据组观测数据,试建立试建立y与与x之间的回归方程之间的回归

3、方程 解解:1):1)作散点图作散点图;从散点图中可以看出产卵数和温度之间的关系并不能从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似。这些散点更像是集中用线性回归模型来很好地近似。这些散点更像是集中在一条指数曲线或二次曲线的附近。在一条指数曲线或二次曲线的附近。选变量选变量 解:选取气温为解释变量解:选取气温为解释变量x x,产卵数,产卵数 为预报变量为预报变量y y。画散点图画散点图假设线性回归方程为假设线性回归方程为:=bx+a选选 模模 型型分析和预测分析和预测当当x=28时,时,y=19.8728-463.73 93估计参数估计参数由计算器得:线性回归方程为由

4、计算器得:线性回归方程为y=y=19.8719.87x x-463.73-463.73 相关指数相关指数R R2 2=r r2 20.8640.8642 2=0.7464=0.7464所以,一次函数模型中温度解释了所以,一次函数模型中温度解释了74.64%的产卵数变化。的产卵数变化。探索新知探索新知050100150200250300350036912151821242730333639方案1当当x=28时,时,y=19.8728-463.73 93一元线性模型一元线性模型奇怪?奇怪?9366?模型不好?模型不好?y=bx2+a 变换变换 y=bt+a非线性关系非线性关系 线性关系线性关系方案

5、2问题问题选用选用y=bx2+a,还是,还是y=bx2+cx+a?问题问题3 产卵数产卵数气温气温问题问题2如何求如何求a、b?合作探究合作探究 t=x2二次函数模型二次函数模型方案2解答平方变换平方变换:令令t=xt=x2 2,产卵数,产卵数y y和温度和温度x x之间二次函数模型之间二次函数模型y=bxy=bx2 2+a+a就转化为产卵数就转化为产卵数y y和温度的平方和温度的平方t t之间线性回归模型之间线性回归模型y=bt+ay=bt+a温度温度21232527293235温度的平方温度的平方t44152962572984110241225产卵数产卵数y/个个7112124661153

6、25作散点图,并由计算器得:作散点图,并由计算器得:y y和和t t之间的线性回归方程为之间的线性回归方程为y=y=0.3670.367t t-202.54-202.54,相关指数,相关指数R R2 2=r r2 20.8960.8962 2=0.802=0.802将将t=xt=x2 2代入线性回归方程得:代入线性回归方程得:y=y=0.3670.367x x2 2-202.54-202.54当当x x=28=28时时,y y=0.367=0.36728282 2-202.5485202.5485,且,且R R2 2=0.802=0.802,所以,二次函数模型中温度解所以,二次函数模型中温度解

7、释了释了80.2%80.2%的产卵数变化。的产卵数变化。t问题问题 变换变换 y=bx+a非线性关系非线性关系 线性关系线性关系2110c xyc问题问题如何选取指数函数的底如何选取指数函数的底?产卵数产卵数气温气温指数函数模型指数函数模型方案3合作探究合作探究对数对数xcecy21方案3解答温度温度xoC21232527293235z=lgy0.851.041.321.381.822.062.51产卵数产卵数y/个个711212466115325xz当当x=28x=28o oC C 时,时,y 44 y 44,指数回归,指数回归模型中温度解释了模型中温度解释了98.5%98.5%的产卵数的的

8、产卵数的变化变化由计算器得:由计算器得:z z关于关于x x的线性回归方程的线性回归方程为为z=0.118z=0.118x x-1.665-1.665,相关指数相关指数R R2 2=r r2 20.99250.99252 2=0.985=0.9850.118x-1.665 10y 对数变换:在对数变换:在 中两边取常用对数得中两边取常用对数得令令 ,则,则 就转换为就转换为z z=bx+a=bx+a22111221lglg(10)lglg10lglg10lgc xc xycccc xc xc2110c xyc12lg,lg,zy ac bc2110c xyc最好的模型是哪个最好的模型是哪个?产

9、卵数产卵数气温气温产卵数产卵数气温气温线性模型线性模型二次函数模型二次函数模型指数函数模型指数函数模型比一比比一比函数模型函数模型相关指数相关指数R2线性回归模型线性回归模型0.7464二次函数模型二次函数模型0.802指数函数模型指数函数模型0.985最好的模型是哪个最好的模型是哪个?解解:令令 则则z=bx+a,(a=lncz=bx+a,(a=lnc1 1,b=c,b=c2 2),),列出变换后数据表并画列出变换后数据表并画 出出x x与与z z 的散点图的散点图 z=lnyz=lnyx和z之间的关系可以用线性回归模型来拟合z=ax+b+ez=ax+b+e2 2c xc x1 1用用y=c

10、 e模y=c e模型型;1)x x2121232325252727292932323535z z1.9461.946 2.3982.398 3.0453.045 3.1783.1784.194.194.7454.745 5.7845.784 应用统计方法解决实际问题需要注意的问题:应用统计方法解决实际问题需要注意的问题:对对于同样的数据,有不同的统计方法进行分析,于同样的数据,有不同的统计方法进行分析,我们要用最有效的方法分析数据。我们要用最有效的方法分析数据。现在有三个不同的回归模型可供选择来拟合红铃虫的产卵数与温度数据,他们分别是:.,212exyecyebaxyexc可以利用直观(散点图

11、和残差图)、相关指数来确定哪一个模型的拟合效果更好。ebxcz2ety(1 1)0 0.2 27 72 2x x-3 3.8 84 43 3(2 2)2 2y y=e e,y y=0 0.3 36 67 7x x-2 20 02 2.5 54 4(1 1)(1 1)0 0.2 27 72 2x x-3 3.8 84 43 3i ii ii i(2 2)(2 2)2 2i ii ii ie e=y y-y y=y y-e e,(i i=1 1,2 2.7 7)e e=y y-y y=y y-0 0.3 36 67 7x x+2 20 02 2.5 54 4,残残差差表表编号编号1 12 23 3

12、4 45 56 67 7x x2121232325252727292932323535y y7 71111212124246666115115325325e(1)e(1)0.520.52-0.167-0.1671.761.76-9.149-9.1498.8898.889-14.153-14.15332.92832.928e(2)e(2)47.747.7 19.39719.397-5.835-5.835-41.003-41.003-40.107-40.107-58.268-58.26877.96577.965非线性回归方程非线性回归方程二次回归方程二次回归方程残差公式残差公式(1)y=f(bx+

13、a+e))(yfeabx1)(yfz1Z=bx+a+e(2)y=bg(x)+a+et=g(x)y=bt+a+e(3)y=f(bg(x)+a+e))(yfz1)(xgt Z=bt+a+e用线性回归模型解决非线性相关问题小小 结结 实际问题实际问题y=f(x)y=f(x)样本分析样本分析y=f(x)y=f(x)回归模型回归模型y=f(x)y=f(x)抽样抽样回归分析回归分析预报精度预报精度预报预报用身高预报体重时,需要注意下列问题:用身高预报体重时,需要注意下列问题:1、回归方程只适用于我们所研究的样本的总体;、回归方程只适用于我们所研究的样本的总体;2、我们所建立的回归方程一般都有时间性;、我们

14、所建立的回归方程一般都有时间性;3、样本采集的范围会影响回归方程的适用范围;、样本采集的范围会影响回归方程的适用范围;4、不能期望回归方程得到的预报值就是预报变量的精确值。、不能期望回归方程得到的预报值就是预报变量的精确值。事实上,它是预报变量的可能取值的平均值。事实上,它是预报变量的可能取值的平均值。这些问题也使用于其他问题。这些问题也使用于其他问题。涉及到统计的一些思想:涉及到统计的一些思想:模型适用的总体;模型适用的总体;模型的时间性;模型的时间性;样本的取值范围对模型的影响;样本的取值范围对模型的影响;模型预报结果的正确理解。模型预报结果的正确理解。小结小结相关系数相关系数 相关系数又

15、称线性相关系数相关系数又称线性相关系数.它是衡量变量它是衡量变量之间线性相关程度的指标。样本相关系数之间线性相关程度的指标。样本相关系数用用r表示表示,总体相关系数用总体相关系数用表示表示,相关系数的相关系数的取值范围为取值范围为-1,1。|r|值越大,误差值越大,误差Q越小,越小,变量之间的线性相关程度越高;变量之间的线性相关程度越高;|r|值越接值越接近近0,Q越大,变量之间的线性相关程度越越大,变量之间的线性相关程度越低。低。相关系数相关系数 如两者呈正相关,如两者呈正相关,r呈正值,呈正值,r=1时为完全时为完全正相关;如两者呈负相关则正相关;如两者呈负相关则r呈负值,而呈负值,而r=

16、-1时为完全负相关。完全正相关或负相关时,时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,在直线回归线上下越离散,r的绝对值越小。的绝对值越小。相关系数的绝对值越接近相关系数的绝对值越接近1,相关越密切;,相关越密切;越接近于越接近于0,相关越不密切。当,相关越不密切。当r=0时,说时,说明明X和和Y两个变量之间无直线关系。通常两个变量之间无直线关系。通常|r|大于大于0.8时,认为两个变量有很强的线性相时,认为两个变量有很强的线性相关性关性相关系数的性质相关系数的性质 相关系数的性质相关系数的性质(1)相关

17、系数可正可负;)相关系数可正可负;(2)相关系数的区间是)相关系数的区间是-1,1;(3)相关系数是线性关联或线性相依的一)相关系数是线性关联或线性相依的一个度量,它不能用于描述非线性关系;个度量,它不能用于描述非线性关系;偏差平方和偏差平方和 偏差平方和偏差平方和 单次测量值单次测量值x1与测定平均值之差的平方的与测定平均值之差的平方的总和,以总和,以Q表示,表示,Q值越大,表示测定值之值越大,表示测定值之间的差异越大,用偏差平方和表征差异的间的差异越大,用偏差平方和表征差异的优点是能充分利用测度数据所提供的信息,优点是能充分利用测度数据所提供的信息,缺点是缺点是Q随着测定值数目的增多而增大

18、,为随着测定值数目的增多而增大,为了克服这一缺点,用方差了克服这一缺点,用方差S2=Q/f来表征差来表征差异的大小,其中异的大小,其中f为自由度。如一个测定结为自由度。如一个测定结果受多个因素影响,则总偏差平方和等于果受多个因素影响,则总偏差平方和等于实验误差与各因素(包括固定因素与随机实验误差与各因素(包括固定因素与随机因素)所形成的偏差平方和之总和。因素)所形成的偏差平方和之总和。残差平方和 英文:residual sum of squares1 概念:为了明确解释变量和随机误差各产生的效应是多少,统计学上把数据点与它在回归直线上相应位置的差异称残差,把每个残差的平方后加起来 称为残差平方和,它表示随机误差的效应。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(选修1-2统计案例课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|