ImageVerifierCode 换一换
格式:PPT , 页数:50 ,大小:893.50KB ,
文档编号:7924478      下载积分:15 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-7924478.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(momomo)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(《数学建模简明教程》课件第8章.ppt)为本站会员(momomo)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

《数学建模简明教程》课件第8章.ppt

1、1 1第八章 统计回归模型8.1 一元线性回归模型一元线性回归模型8.2 多元线性回归模型多元线性回归模型8.3 非线性回归模型非线性回归模型2 2回归分析(RegressionAnalysis)方法是数理统计中最常见的一类方法.该方法利用大量统计数据,建立自变量与因变量之间因果关系的回归方程数学模型.这类模型广泛应用于社会、经济、医学等领域的定量分析和估值、预测.3 3对于自变量x的每一个值,因变量是一个随机变量y,若x对y的影响是线性的,则可表示为y01x,称为一元线性回归模型,其中0,1为待定回归系数,为随机误差,N(0,2).一元线性回归分析的主要任务是:用试验值(样本值)对0、1和作

2、点估计;对回归系数0、1作假设检验;在xx0处对y做出预测,给出y的区间估计.8.1 一元线性回归模型一元线性回归模型4 41.回归系数的最小二乘估计回归系数的最小二乘估计对于一组观测值(xi,yi)(i1,2,n),利用最小二乘法可得到回归系数.设01212,1,2,0,iiiinyxinED 且相互独立5 5记 最小二乘法就是选择0和1的估计、,使得 记niiiniixyQQ12101210),(01),(min),(10,1010QQ11,nixxn11niyyn6 6则有,)(12nixxxxS)()(1yyxxSinixy011xyxxyxSS7 7 直线为数据点(xi,yi)(i1

3、,2,n)的回归直线(方程),对于给出的x,可由此方程对y进行预测.01yx8 82.2的无偏估计的无偏估计一元线性回归模型中的参数2的无偏估计值为:由数据点xi(i1,2,n)可计算因变量y的理论值,观测数据yi(i1,2,n)对数据均值 的偏差可表示为:2121022)(Snxyniii,10iixyyyyi9 9 式(8.1.1)的第一项是残差,表示随机误差引起的因变量的变化;第二项表示自变量在xxi时引起的因变量相对于平均值的变化.对式(8.1.1)两边平方并求和,有:222111()()()(8.1.2)nnniiiiiiiyyyyyy10 10式(8.1.2)记为SQU,称S为总偏

4、差平方和,Q为残差平方和,U为回归平方和.定义,称为决定系数,R称为相关系数(0R2F1(1,n2)时,拒绝H0,否则就接受H0.(1,2)2UFFnQn14 142)t检验法当H0成立时,故时,拒绝H0,否则就接受H0.1(2)xxSTt n)2(21ntT15 155.预测预测用y0的回归值作为y0的预测值,y0的置信水平为1的预测区间为.其中,特别地,当n很大且x0在附近取值时,y的置信水平为1的预测区间近似为:0100 xy0000(),()yxyxxxSxxnntx2021011)2()(1122,yuyu16 16 例例1 血压与年龄问题:为了研究血压随年龄的增长而升高的关系,调查

5、了30个成年人的血压(收缩压,单位mmHg)如下表,利用这些数据给出血压与年龄的关系,并预测不同年龄人群的血压.17 17解解 记血压(因变量)为y,年龄(自变量)为x,画出30个数据点的散点图.直观地,y与x大致呈线性关系,记为y01x.利用一元线性回归模型,由MATLAB计算出结果如下:血压随年龄的变化关系为y96.860.953x,决定系数为0.7123,显示血压与年龄有较强的线性关系.利用上述回归方程,可预测不同年龄人群的血压规律,如表8-1所示.18 18表表 8-119 19由表8-1的预测可知,对于50岁的人来说,我们有95%的把握认为其血压(收缩压)在区间124.5,163.2

6、.2020若与因变量y有关联的自变量不止一个,则可建立多元线性回归模型.设影响变量y的主要因素有m个,记为x(x1,x2,xm),则y01x12x2mxm(8.2.1)8.2 多元线性回归模型多元线性回归模型21 21 根据n个独立观测数据yi,xi1,xim(i1,2,n;nm),得 记101 112 121101122.(8.2.2)mmnnnmnmnyxxxyxxx11111.1.mnnmxxXxx2222则式(8.2.2)可表示为矩阵形式YX,利用最小二乘法准则可确定参数,其参数为:并称为回归平面方程,为经验回归系数.1(,),TnyyY1(,)Tn 1(,)Tn YXXXT1T)(0

7、1 1mmyxx2323多元线性回归模型讨论的主要问题是:用试验值(样本值)对未知参数和2作点估计和假设检验,从而建立y与x1,x2,xm之间的数量关系;在x1x01,x2x02,xmx0m处对y的值作预测与控制,即对y作区间估计.24241.多元线性回归中的检验多元线性回归中的检验首先假设H0:01n0.1)F检验当H0成立时,其中,(回归平方和);(残差平方和)./(,1)/(1)eU mFF k nmQnmniiyyU12niiieyyQ12)(2525如果FF1(k,nm1),则拒绝H0,认为y与x1,x2,xm之间显著地有线性关系;否则就接受H0,认为y与x1,x2,xm之间的线性关

8、系不显著.26262)R检验定义为y与x1,x2,xm的多元相关系数或复相关系数.由于故用F和用R检验是等效的.eyyQUULUR2211RRmmnF27272.多元线性回归中的预测多元线性回归中的预测1)点预测求出回归方程,对于给定自变量的值,用来预测y*01x*1mx*m.称为y*的点预测.*y01 1mmyxx*1,mxx*01 1mmyxx28282)区间估计y的1的预测区间(置信区间)为,其中),(21yy11/20021/2001T1 (1)1 (1)(),mmeijijijmmeijijijijyyc x xtnmyyc x xtnmCLcLX X2929 例例1 城市公交客运量

9、的回归预测问题.据相关分析,城市公共交通年客运量y与城市职工人数x1、居民零售额x2、职工年收入x3统计相关.现有北京市19681980年的统计数据如表8-2所示,试对2000年该市的城市公交客运量做出预测.3030 表表 8-231 31续表3232解 建立多元线性回归模型,由MATLAB计算回归方程为,表明公共交通年客运量y与城市职工人数x1、居民零售额x2、职工年收入x3具有很高的线性关联性.根据有关规划,2000年该城市职工人数x14.5(百万人),居民零售额x215.0(10亿元),职工年收入x35.7(10亿元),则预测北京市公共交通年客运量y58.067(亿次).32158.32

10、87.2678.0305.0 xxxy20.9916URS3333在客观现象中,预报量y与自变量x之间存在的关系式往往不是线性的.我们可依据假设或经验,构造特定的函数如多项式、指数函数、三角函数等描述其关系,但其参数的确定和检验目前还无统一方法.下面以Y与x具有多项式关系为例加以说明.8.3 非线性回归模型非线性回归模型3434设变量x,Y多项式关系的回归模型为:Y01x2x2pxp其中p是已知的,i(i1,2,p)是未知参数,服从正态分布N(0,2).则Y01x2x2kxk称为回归多项式.若令xixi(i1,2,k),则多项式回归模型可变为多元线性回归模型.3535例例1 药物疗效的评价与预

11、测问题.现在得到了美国艾滋病医疗试验机构ACTG公布的两组数据.ACTG320(见建模竞赛题2006)是同时服用zidovudine(齐多夫定)、lamivudine(拉美夫定)和indinavir(茚地那韦)3种药物的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量).利用给定的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗).3636解解 数据的完善与规范化:由于病人测试的时间间断性,不同病人的测试间隔、次数不同,以及部分数据缺失,无法对样本数据进行直接处理,需先对数据进行完善与规范化预

12、处理.先对个别缺失数据严重(测试不足30周)的样本进行删除,最终得到有效样本333个.考虑到病人体内HIV和CD4两个指标变化的连续性,利用已测周数据对未知周数据进行线性插值,得到所有病人整数周的两个指标数据.3737(1)线性插值方法:如果在不相邻的两周M1和M2内,测量得到CD4的含量为C1和C2,HIV的含量为H1和H2,则在M1和M2之间插入M2M1个周的数据,即在M1N(0NM2M1)周的CD4含量为:21121CD4()CCNCNMM3838 以23424编号的病员为例,原始数据如下:3939经插值后的改进数据为:4040 (2)数据处理方法:对区间0,40整数节点的CD4和HIV

13、指标数据进行简单求和平均,得到该疗法治疗后CD4指标和HIV指标的统计规律如下:41 414242 CD4的含量随时间(周)的变化曲线如图8-1所示.图8-1中的曲线是对图中的散点进行一个拟合,得出的病人体内CD4的平均含量Y随周t变化的二次函数为:22()0.12746.637598.1450.8018Y tttR 4343图 8-14444 参数和其置信区间如下表:4545 根据以上分析可以得出CD4的平均含量的大致走向是在023周以前是较快上升,显示疗效确切;在2324周左右达到一个峰值,在2428周之间有个小的波动,之后有个缓慢的上升期,在38周达到一个最大值,但以后却急剧地下降,药品

14、产生耐药性.由此确定:如果以CD4指标为标准,24周为最佳的停药时间.类似可处理HIV的指标数据,得到HIV的含量随时间(周)的变化曲线如图8-2所示.4646图 8-24747图8-2中的曲线是对图中的散点进行一个拟合,得出的病人体内HIV的平均含量Z随周t变化的二次函数为:Z(t)4.1442t20.1217t0.0025 参数和置信区间如下表:4848根据以上分析可以得出HIV的平均含量的大致走向是在010周以前是急剧下降的,显示疗效确切,在1040周左右基本持平,显示疗效持续,大概25周有个较小的波谷,在40周以后急剧上升,显示耐药性增加,该药品治疗失效.由此确定:如果以HIV指标为标准,则24周为最佳的停药时间.综合考虑HIV和CD4两个指标:考虑CD4/HIV的比值随时间(周)的变化,得变化曲线如图8-3所示.4949图 8-35050上图中的曲线是对图中的散点进行一个拟合,得出的病人体内CD4/HIV的平均含量W随周t变化的二次函数为:函数的参数和其置信区间如下表:220.0864.346929.0130.8584WttR

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|