ImageVerifierCode 换一换
格式:PPT , 页数:25 ,大小:2.07MB ,
文档编号:2928387      下载积分:22 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-2928387.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(机器学习之模型评估与模型选择课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

机器学习之模型评估与模型选择课件.ppt

1、机器学习的模型评估与选择泛化误差 vs 经验误差v泛化误差:在“未来”样本上的误差v经验误差:在训练集上的误差,亦称“训练误差”训练数据模型新样本数据新样本属于什么类别?过拟合 vs 欠拟合模型选择v三个关键问题:如何获得测试结果 评估方法如何评估性能优劣 性能度量如何判断实质差别 比较检验评估方法v关键:怎么获得“测试集”?原则:测试集与训练集“互斥”v常见方法:留出法(hold-out)交叉验证法(cross validation)自助法(bootstrap)留出法v保持数据分布一致性(例如:分层采样)v多次重复划分(例如:100次随机划分)v测试集不能太大、不能太小(例如:1/51/3)

2、K-折交叉验证法当K=m时,则得到“留一法”(leave-one-out, LOO)自助法v基于“自助采样”(bootstrap sampling)Pull up by your own bootstraps有放回采样、可重复采样训练集与原样本集同规模数据分布有所改变约有36.8%的样本不出现包外估计:out-of-bag estimation模型选择 三个关键问题: 如何获得测试结果 评估方法 如何评估性能优劣 性能度量 如何判断实质差别 比较检验性能度量v性能度量(performance measure)是衡量模型泛化能力的评价标准,反映了任务需求v使用不同的性能度量往往会导致不同的评判结

3、果v什么样的模型是“好”的,不仅取决于算法和数据,还取决于任务需求。性能度量v回归任务v分类任务错误率与精度查准率、查全率与F1回归模型评估有三种方法,分别是:平均绝对值误差、均方误差和R平方值(1)平均绝对误差(MAE)就是指预测值与真实值之间平均相差多大(2)均方误差是指参数估计值与参数真值之差平方的期望值,记为MSE。值越小,说明预测模型描述实验数据具有更好的精确度。(3)R平方值,表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值的拟合程度如何性能度量错误率与精度v错误率v精度E(f;D)=1mI(f(xi)yi)i=1macc(f;D)=1mI(f(xi)=yi)=1-E

4、(f;D)i=1m性能度量查准率与查全率v查准率:precision,准确率,P预测结果中是正例的比率v查全率:recall,sensitivity, 召回率, R所有的正例中被正确预测出的比列P=TPTP+FpR=TPTP+FNTrue Positive Rate, TPR, (Sensitivity)True Negative Rate, TNR, (Specificity)Positive Predictive Value, PPVFalse Positive Rate, FPRFalse Negative Rate, FNRFalse Discovery Rate, FDRPR图:学习

5、器A优于学习器C学习器B优于学习器C学习器A?学习器B平衡点 (BEP)(Break-Even Point, )学习器A优于学习器B学习器A优于学习器C学习器B优于学习器C性能度量F1度量性能度量ROC与AUChttps:/ Boosting个体学习器间不存在强依赖关系,可同时生成的并行化方法:Bagging and Random Forest集成学习随机森林 Bagging 策略 bootstrap aggregation 从样本集中重采样(有重复的)选出n个样本 在所有属性上,对这n个样本建立分类器(ID3、C4.5、CART、SVM、Logistic回归等) 重复以上两步m次,即获得了m个分类器 将数据放在这m个分类器上,最后根据这m个分类器的投票结果,决定数据属于哪一类 随机森林在bagging基础上做了修改。 从样本集中用Bootstrap采样选出n个样本; 从所有属性中随机选择k个属性,选择最佳分割属性作为节点建立CART决策树; 重复以上两步m次,即建立了m棵CART决策树 这m个CART形成随机森林,通过投票表决结果,决定数据属于哪一类投票机制 简单投票机制 一票否决(一致表决) 少数服从多数 有效多数(加权) 阈值表决 贝叶斯投票机制v但也可以使用SVM、Logistic回归等其他分类器,习惯上,这些分类器组成的“总分类器”,仍然叫做随机森林。

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|