1、大数据预测分析:技术、模型与应用SAP Predictive AnalyticsSAP Predictive Analytics智智能能预预测测分析分析平平台台自动化自动化 简单化简单化 普及化普及化 人人会用的大数据人人会用的大数据自动模型自动模型针对业务用户,不用编程数据挖掘工作可以轻松完成数据管理数据管理/自动建模自动建模/模模型型管理管理专家模型专家模型针对专业用户,可以通过R语言创建定制的算法(支持R语言加密)R语言集成语言集成/可视化可视化与与分享分享故事故事为所有角色业务分析师或数据科学家提供预测分析的服务IOT大数大数据据平台原生类库支持平台原生类库支持完全库内运算,无需传输数
2、据支持50万以上的变量HANA PAL/APLNative Spark Modeling流处理语言流处理语言(CCL)支支持持应用场景广泛应用场景广泛客户细分,交叉销售,营销提升,客户流失率分析,预测性维护,良品率零售零售/消费品消费品/电信电信/高高科科技技/离离散制散制造造/ 金融服务金融服务/公共公共部门部门/公公用用事业事业2大数据科学家大数据科学家 学习路线图学习路线图DBA/BI童鞋们已掌握的技能树PA能帮助大家快速点亮的技能树3预测分析世界中的自动预测分析世界中的自动档档:SAP Predictive Analytics如何保证自动模型的准如何保证自动模型的准确确度?度?SRM原
3、则如何选择最佳模型?原则如何选择最佳模型?测试模型 已知数据 新数据5高准确高准确/低稳定低稳定(低训练误差/高测试误差)低准确低准确/高稳定高稳定(高训练误差 = 高测试误差)最佳模型最佳模型(低训练误差 低测试误差)学习误差模型复杂度模型复杂度最佳模型检验误差如何保证自动模型的准如何保证自动模型的准确确度?度?SRM原则如何选择最佳模型?原则如何选择最佳模型?准确性准确性(KI):模型对现有数据的解释能力怎样?模型对现有数据的解释能力怎样?通过最小化误差获得通过最小化误差获得稳定性稳定性(KR):现有模型对将来事件的预测能力。现有模型对将来事件的预测能力。减小不稳定性减小不稳定性风险风险S
4、AP PA不问算法不问算法 只问场景只问场景时序 分析关联规则社交 网络聚类 分析销量预测分类 回归客户分群微商营销影响路径供货配比 商品陈 列PA自动选择自动选择 最佳算法最佳算法相关性分析商品促销预测预测性性维护维护(Predictive Maintenance)预测性维护技术,旨在帮助确定处在使用中的设备的状况,并预测何时进行维修行为。以集团视角多维度按时以集团视角多维度按时间间勘查勘查计计划外划外运运维产维产生生的材的材料料费费用用业务人员以集团视角可明确发现保养厂:M8 保养科:M810 生产厂:86的非计划维护产生的材料费用最突出图形下钻针图形下钻针对对M8M81086厂厂按按时间
5、时间维维度对度对各各种异种异常常原原因的勘查因的勘查 发现主要原因是:发现主要原因是:预期预期磨磨耗或耗或老老化化继续继续下下探到具体设备,探到具体设备,因因预期预期磨磨耗或耗或老老化产化产生生的维的维修修材材料料金金额额前四台设备产生的维修材料金额占M8M81086厂一半以上乙烯二段压缩机:2B-306乙烯增压压缩机:2B-415乙烯增压压缩机:1B-303乙烯二段压缩机:1B-302SAP预测分析0500April 11, 2012April 12, 2012April 13, 2012April 14, 2012eng temp oil pres CO2关联分析利用分析工具找到设备严重预
6、警信息,进行故障预测 Trouble code基于设备传感器数据运基于设备传感器数据运行行SAP高高级预级预测测分分析析机械可用性分析和故障预测设备数据设备数据Engine tempOil pressureRPMCO2Defect codesSpeedEtc.自动分类模自动分类模型型显示故障显示故障相相关变关变量量贡献贡献预测故障的原因分析预测故障的原因分析SAP预测性维护预测性维护预测性维护预测性维护为设备制造商和运营商提供显著的商业价值提高服务盈利能力较低的服务成本和新的收入流更高的故障分辨率 较高的首诊修复率 客户的满意度和忠诚更高的服务合同续签率 启用新的创新的商业模式较高的整体设备效
7、率?(资产可用性和性能及品质)提高维修效率降低维护成本报警和故障更快反应更高故障之间的平均时间 较低的平均修复时间设备制造商设备制造商设备运营商设备运营商 2016 SAP SE or an SAP affiliate company. All rights reserved.Public18预测模型产能预测模型产能指数指数级级上上升升部署时间部署时间6-8 周周模型数量模型数量1几天几天1几小时几小时创建数据集创建数据集创建模型创建模型EDW传统方式传统方式ModelerEDWEDWData Manager自动建模自动建模批量建模批量建模模型生产力提模型生产力提升升Demo某集团大数据科学家
8、团队基于历史订单数据, 使用R语言创建回归模型预测季末销量,协助 销售经理及时调整销售策略模型准确率应保证在90%-95%面临挑战:1. 相关课题按品类需要创建几百个模型2. SAP PA自动建模,模型管理是否可以帮助到大数据科学家?3. SAP只有5天时间去证明!里程里程碑碑1:回回归归模型模型数据学习范围:2011-07-31/2014-03-15数据校验范围:2014-03-16/2015-01-251. 模型在模型在203个变量中个变量中自动保留自动保留5个变量个变量2. 发现大数据科学家团队发现大数据科学家团队原模型中包含两个可原模型中包含两个可疑疑变量变量里程里程碑碑1:测试数据预
9、测测试数据预测结结果(果(回回归模归模型型)平均误差3.8%中位数误差 3.1%里程里程碑碑2:自动创自动创建建400+模型模型几乎不用任何额外工作即创建并部几乎不用任何额外工作即创建并部署署400+模型模型1. 导出模型脚本导出模型脚本2. 调整参数生成模型调整参数生成模型里程里程碑碑3:模型管理器自模型管理器自动动管管理理400+模型模型依据新数据是否存在偏差设置模型应用规则SAP 预测分预测分析析 全程参全程参与与 企业数字化转型企业数字化转型客户客户全渠道营销体验员员工工 参与度大数大数据据与物联网供应供应商商协作业务网络数字数字化核心化核心在数字化核心的基础上将整个 价值链数字化作为业务创新与 最佳化平台数字化企业连接各个价值链以 实时推动和预测业务成果各行业中的企业都可通过完全 重构商业模式、业务流程与工 作引领数字化转型。SAP Predictive AnalyticsSAP Predictive AnalyticsSAP Predictive AnalyticsSAP PredictiveAnalyticsSAP Predictive Analytics 2016 SAP SE or an SAP affiliate company. All rights reserved.Public25企业数字化转型,从预测分析开始!