1、人工智能行业应用人工智能行业应用Fintech规则流程驱动到智能数据驱动2017/10/22机器的角色,从快速思维到智能思维FinTechITIT DTDT在过去的几十年里,计算机被广泛用于完成自动化任务,后 者往往是被清晰的规则和算法描述的。如今,机器学习技术 允许我们在难以精确描述规则的边界内完成同样的任务。来源自亚马逊创始人杰夫贝索斯(Jeff Bezos)2017年度致股东的公开信。350年前,科学巨人牛顿用三个简约表达式,揭示了自然规律,客观抽象了传统参照系中的世界。某互金理财产品的营销获客传播的复杂网络某保险公司的代理人成功销售的获客网络如何描述棋风,大局观?人工智能依靠质朴的数学
2、和超强的计算能力,还原了世界的复杂性。深度学习的特征建立过程,就是协助我们对复杂问题描述的精确量化。如何用RGB像素色差等信号 体系描述图片内容?如何制订动态防范的欺诈规则?笛卡尔为之后的牛顿准备了一个坐标系,使F=ma的推演成为经典。年份年份人工智能的突破人工智能的突破年份年份数据集(首次可用)数据集(首次可用)年份年份算法(首次提出)算法(首次提出)1994人类自发的语音识别19911991华尔街日报文章与其他文本19841983隐马尔可夫模型1997IBM深蓝打败Garry Kasparov70万国际象棋大师赛,又称“扩 展 的 书 主变量搜索算法(Negascout算 法)2005谷歌
3、阿拉伯语中文英语翻译软 件20051.8万亿符号的搜索,基千谷歌网 站与新闻网页1988统计机器翻译算法2011IBM Watson机器人成为世界“危 险 节目冠军20102010860万文件的上传,基千维基百 科,维基词典引用以及古登堡计 划1991集合训练算法20142015GoogleNet在IlSVRC达到人类同 等水平150万标签的图片1000项目分类的 视觉数据库1989卷积神经网络算法谷歌deepmind游戏水平达到与人 类同等水平2013超过50种超高难度雅达利游戏的 学习环境数据集1992Qlearning算法平均突破年限:平均突破年限:3 3 年年1818 年年数据湖数据融
4、合方案数据湖-元数据管理l 我要的数据有哪些?l 我要的数据在哪里?数据表数据表数据表数据表数据表数据表数据表数据表数据表数据表 文件文件文件文件文件文件数据表数据表数据源数据源数据源数据源。数据库/表/字段 存放目录/文件名如果要把所有的数据的元数据定义 全部梳理出来,知道元数据的含义,将会面临巨大的工作量。面临数千甚至数万的元数据信息的治理n为每一张表和每一个字段赋予标签含义,通过标签索引相关字段,未来通过标签检 索,敏捷定位到所需字段项以及字段数据。融资融资贸易融资融资租赁票据融资将数千张表字段构建关联起来,形成网 络关联图谱,探查元数据逻辑联系,实 现对数据结构的透彻了解和灵活掌控。备
5、注通过分析银行信用卡的“通过信用卡”信息和“欺诈信用卡”信 息,找到注册信息中包含的关系,同时对关系信息统计分析,计 算相关指标,然后通过统计分析的结果构建社交网络,最终支撑 欺诈用户发现。申请进件的关联特征基础金融属性年龄年收入学历职位区域职业第三方信用卡。深度学习网络客户数据 清洗处理相关特征 抽取BDCN构建社交网 络MaximAI平台建模建模结果 分析结合业务 落地实施客户基本申请信息 客户社交属性信息抽取一阶度、一阶欺诈比等特征AUC/KS等评估模型准确性数据转换 社交特征抽取随机森林 梯度提升 深度学习串联模式结合原有审批流程原始 特征年龄年收入学历(数值化)职位(数值化)手机号单
6、位电话电子邮箱建立复杂网络网络 特征一阶度,一阶欺诈 数,一阶欺诈比二阶度,二阶欺诈 数,二阶欺诈比最短路径(距离欺 诈节点)0.700.93仅使用申请人 原始基础信息 的AUC值加入网络特征 属性后的AUC 值(2订平平名 矿 白 气J、晶3 2 10=-妇代,一阳呵圈攫-l 圈令 个 人 廿 3 嘎 伽-咖 i,雇,.重,梯度提升逻辑回归传统的行为评分模型主要使用逻辑回归模型使用梯度提升模型能提升模型的性能客户数据 清洗处理相关特征 抽取MaximAI特征选择MaximAI平台建模建模结果 分析结合业务 落地实施客户静态申请信息 客户动态行为信息静态属性信息 动态属性信息AUC/KS等评估
7、模型准确性数据转换随机森林 梯度提升 深度学习调额 风险监控0.860.91使用逻辑回归 模型的AUC值使用梯度提升 模型的AUC值原始无变换特征:客户基本属性 原始行为数据 变换行为数据 人行信息数据模型:l 梯度提升梯度提升l 随机森林l 深度学习分类:优质、恶意客户客户大数据分析行为 习惯风险评分历史 还款消费 信息大数据处理平台分期 化解分类名单、话术库、拨打 接触策略友好提醒保持客户 满意度,客户不同 情况下拨打策略后台行方 业务系统数据平台结合客户反馈、真实识别拨打实 况(未接、挂断、客户按键)引导客户按键确 认,识别及办理。拨打接触业务规则拨打 规则营收 策略友好 提醒多轮 施压
8、催收外呼 接入平台IVR自动 催收模块拨打结果 数据话术 策略各业务系统风险一体化决策系统模型孵化审批催收开放系统客服系统其他决策V+TRAID PRM主机系统数据统一事件处理事件记录、跟踪、预警策略处理指令事件及处理策略 定义事件 决策处理策略TRAID 策略实时、批量数据交互传输批量事件通知指令通知指令通知策略 更新策略更新信 用 卡 生 命 周 期 管 理MaximAI平台B D C N 平台BD R T人行 信息核心系 统账户 数据审批 信息账单 信息催收 情况贷中 数据进件 信息MaximAI分 布式人工智 能平台在线 数据算法 科学计算 能力融合计算能力:从并行计算到分布式计算的创
9、新Scala分布式程序的算法代码重构,充分发挥SPARC/Alluxia内存计算能力。融合在线数据:从流程驱动到数据驱动的创新数据无需在生产系统和挖掘系统间抽取离线,实时的全量数据建模融合业务价值:从零到一的创新从业务问题定义到前沿算法模型反复迭代,最终体现商业价值化的模型,可以在平台中 发布、分享和继承。业务创新可以规模化复 制。融合融合Algorithm BigdataCloudMaximAI企业级人工智能平台产品向导服务订阅服务精致产业FreeCoding采用完全界面化的操作 用户无需任何编程背景,也 可轻松使用数据挖掘技术Subscripution通过REST接口整合、订阅算 法包和数据分析模版面向高阶用户,自主编写 Spark Scala,R,Python代码轻AI的前沿算法民主化MaximAI企业级人工智能平台产品(续)开放平台应用开发通讯科技巨头专利科技移动互联网前夜