1、一个互 联网保险公司全 新业务模式面临 的挑战投保和 理赔 全 面线上化,更 加 驾考保险便捷,但是风控挑战增大宠物保险 传 统的大数定律在定价和 风控医疗美 容 保险上 ,有很大局限 需要从传 统线下的事后 风控, 转为线上 的实时风控我们需要人工 智能来 帮助应对挑战应该像这样, 游弋在 人工 智能海洋 问其实 是这样去 开 始星辰 大海问初创公司,怎样从0到1, 建立人工 智能应用初创阶段, 没有成熟 商业模式, 没有团 队, 没有技术架构.到现在 , 机器学习模块已经 集成到核心业务流程中 ,包括线上 的投保、核保流程以及风控. 成为核心业务流程中 必不可少的环节.过程中 要面对的问题
2、:要适应快 速的商业模式变 化数据缺失资源/人才的短缺抛砖引玉 : 一个线上 实时核保模型的实 际案 例一 提出问题二实战经 历 CONTENTS三四更 多案 例总结& 感悟一、提出问题这是一个二 分类问题“ ,基于对风险的判断”模型响应时间必须在毫秒量级二 、实战经 历1、前提条件 -基础设施1、前提条件 数据、数据、数据有用的数据 对数据的理解 面对的问题:没有全 周期数据, 如何估算风险(驾考保)1、数据 分布问题: 没有历史 赔 付数据 假设: 驾考未 通过事件 , 属于伯努利实 验(独立、无记忆) 二 项式分布 应用中 心极限定理基于真实 数据的分布2、建模 - 以驾考保险为例: 对
3、候选特征进行相 关 性校验 - 相 关 系数特征工 程,归 一化处理 P值检验 选择特征2、建模 -算法 选择 二 分类算法 逻辑回归 , LR 决 策数, DT 支 持向量机, SVM 深度学习 对应实 际问题, 根据不同算法 优缺点 进行选择有条件 的, 分别用不同的算法 进行建模/优化,再对比效果2、建模 - 模型训练过去 一年 实 际业务数据监督学习70%训练数据, 30%测试数据实 际运用, 需要考虑数据“成熟度”2、建模 - 模型评估AUC/ROC - 准与确2、建模 - 模型评估混淆矩阵 - Confusion Matrix Confused adj. 迷惑 准确率 , accu
4、racy预测安 全 , 真实 发生 理赔预测有风险, 真的发生 理赔(type II error, 漏掉)精确率 , Precision 灵敏度 , sensitivity/recall FPR FNR预测有风险, 其实 没有理赔 预测安 全 , 实 际也没有理赔(type I error,冤枉 )2、建模 - 模型评估(真实 案例)混淆矩阵可视化评估经 验分享2、建模 - 实 践中 的模型选择/ -/ - 2、建模 逻辑回归 (LR) 2、建模 - 逻辑回归 (LR)12算法 : 广义线性 模型逻辑回归算法模型表 达公式:P(驾考不通过风险)=3、模型线上 部署- 实 际案 例#5#1#3实
5、时决定承保或拒保在 主流程抓取 保单信息检索外部黑 名 单#2#4#6检索内部黑 名单AI 模型进行风险判断 返回主流程3、模型线上 部署- 实 际案 例OpenScoring PMML模型REST web服务简单易用的REST API支 持模型发布/更 新/查看/删除,单条/批量/csv预测。高 性 能毫秒级响应,线程安 全安 全可拓展用户身份认证 和授权以及监控指标3、模型线上 部署- 实 际案 例1 /- /- 52 ,4、部署后 - 持续优化模型性 能一般会 随时间推移而下降数据分布会 改 变更 多的数据 更好的模型业务逻辑对复合 模型的要求三 、更 多案 例1、宠物保险宠物保宠物个险
6、应用分类器体识 别图形 识别宠物保险 -业务需求通过存档 和 比对猫、狗照片,判断是否 同一个体目标判断准确性 达85%, 精确性明确80%同一个体必须是轻量级应用, 不依赖额外硬件 支 持对宠物识别的技术探索尝试使用开源项目OpenCV, 进行开 发对宠物识别的技术探索能够在 照片中 分辨出猫脸,但是不能辨别个体. 不能完全满足要求对宠物识别的技术探索 继续迭代,加入图片预处理,图片模糊比对 取 得较大进展 ,在测试集合 中 取 得90%准确性再加入一层 机器学习模型把前期输出作 为模型特征,进一步提高 准确性和 灵 活 性宠物识别服务PIDS (Pet Identify Service)宠
7、物主 人, 通过量子保APP或小程序对被投保宠物拍照.1宠物照片及相 关 信息(包括宠物和 主 人身份信息) 通过APP/小程序上传 到量子保服务器234发起理赔 :由宠物医院通过量子保APP/小程序拍摄宠物照片 + 主 人照片(可选,人脸识别) +医院二维码及其它信息, 发送到量子保接入量子保智能宠物识别服务PIDS,自动判别是申请理赔宠物否 被投保宠物. 实时理赔或拒赔科技让保险更有温AI宠物识 别技术芯片植入宠物个体个体原图档 案 库 智能比对昂贵复杂机器学习模型判断目标宠物2、智能核赔减少7 0 %人工 核赔成本与风控系统无缝集成减少8 5 %核赔 工 作 量95%准确率/FNR是关 键/最小化type IIerror四 、总结&感悟总结上 线部模型训练& 评估提出问署& 应用数据准备题结合 实 际案 例最大限度利用云 资高 度集成数据类职能源, 减少大数据基础业务数据库设施运维人员和 开发投入 数据仓库 大数据 BI/数据挖掘(自助式) AI建模人才永远稀缺 必须有能力目标明确. 明白先做什自己培 养 , 在 项目中 磨练么, 后 做什么THANKS