1、AI在反作弊风控领域的应用技术创新,变革未来概述架构核心技术应用效果0102030401概述概述l贴 吧介 绍l应 用领 域人人吧吧3亿月活亿月活2200万兴趣社区万兴趣社区贴贴发贴数上千万发贴数上千万/日日图文直播视频关注私信发帖每日处理逾十亿作弊case,准确率99%+02架构架构l产 品 机 制 l平 台 架 构 l产 品 架 构产产品品&机制(预防机制(预防&打击打击&挽回挽回)特征对抗模型化打 特特击 征征&系系挽 统统回 体 系用 户 信 誉 体 系监 控&发 现&反 馈&评 估 体系防 攻 击 体 系处 理 系 统账 号 准 入 体 系精 准 识 别 系 统Anti防攻击防攻击
2、各层交互打通接入层防攻击接入层防攻击Service防攻击防攻击账号登录账号登录:账号准入账号准入(账号分级验证)(账号分级验证)准确率评估召回率评估打击&挽回服务服务&架架构构多媒体识别服务文本识别服务用户信誉体系机器人识别服务平台平台&组件组件特征平台业务平业务平台台训练平台审核平台回溯平台评估平台Debug监控平台数据平台粒度控制业务组业务组件件敏感词文本过滤文本替换重复串用户状态地域信息设备信息基础设基础设施施CacheHadoopoxp事前事前层层Confilter Actsctrl Captcha FdsMisLinker事后事后层层 Feature规则并 行与异步计算 Naf 规则
3、引擎 Unihandle 统一 处理体系监控与回溯监控与回溯层层 分布式策略回溯 Kibana实时监控数据层:HadoopMysqlRedisEs基础设施:ORPORCPOXP03核心技术核心技术l多 媒 体l图 片l文 本&用户帖子处理用户处理处理图片基础数据用 户文 本应用模型特征用户特征实物分类黄反模型OCR识别文本分类文本特征语料抽取语料筛选样本库MALE-TEXTONLY-TEXTQRCODE游戏-TEXT实物TEXTAPP-TEXT分类模型作弊形态多样化作弊形态多样化解决方案解决方案平均平均5张图片里就有张图片里就有1张作弊图张作弊图片片CNN网络大数据空间变换数据增强组合模型、领
4、域广形态多质量差界限模糊利用算法提高解决效率利用算法提高解决效率70%以上的作弊图片有文字语义信以上的作弊图片有文字语义信息息文字识别小视频网小视频网盘盘 色情电影色情电影国语日美欧国语日美欧韩韩V信信 SVX234语义识别作弊类型:色作弊类型:色情情难点难点1:文字识文字识别别背景、字体、亮度、角度、清晰度难点难点2:语义理语义理解解表达多样、语义不连贯、多语种微信、V信、+v、威幸、十我、R 云盘分享IDL通用文字识别:支持多语种混合图片文字效果自动增强CNNRNNWord embeddingMultiple model语义识别文字识别检测检测 数数据据用户内容基础基础 特特征征富媒体特富
5、媒体特征征文本特文本特征征用户行用户行为为精精 细细 化化 模模 型型推重复串色情模型广模型兼职模型 马甲模型盗号模型高级高级 模模型型DNN模模型型 集成模集成模型型用用户户变形识别嫌疑片段识别通用通用 处处理理文文本本资源资源 挖挖掘掘实体词类型词领域词输入输入 数数据据提交数据删除数据检举数据评估数据资资 源源 库库色情词敏感词模型生模型生成成高级模型精细化模型语料选语料选择择半监督主动学习 随机推广词热词/搭配04应用效果应用效果内容变形快 作弊类型多 账号成本低挑战重挑战重重重半自动资源更新 全自动上线流程 天级别模型升级快速应快速应对对百万级账号处理及保护 千万级文本及图片处理成果显成果显著著支持支持20余产品线余产品线手百、百家号 移动云、糯米 钱包、地图等三大专利三大专利九宫格验证码 滑动验证码 图片实例协同迭代反作弊算法,致力提升用户体协同迭代反作弊算法,致力提升用户体验验地图百家号钱包移动云阿拉丁旅游直达号糯米浏览器 手百图片口碑