1、机器学习驱动的产品开发和优化谢梁首席数据科学家Microsoft Power BI摘要亮点问题背景传统方法基于数据挖掘的方法经验总结亮点机器学习辅助产品特性开发产品特性群落差异化定价完整的数据支持基于机器学习的洞察力超越简单汇总的方法数量分析框架客户群落和产品特性交互的综合考虑持续迭代这个课题的重要性a)产品特性的开发依赖于有效的成本/收益分析b)产品经理目前使用的数量分析框架随意性较强,并且过度简化c)我们的方法提供了一个由目的到策略再到支持数据的平滑过渡 1)多维度2)一致性3)挖掘模式4)持续迭代产品特性开发产品特性的规划和开发有一整套结构化的分析框架和流程 规划和开发流程1.定义主题2
2、.在主题范围内确定可用资源3.基于结果不停迭代 标准数量分析框架 Kano 模型 QFD模型Kano 模型产品特性被归纳为4大类:1.有吸引力的 2.标准但是未期待的3.标准并且期待的4.必备特性质量功能展开(QFD)模型将客户需求转变为产品设计规格的外生性数量方法将重要的产品特性纳入价值体系并赋予可以量化的值,便于客观的比较不同的特性并决定开发侧重点实际上这个量化体系是个主观系统现有数量分析框架的共性明确对现有和/或待开发特性进行聚类隐含的对现有客户群落和市场进行聚类隐含的需要现有用户行为数据来进行定量In app telemetryNPS焦点组其他渠道的客户意见问题背景a)市场后来者,10
3、0万月活用户 KPIb)产品经理需要一个可执行的,有效的产品策略来实现这个KPIc)需要解决的基本问题1.什么特性最受欢迎?2.潜在的用户群落是怎么组成的?3.有没有常用特性群落?4.产品特性群落如何和用户群落结合?d)用户行为信息为制定产品策略提供了基础端到端案例分析 Case Analysis业务目标:月活客户数达到100万衍生策略:开源:客户获取节流:客户留存分析:收集数据 构造基于用户和产品交互特性的分析框架 基于以上框架的持续跟踪和迭代数据是一切的基础 高覆盖度 高保真度 高颗粒度机器学习的作用对高维复杂数据的洞察力 不是简单汇总数据的分析 连接不同接触点的数据 以用户为中心在分析的
4、基础上,构造一个业务策略 分析师的分析目的必须要和业务目标一致 切记为了展现技术而分析 给产品经理提供可以执行的建议客户足迹客户从哪里来(渠道)?什么产品特性受欢迎?什么产品特性被一起用?付费客户和非付费客户的产品特性使用比率?机器学习算法构造用户和产品群落目的:将数十万用户和数百个产品功能归纳为少量一致性较高的群落方便管理 将用户和产品特性/功能有机联系起来方法 1:对于每个客户,收集在不同产品特性上的使用汇总信息 构造【客户-产品特性】的二维矩阵 客户群落和产品特性群落进行双向聚类方法 2:在上述方法的基础上加入时间信息 构造【客户-产品特性-时间】的多维矩阵 将财务数据联系起来 基于典型
5、相关分析和高斯混合模型算法用于客户群落聚类方法 1:对两个维度进行双向聚类挖掘:共用产品特性相似行为的客户群落借用 TFIDF 算法处理数据结果符合常识有新的发现方法 2:使用典型相关分析将多维收费信息与用户行为有机关联起来对客户使用高斯混合模型进行软聚类,构造用户群落产品特性使用差异一目了然持续迭代前面的分析提供了给定时间的分析框架持续迭代需要跟踪不同用户群落的动态转换构造马尔科夫转换概率矩阵利用动态和静态特征对转换概率矩阵建模动态:用户行为静态:用户渠道成效确定主题快速高效地得到需要重点发展的客户群落和对应的产品特性客户的行为和费用贡献成为客户留存的打分标准数量分析的科学基础高度灵活的框架可以容纳多种类型的信息高度动态的系统经验和收获团队认可业务导向的目标统一产品经理和工程组的目标讲故事的能力选择合适的方法没有放之四海皆准的方法从不同领域借鉴方法会有很好的效果适合的可视化只显示关键信息简约和信息含量高的平衡提问?