1、 大数数据的营销营销案例 大数数据如何实实施 我们们的大数数据一一、未卜先知怀孕案例、未卜先知怀孕案例塔吉特:比父亲更早知道女儿怀孕塔吉特:比父亲更早知道女儿怀孕曾经有一位男性顾客到一家塔吉特超市店中投诉,商店竟然给他还曾经有一位男性顾客到一家塔吉特超市店中投诉,商店竟然给他还在读书的女儿寄婴儿用品的优惠券。这家全美第二大零售商,会搞在读书的女儿寄婴儿用品的优惠券。这家全美第二大零售商,会搞出如此大的乌龙?但经过这位父亲与女儿进一步沟通,才发现自己出如此大的乌龙?但经过这位父亲与女儿进一步沟通,才发现自己女儿真的已经怀孕了。女儿真的已经怀孕了。提问:提问:为什么塔吉特能知道这个用户怀孕了?必须
2、有哪几个关键环节为什么塔吉特能知道这个用户怀孕了?必须有哪几个关键环节A:用户数据收集:用户数据收集 B:怀孕特征库:怀孕特征库 C:怀孕潜在用户筛选:怀孕潜在用户筛选 塔吉特在和顾客沟通过程中采用了哪种营销方式塔吉特在和顾客沟通过程中采用了哪种营销方式A:电子邮件:电子邮件 B:直邮:直邮 C:电话营销:电话营销 D:数据库营销:数据库营销一一、未卜先知怀孕案例、未卜先知怀孕案例关键环节一:数据信息记录关键环节一:数据信息记录一家零售商是如何比一位女孩的亲生父亲更早得知其怀孕消息的呢?每位一家零售商是如何比一位女孩的亲生父亲更早得知其怀孕消息的呢?每位顾客初次到塔吉特刷卡消费时,都会获得一组
3、顾客识别编号,内含顾客姓顾客初次到塔吉特刷卡消费时,都会获得一组顾客识别编号,内含顾客姓名、信用卡卡号及电子邮件等个人资料。日后凡是顾客在塔吉特消费,计名、信用卡卡号及电子邮件等个人资料。日后凡是顾客在塔吉特消费,计算机系统就会自动记录消费内容、时间等信息。再加上从其他管道取得的算机系统就会自动记录消费内容、时间等信息。再加上从其他管道取得的统计资料,塔吉特便能形成一个庞大数据库,运用于分析顾客喜好与需求。统计资料,塔吉特便能形成一个庞大数据库,运用于分析顾客喜好与需求。每个每个ID号还会对号入座的记录下你的人口统计信息:年龄、是否已婚、是号还会对号入座的记录下你的人口统计信息:年龄、是否已婚
4、、是否有子女、所住市区、住址离否有子女、所住市区、住址离Target的车程、薪水情况、最近是否搬过家、的车程、薪水情况、最近是否搬过家、钱包里的信用卡情况、常访问的网址等等。钱包里的信用卡情况、常访问的网址等等。Target还可以从其他相关机构还可以从其他相关机构那里购买你的其他信息:种族、就业史、喜欢读的杂志、破产记录、婚姻那里购买你的其他信息:种族、就业史、喜欢读的杂志、破产记录、婚姻史、购房记录、求学记录、阅读习惯等等。乍一看,你会觉得这些数据毫史、购房记录、求学记录、阅读习惯等等。乍一看,你会觉得这些数据毫无意义,但在无意义,但在Andrew Pole和顾客数据分析部的手里,这些看似无
5、用的数和顾客数据分析部的手里,这些看似无用的数据便爆发了前述强劲的威力据便爆发了前述强劲的威力一一、未卜先知怀孕案例、未卜先知怀孕案例关键环节二:数据模型建立关键环节二:数据模型建立Andrew Pole想到了想到了Target有一个迎婴聚会有一个迎婴聚会(baby shower)的登记表。的登记表。Andrew Pole开始对这些登记表里的顾客的消费数据进行建模分析,不久就开始对这些登记表里的顾客的消费数据进行建模分析,不久就发现了许多非常有用的数据模式。比如模型发现,许多孕妇在第发现了许多非常有用的数据模式。比如模型发现,许多孕妇在第2个妊娠期个妊娠期的开始会买许多大包装的无香味护手霜的开
6、始会买许多大包装的无香味护手霜;在怀孕的最初在怀孕的最初20周大量购买补充钙、周大量购买补充钙、镁、锌的善存片之类的保健品。最后镁、锌的善存片之类的保健品。最后Andrew Pole选出了选出了25种典型商品的消种典型商品的消费数据构建了费数据构建了“怀孕预测指数怀孕预测指数”,通过这个指数,通过这个指数,Target能够在很小的误差能够在很小的误差范围内预测到顾客的怀孕情况,因此范围内预测到顾客的怀孕情况,因此Target就能早早地把孕妇优惠广告寄发就能早早地把孕妇优惠广告寄发给顾客。给顾客。一一、未卜先知怀孕案例、未卜先知怀孕案例关键环节三:建立和用户沟通渠道关键环节三:建立和用户沟通渠道
7、那么,顾客收到这样的广告会不会吓坏了呢?那么,顾客收到这样的广告会不会吓坏了呢?Target很聪明地避免了这很聪明地避免了这种情况,它把孕妇用品的优惠广告夹杂在其他一大堆与怀孕不相关的商品优种情况,它把孕妇用品的优惠广告夹杂在其他一大堆与怀孕不相关的商品优惠广告当中,这样顾客就不知道惠广告当中,这样顾客就不知道Target知道她怀孕了知道她怀孕了一一、未卜先知怀孕案例、未卜先知怀孕案例Target取得的成就:取得的成就:根据根据Andrew Pole的大数据模型的大数据模型,Target制订了全新的广告营销方案,制订了全新的广告营销方案,结果结果Target的孕期用品销售呈现了爆炸性的增长。的
8、孕期用品销售呈现了爆炸性的增长。Andrew Pole的大数据分的大数据分析技术析技术从孕妇这个细分顾客群开始向其他各种细分客户群推广从孕妇这个细分顾客群开始向其他各种细分客户群推广,从,从Andrew Pole加入加入Target的的2002年到年到2010年间,年间,Target的销售额从的销售额从440亿美元增长亿美元增长到了到了670亿美元。亿美元。二、美国警察降低犯罪案例二、美国警察降低犯罪案例纽约的犯罪凶杀从纽约的犯罪凶杀从1994年年1561起下降到起下降到1177起起车辆盗窃从车辆盗窃从95420下降到下降到72679起起到到2009年,凶杀案下降到年,凶杀案下降到466起起二
9、、美国警察降低犯罪案例二、美国警察降低犯罪案例CompStat项目的工作人员每天通过电话和传真向全纽约项目的工作人员每天通过电话和传真向全纽约76个警区个警区收集数据,再将数据统一录入到收集数据,再将数据统一录入到CompStat,进行加总和分析。,进行加总和分析。每周二、周四的早晨每周二、周四的早晨7点,布雷特就召集全部警区的指挥官开会。点,布雷特就召集全部警区的指挥官开会。最新发生的案件以圆点的形式出现在各个辖区的地图上,不同颜色最新发生的案件以圆点的形式出现在各个辖区的地图上,不同颜色代表着不同类型的犯罪,特定位置的成串圆点则表明那里发生了一代表着不同类型的犯罪,特定位置的成串圆点则表明
10、那里发生了一系列的案件。各个指挥官在这些系列的案件。各个指挥官在这些“绩效指示灯绩效指示灯”前面依次陈述自己前面依次陈述自己辖区的情况、对策以及警力的调配辖区的情况、对策以及警力的调配“数据和信息是执法工作当中制定战略和决策的基数据和信息是执法工作当中制定战略和决策的基础。础。”1、决策支持系统、决策支持系统 1947年,美国科学家年,美国科学家 西蒙提出,西蒙提出,1978年因为商务决策过程的研究获得诺贝尔经年因为商务决策过程的研究获得诺贝尔经济学奖济学奖2、商务智能、商务智能 利用数据仓库、数据挖掘技术对客户数据进行系统地储存和管理,并通过各种数利用数据仓库、数据挖掘技术对客户数据进行系统
11、地储存和管理,并通过各种数据统计分析工具对客户数据进行分析,提供各种分析报告,如客户价值评价、客户满据统计分析工具对客户数据进行分析,提供各种分析报告,如客户价值评价、客户满意度评价、服务质量评价、营销效果评价、未来市场需求等,为企业的各种经营活动意度评价、服务质量评价、营销效果评价、未来市场需求等,为企业的各种经营活动提供决策信息。提供决策信息。3、大数据时代、大数据时代 标志着一个时代的来临,一个概念,而不是真正的技术标志着一个时代的来临,一个概念,而不是真正的技术 大数据大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目,或称巨量资料,指的是所涉及的资料量
12、规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。策更积极目的的资讯。大约从大约从2009年开始,年开始,“大数据大数据”才成为互联网信息技术行业的流行词汇。才成为互联网信息技术行业的流行词汇。从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起被称为从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起被称为“大数据大数据”。一、数据输入到输出的基本流程一、数据输入到输出的基本流程二、决策支持系统二、决策支持系统三、商务智能是什么三、商务
13、智能是什么 人们对商务智能的理解如同那七个印度盲人对大象的理解:人们对商务智能的理解如同那七个印度盲人对大象的理解:有人认为它是有人认为它是高级管理人员信息系统(高级管理人员信息系统(EIS),),有人认为它是有人认为它是管理管理信息系统(信息系统(MIS),),有人认为它是有人认为它是决策支持系统(决策支持系统(DSS);有人说有人说它是数据库技术,有人说它是它是数据库技术,有人说它是数据仓库数据仓库,有人说它是,有人说它是数据集市数据集市,有,有人说它是人说它是数据整合与清洗工具数据整合与清洗工具,有人说它是查询和报告工具,有人,有人说它是查询和报告工具,有人说它是在线分析处理工具,有人说
14、它是数据挖掘,有人说它是统计说它是在线分析处理工具,有人说它是数据挖掘,有人说它是统计分析;有人把它当做分析性分析;有人把它当做分析性ERP,有人把它当做分析性有人把它当做分析性CRM,有人有人把它当做分析性把它当做分析性SCM,有人把它当做企业绩效管理,有人把它当作有人把它当做企业绩效管理,有人把它当作平衡记分卡平衡记分卡 商业智能技术,它以数据仓库(商业智能技术,它以数据仓库(Data Warehousing)、在线)、在线分析处理(分析处理(OLAP)、数据挖掘()、数据挖掘(Data Mining)3种技术的整合为种技术的整合为基础,建立企业数据中心和业务分析模型,以提高企业获取经营分
15、基础,建立企业数据中心和业务分析模型,以提高企业获取经营分析信息的能力,从而提高企业经营和决策的质量与速度。析信息的能力,从而提高企业经营和决策的质量与速度。三、商务智能四个产业链三、商务智能四个产业链1、关系型数据库、关系型数据库(销售记录、用户购买记录,提供报表)(销售记录、用户购买记录,提供报表)2、数据仓库、数据仓库(数据系统整合,收集,清洗)(数据系统整合,收集,清洗)3、多维分析、多维分析 (不同维度之间的剖析,自定义)(不同维度之间的剖析,自定义)4、数据挖掘、数据挖掘 (灵魂,产生价值的地方)(灵魂,产生价值的地方)5、展示:可视化界面、展示:可视化界面商业智能技术体系(商业智
16、能技术体系(BIBusiness Intelligence)在线分析处理技术在线分析处理技术(OLAP:数据挖掘技术数据挖掘技术(Data Mining)数据仓库技术数据仓库技术(Data Warehousing)数据整合数据整合集成各系统的历史集成各系统的历史数据,建立面向主数据,建立面向主题的企业数据中心题的企业数据中心数据分析数据分析灵活、动态、快速灵活、动态、快速的多维分析、随机的多维分析、随机查询、即席报表查询、即席报表知识发现知识发现通过数学模型发现通过数学模型发现隐藏的、潜在的规隐藏的、潜在的规律,以辅助决策律,以辅助决策更加全面、深入的分析更加全面、深入的分析形成知识库指导决策
17、、再分析形成知识库指导决策、再分析三、商务智能体系三、商务智能体系四、关系型数据库四、关系型数据库关系型数据库就是由二维表及其之间的联系组成的一个数据组关系型数据库就是由二维表及其之间的联系组成的一个数据组织,关系数据库中的数据结构就是一张二维表,以表格(关系)织,关系数据库中的数据结构就是一张二维表,以表格(关系)的形式存放数据的形式存放数据典型的商业订单条目数据库会包括一个用列表示的描述一个客典型的商业订单条目数据库会包括一个用列表示的描述一个客户信息的表格:名字、住址、电话号码,等等。户信息的表格:名字、住址、电话号码,等等。另外的一个表另外的一个表格会描述一个订单:产品、客户、日期、销
18、售价格,等等格会描述一个订单:产品、客户、日期、销售价格,等等报表:是关系型数据库时代将数据转化为信息的主要手段报表:是关系型数据库时代将数据转化为信息的主要手段但是报表是需要事先由开发人员定制的但是报表是需要事先由开发人员定制的比如:比如:2013年年5月份的废单报表月份的废单报表五、数据仓库五、数据仓库我们可以从多个我们可以从多个菜市场,挑选我菜市场,挑选我们做需要的蔬菜,们做需要的蔬菜,肉类等。当然,肉类等。当然,我们处在一个选我们处在一个选择的过程。如果择的过程。如果菜不新鲜,我们菜不新鲜,我们完全可以不要它完全可以不要它.六、多维分析六、多维分析 OALP什么叫多维:什么叫多维:沃尔
19、玛沃尔玛2011年年在在北京的销量北京的销量是多少是多少?这就是地区和时间两个这就是地区和时间两个维度交叉维度交叉百度投放:在百度投放:在2013年年5月份广东产生多少个口语计划的注册?月份广东产生多少个口语计划的注册?其惊艳之美在于其惊艳之美在于 可以根据用户自己的需要随时创建万维动态可以根据用户自己的需要随时创建万维动态报表,报表的定制权由后台开发人员直接转移到前端的用户报表,报表的定制权由后台开发人员直接转移到前端的用户其代表:国双的动态分析其代表:国双的动态分析普通钻取是改变维的层次,包括上卷(普通钻取是改变维的层次,包括上卷(roll up)与)与下钻(下钻(drill down)。
20、上卷是从维的细节层向颗粒)。上卷是从维的细节层向颗粒较大高层钻取,以便宏观把握数据的汇总情况;下较大高层钻取,以便宏观把握数据的汇总情况;下钻是从维的高层向颗粒较小的细节层钻取,以便观钻是从维的高层向颗粒较小的细节层钻取,以便观察数据明细情况。察数据明细情况。举例来说:某电信运营商在分析举例来说:某电信运营商在分析2003年总体话务量年总体话务量时发现全年话务量为时发现全年话务量为100亿分钟,这除了说明全年的亿分钟,这除了说明全年的总体话务量情况,不能说明任何问题。现在分析人总体话务量情况,不能说明任何问题。现在分析人员想进一步了解员想进一步了解2003年各个月份的话务量情况,就年各个月份的
21、话务量情况,就必须针对时间维度进行下钻操作,以看到颗粒较细必须针对时间维度进行下钻操作,以看到颗粒较细的月份数据。反之就必须进行上卷钻取。的月份数据。反之就必须进行上卷钻取。六、多维分析六、多维分析普通钻取普通钻取穿透钻取是指从一个模型钻透到另一个模型。穿透钻取是指从一个模型钻透到另一个模型。举例来说:某电信运营商发现本月通话时长下降举例来说:某电信运营商发现本月通话时长下降5%,经过下钻发现是,经过下钻发现是IP的本月通话时长下降了的本月通话时长下降了20%带带动了整个通话时长下降动了整个通话时长下降3%,为了找到,为了找到IP的通话时长的通话时长下降的具体原因就需要钻取到面向下降的具体原因
22、就需要钻取到面向IP业务的分析主业务的分析主题,详尽分析通话时长下降原因。这种跨越模型的题,详尽分析通话时长下降原因。这种跨越模型的钻取就称为穿透钻取。钻取就称为穿透钻取。举例:网络营销部广告投放这个月的注册比上个月举例:网络营销部广告投放这个月的注册比上个月少了少了20%注册,通过下钻发现是腾讯比上个月下降注册,通过下钻发现是腾讯比上个月下降80%,为了找到腾讯的原因必须钻取到涉及到腾讯,为了找到腾讯的原因必须钻取到涉及到腾讯下降的其他原因(流量?页面转化率?)。下降的其他原因(流量?页面转化率?)。六、多维分析六、多维分析穿透钻取穿透钻取切片与切块是指选择某一切片与切块是指选择某一/些维度
23、的具体类别,分析些维度的具体类别,分析该类别的数据关于其他维的情况。该类别的数据关于其他维的情况。举例来说:某烟草公司分析发现举例来说:某烟草公司分析发现2012年全年烟草销年全年烟草销售为售为10亿元,现在想了解亿元,现在想了解2012年中华(软)这种规年中华(软)这种规格的卷烟在第一季度的销售情况,就必须针对时间格的卷烟在第一季度的销售情况,就必须针对时间维度选择第一季度,针对卷烟规格维度选择中华(维度选择第一季度,针对卷烟规格维度选择中华(软),通过这样的切块的方式可以观察相关维度的软),通过这样的切块的方式可以观察相关维度的具体类别(如本例中的中华(软)在第一季度)的具体类别(如本例中
24、的中华(软)在第一季度)的数据状况,分析这些数据得出有效的信息,以针对数据状况,分析这些数据得出有效的信息,以针对这些具体类别进行针对性的决策。这些具体类别进行针对性的决策。当仅针对一个维当仅针对一个维度进行切块时称为切片。度进行切块时称为切片。六、多维分析六、多维分析切片与切块切片与切块六、多维分析六、多维分析 OALP六、多维分析六、多维分析六、多维分析六、多维分析讨论:通过上图我们可以看到哪些维度的数据讨论:通过上图我们可以看到哪些维度的数据1、某月东北、某月东北 冰箱冰箱2、西北电器总和、西北电器总和3、6月西北产品销量月西北产品销量六、多维分析和数据仓库关系六、多维分析和数据仓库关系
25、七、数据挖掘七、数据挖掘描述性数据挖掘描述性数据挖掘预测性数据挖掘预测性数据挖掘n基本目标基本目标以数据统计和分析为目的以数据统计和分析为目的n数理统计数理统计求和、平均、方差等求和、平均、方差等各种报表和即席查询各种报表和即席查询多维分析多维分析n关联分析关联分析关联规则关联规则序列模式序列模式n聚类分析聚类分析相似特征挖掘相似特征挖掘分类识别分类识别n基本目标基本目标以未来预测和模拟为目的以未来预测和模拟为目的n分类分析分类分析分类函数分类函数分类模型分类模型n回归分析回归分析线性回归线性回归非线性回归非线性回归决策树决策树神经网络神经网络n时间序列时间序列移动平均移动平均数据挖掘数据挖掘
26、啤酒和尿布的故事啤酒和尿布的故事七、数据挖掘案例七、数据挖掘案例啤酒和尿布的故事啤酒和尿布的故事“啤酒与尿布啤酒与尿布”的故事产生于的故事产生于20世纪世纪90年代的美国沃尔玛超市中,沃尔年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,某些特定的情况下,“啤酒啤酒”与与“尿布尿布”两件看上去毫无关系的商品会两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现
27、,这种现象出现在年轻的父亲身上。意,经过后续调查发现,这种现象出现在年轻的父亲身上。当然当然“啤酒与尿布啤酒与尿布”的故事必须具有技术方面的支持。的故事必须具有技术方面的支持。1993年美国学者年美国学者Agrawal(个人翻译(个人翻译-艾格拉沃)提出通过分析购物篮中的商品集合,从艾格拉沃)提出通过分析购物篮中的商品集合,从而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客户的购买行为。艾格拉沃从数学及计算机算法角度提出了商品关联关系户的购买行为。艾格拉沃从数学及计算机算法角度提出了商品关联关系的计算方法的计算方法A
28、prior算法(关联模型)算法(关联模型)。沃尔玛从上个世纪。沃尔玛从上个世纪90年代尝年代尝试将试将A prior算法引入到算法引入到POS机数据分析中,并获得了成功,于是产生了机数据分析中,并获得了成功,于是产生了“啤酒与尿布啤酒与尿布”的故事的故事八、可视化界面八、可视化界面啤酒和尿布的故事啤酒和尿布的故事八、可视化界面八、可视化界面啤酒和尿布的故事啤酒和尿布的故事数据处理数据处理业务层:输出业务层:输出数据输入数据输入即时查询即时查询OLAPOLAP分析分析数据挖掘数据挖掘企业数据模型、多维数据模型企业数据模型、多维数据模型 数据数据仓库仓库RDBMSRDBMS:关:关系数据库系数据库
29、外部数据源外部数据源操作环境层操作环境层数据仓库层数据仓库层业务层业务层选择题:每题选择题:每题8分分*5 数据仓库是数据库吗?数据仓库是数据库吗?A:不是:不是 B:是:是商务智能里包含哪几个重要版块?商务智能里包含哪几个重要版块?A:OLAP B:数据仓库数据仓库 C:数据挖掘:数据挖掘大数据给企业带来的好处是?大数据给企业带来的好处是?A:了解用户隐私:了解用户隐私 B:提供决策支持:提供决策支持 C:营销针对性:营销针对性 D:提升效率:提升效率你认为下面哪些企业在大数据方面有潜力做的你认为下面哪些企业在大数据方面有潜力做的很很好,选好,选2个个A:阿里集团阿里集团 B:麦当劳:麦当劳 C:沃尔玛沃尔玛简答题:每题简答题:每题15分分*4假如假如2季度广东区域网络业绩很差,为什么?请写分析思路季度广东区域网络业绩很差,为什么?请写分析思路