1、旅旅 游游 大大 数数 据据 采采 集集 及及 分分 析析 项项 目目T o u r i s md a t aa c q u i s i t i o na n da n a l y s i sp r o j e c t全维度,开启旅游大数据时代游行前行前行中行中行中行中行中行中行后行后行后行后思维的改变思维的改变Biga data海量游客数据游客统计数据关联创造价值关联创造价值数据与数据关联数据与数据关联 线上与线下关联线上与线下关联 需求与行动关联需求与行动关联 产品与区域关联产品与区域关联7全面的游客信息洞察、行为跟踪10合作伙伴:百度合作伙伴:百度413百度在游客行为跟踪领域领先行业线上
2、社交行为数据14移动端下载APP行为数据线上购物行为数据每日每日60亿次定位数据亿次定位数据其他20多个产品线数据百度既拥有大数据也具备大数据分析能力拥有大数据拥有大数据具备大数据能力具备大数据能力银行电信保险OracleIBMSAPBAIDUGoogle AmazonSplunkSalesforce传统企业软件厂商互联网厂商传统企业PrincelineQunar业跨界创新企合作、渗透、创新 创新升级 学习Microsoft强弱弱强15百度在数据采集和应用方面经验丰富数据能力应用互联网移动互联网Internet of Everything可穿戴设备摄像头图片信息化交易记录行为记录地理信息语音图
3、像设备状态BigtableHadoopDeepLearning图像识别语音识别大规模分布式存储与计算自然语言理解知识发现Machine Learning搜索翻译广告预测智慧城市公共安全 智慧生活智慧家庭新医疗新教育个性化推荐智能制造新商业文字8数据服务:旅游预测城市旅游热度预测城市旅游热度预测旅旅游游预测预测 助力出游助力出游景点拥挤度预测景点拥挤度预测17数据服务:游客人群属性分布游客地域分布游客地域分布热热力图力图黄金眼黄金眼游客人群属性分析,优化经营策略游客属性:兴趣、职游客属性:兴趣、职业业、年年龄龄段段分分布布等等精确到地级市精确到地级市线下广告线下广告18数据服务:景点游客分布数据
4、服务区选址服务区选址 景区规划景区规划 道道路修建路修建节目演出时间节目演出时间减少拥挤减少拥挤利于生态保护利于生态保护3.5W游客游客珙桐:珙桐:4000人人3W游客游客景点游客分布数据景点游客分布数据高效整合资源,优化景区设施高效整合资源,优化景区设施19中智游在数据领域的合作伙伴国内数据合作伙伴国内数据合作伙伴国外数据合作伙伴国外数据合作伙伴百度谷歌同程GFK中青旅CNBC去哪儿中国国家旅游局南方航空集奥(GEO)26需求分析需求分析大数据时代大数据时代 大数据的行业价值大数据的行业价值 数据研究潜力数据研究潜力27随着互联网和数据时代的融合发展,游客行为数据分析领域迎来了发展高峰。据大
5、数据中心统计,游客每 次出行都要经过35-55次的互联网检索,游客行为数据被全程记录。互联网旅游大数据,从市场(游客、投资)角度真实的诠释了其行为轨迹,所以对旅游大数据的研究和分析,对区域旅游组织开展相关工作具 有极高的指导价值。在消费者洞察,游客行为分析,品牌竞争力分析,营销策略与评估方面,能够给出最 为精确的建议和指导。旅游大数据洞旅游大数据洞察察14大数据的行业价大数据的行业价值值15科技推动,游客行为数据海量积累百度搜索百度搜索“中秋节中秋节 去哪里玩去哪里玩”。浏览去哪网,选择浏览去哪网,选择目的地目的地在蚂蜂窝浏览青岛在蚂蜂窝浏览青岛 旅游攻略。旅游攻略。在百度搜索在百度搜索“青岛
6、旅游青岛旅游 必去的景点必去的景点”。在去哪儿网订购来在去哪儿网订购来 回机票。回机票。在艺龙网预订奇青在艺龙网预订奇青 岛酒店。岛酒店。踏上中秋旅游的飞踏上中秋旅游的飞 机,飞机,飞往往青岛青岛游游玩。玩。STARTEND结束旅行,回到温结束旅行,回到温 暖的家中。暖的家中。行为数据、搜索数据、产品交易行为数据、搜索数据、产品交易 数据等类型数据,清晰描绘游客数据等类型数据,清晰描绘游客 出行全过程。出行全过程。30比“游客”更了解“游客”自由行用户自由行用户性别性别 均衡均衡文化程度较高文化程度较高年龄年龄 20-35岁岁收入收入5000到到10000乐 于 网 络 分乐 于 网 络 分
7、享、偏 好享、偏 好 摄摄 影、户外影、户外都市小白领都市小白领小清新、文艺范、小清新、文艺范、热热爱新鲜事物爱新鲜事物跟团游用户跟团游用户女性女性 稍多稍多有家庭有家庭 有子女有子女年龄年龄 30-50岁岁收入收入3000到到8000多以家庭为多以家庭为 单位出行、单位出行、三四线城三四线城 市居多市居多稳健安逸、喜欢购稳健安逸、喜欢购 物、物、注重生活质量注重生活质量31旅游大数据研旅游大数据研究究的潜的潜力力18大数据报告开启大数据时代充分了解游客充分了解游客通过适当的方法和科技 技术汇聚和分析数据,并且从中获取游客洞察,并且使用这些洞察力来 重塑对游客体验。开启游开启游客客新互新互动动
8、纪元:纪元:游客行为报告 旅游市场开发报告 媒体传播方案 旅游大数据体系构建提供个性服务提供个性服务利用对游客的了解,为 游客提供个性化的服务;满足不同类型游客出行 过程中的不同诉求,并 创造市场价值。智能的旅游服务:智能的旅游服务:APP智能服务 派送礼物与惊喜 提供个性化游览体验产业决策支持产业决策支持检测产业运行状态,推 动产业布局调整,产品 创新,市场研究等综合 策略,针对市场变化与 优化提供策略指导。数据指导规划:数据指导规划:产业运行数据检测 旅游产品创新方案33服务方案服务方案数据方案数据方案 研究方法研究方法.研究报告研究报告.数据接口服务数据接口服务34数据方案数据方案 总体
9、思路 数据源 采集模式 定位技术21总体思路:多元整合、关联分析、价值可视理论 应用分析 方法、清过理滤、整筛理选旅游统计数据交通数据运营商数据OTA数据酒店数据旅行社数据百度LBS数据综合媒体数据垂直媒体数据搜索数据网站数据社交网络数据移动应用数据其他网络数据及其他社会化网络数据及其他社会化数据数据数据源:数据源:大数据来源大数据来源国国内内入入 境境大数据大数据 服务平台服务平台整合多渠道的数据类型,结合传统数据和新兴媒体数据形成大数据服务平台模型,经过数据清理、过滤、筛选和整理,开展分析环节,结合多重分析方法以理论为基础,全面分析国内和入境旅游。可视化数据报告可视化数据报告旅游宏观经济数
10、据旅游游客信息数据 旅游客源地数据 游客消费行为数据多元整合多元整合36数据来源:多维数据来源搜索引擎搜索引擎新媒体和移动数据新媒体和移动数据旅游局及公开数据旅游局及公开数据垂直旅游垂直旅游国内国内入境入境37多元数据来源,关联旅游不同价值点 数据来源渠道以 互联网和移动互 联网技术为主。例如搜索引擎、LBS、社交媒体 等;以旅游局和 社会公开数据为补充渠道。垂直旅游垂直旅游新媒体和移动新媒体和移动 以往数据记录以往数据记录 旅游局和社会公开数据旅游局和社会公开数据 游客体验、评价和消费游客体验、评价和消费 旅游信息、交易和预订旅游信息、交易和预订来源、行为路径、到达来源、行为路径、到达方方式
11、式百百度度LBS和和GFK游游客基本信息、基本诉求客基本信息、基本诉求 搜索引擎搜索引擎38核心数据提供商百度1000多台机器同时处 理数据能力基于海量数据建立的分析模型每日每日60亿亿次游客定位数据次游客定位数据39线上线下对应,建立一对一的数据分析UE码码Cookies信息信息账户信息账户信息搜索倾向搜索倾向媒体倾向媒体倾向行为分析行为分析位置信息位置信息行为路径行为路径停留时间停留时间利用利用LBS游客定位信息,打通线上线下各游客定位信息,打通线上线下各环环节,节,分分析每析每位位进入进入游游客互客互联联网诉网诉求求40采集方案:四种途径进行数据采集百百度度LBS百度大搜百度大搜游游 客
12、客 行行 为为游游 客客 位位 置置游游 客客 属属 性性游游 客客 活活 动动 点点游游 客客 兴兴 趣趣媒媒 体体 接接 触触目目 的的 地地 诉诉 求求预预 订订 方方 式式到到 达达 方方 式式GFK机机 票票邮邮 轮轮旅旅 游游 产产 品品酒酒 店店国内国内入境入境调研调研旅旅 游游 收收 入入游游 客客 兴兴 趣趣游游 客客 属属 性性游游 客客 信信 息息来来 皖皖 原原 因因消消 费费数据采集方式采用新型互联网和物数据采集方式采用新型互联网和物联联技术技术结结合传合传统统调研调研方方式进式进行行。41数据采集技术:百度LBS跟踪识别游客地理位置百度地图定位SDK是利用设备当前的
13、GPS信息(GPS定位),基站信息(基站定位)和Wi-Fi信息(Wi-Fi定位)完成定位的。百度地图Android定位SDK提供GPS,基站,Wi-Fi等多种定位方式,适用于室、内外多种定位场景,具有出色的定位性能:定位精度高、覆盖率广、网络定位请求流量小、定位速度快。反地理编码功能反地理编码功能42混合定位混合定位借助GPS、基站、Wi-Fi和传感器信息,实现高精度的混合定位服务。提供把当前所处地点的位置坐标转换为地理围栏地理围栏地理围栏服务提供基于位置的提醒服务,可实详细地址描述信息的能力,支持省,市,现当用户进入、离开或处在开发者设定的某个基于游客应用需求,实现跨终 端定位锁定。区县的结
14、构化地址描述。精确定位游客所处省域、城市、街道、建筑等坐标。虚拟地理区域时,可自动接收相关提醒。实现游客移动位置的连续性跟踪。数据采集技术:百度大搜,提供游客需求分析Spider是百度搜索引擎的一个自动程序。它的作用是访问互联网上的html网页(当然动态页面 也可以抓取),建立索引数据库,使用户能在百度搜索引擎中搜索到您网站的网页、图片、视频等内容。中国是全球仅有的4个拥有搜索引擎核心技术的国家之一,而百度搜索引擎是开创者和领先者。蜘 蛛互联网互联网蜘蛛控制蜘蛛控制网络蜘蛛网络蜘蛛URL数据库数据库URL提取提取链接信息提取链接信息提取文本索引文本索引网页数据库网页数据库索引数据库索引数据库链
15、接数据库链接数据库网页评级网页评级查询服务器查询服务器用户用户43数据采集技术:综合数据采集平台平台全渠道消费者预订轨迹与消费者固定样组(提供更全面的行为、态度与属性信息)融合Civil Aviation AuthorityOperatorsTravel AgentsAirlines&LCCOTACruiseHotelLive channel forward bookings实时预订信息实时预订信息来来源源及及渠道渠道3rd party data sources&market extrapolation市场推总市场推总 第三方数据第三方数据Consumer Insights消费者洞察消费者洞察
16、AOG flight databasePassenger Shipping AssociationFinancial ReportsIPSdataExpertise Segments细分领域细分领域Package包团包团Cruise游轮游轮Accomodation住宿住宿Flight航空航空Ancillary其他配套其他配套44数据采集方式:综合调研数据采集对象确定研究目的确定数据采集类型设计调查方案确定信息获得方法设计数据获得工具设计抽样方案,确定样本辨别信息类型及可能来源现场实施-数据收集大数据平台录入现场实施-数据初步审核数据复核界定阶段界定阶段设计阶段设计阶段实施阶段实施阶段数据整理阶
17、段数据整理阶段调研采集方式:调研采集方式:个别访谈个别访谈集体访谈集体访谈文献法文献法试点调查法试点调查法(线上线下)问卷调查法(线上线下)问卷调查法45研究方法研究方法 数据运算模型 竞争力评估模型 常用分析方法 参考案例32旅游行业数据特征影响旅游人数的因素影响旅游人数的因素A景点B景点历史旅游人数历史旅游人数整体水平整体水平趋势性趋势性季节性季节性(周期性周期性)辅助因素辅助因素or天气天气节假日节假日 事件事件47数据运算模型各种因素各种因素旅游人数旅游人数t N 0,Rt t N 0,Qt yt Ct xt txt At xt 1 tx5信息收集信息收集y5基于大规模机器学习的时间序
18、列预测模型 状态空间模型(SSG)1数据准备数据准备2模型参数训练模型参数训练34 预预 测测重重 复复 3448区域综合竞争力评估Image 形象形象49Product 产品产品Culture 文化文化Channel 渠道渠道Contribution 贡献贡献Experience 体验体验形象:目的地形象推广及管理上优势和不足 产品:核心旅游产品的交易量以及诉求程度文化:主要文化资源的游客认同与诉求程度 渠道:区域在线旅游产品数量及交易情况 贡献:旅游经济文化在区域内的贡献体验:游客满意度反馈及旅游服务评估IPCE区域旅游综合竞争力评估区域旅游综合竞争力评估常用分析方法:数值分析法省域旅省域
19、旅游品游品牌牌 关键词设定关键词设定类别类别关键字关键字样本量样本量系数系数省域名称成都10.3品牌口号好玩四川11.5核心产品武侯祠等101要素产品火锅50.3OTA数据旅游产品52对比对比 区域区域杭州广州厦门桂林三亚将旅游品牌进行数字化解读,研究将旅游品牌进行数字化解读,研究各各类数类数据据指标指标的的表现表现,形成形成综综合评合评估估;50常用分析方法:回归分析法回归分析法是在掌握大回归分析法是在掌握大量量观察观察数数据的据的基基础上,础上,利用数理统计方法建立利用数理统计方法建立因因变量变量与与自变自变量量之间之间的的 回归关系函数表达式。回归关系函数表达式。函数公式函数公式y=a+
20、bx b=xynxy/x²n(x)²a=ybx/n回归分析回归分析,解决不同两解决不同两个个旅游旅游要要素的素的关关联性联性关关系;系;如如天气天气与与游客游客,消费消费力力与客与客源源属性属性等等;51常用分析方法:雷达图分析法“雷达图雷达图”分析法是旅分析法是旅游游局对局对各各方面方面核核心数心数 据据(游客数据、消费理(游客数据、消费理数数据、据、核核心产心产品品消费消费 情况情况等)和市场现状进等)和市场现状进行行直观直观、形象形象的的综合综合 分析与分析与评价的图形。评价的图形。风景秀丽52森林氧吧空气清新古代穿越感动心灵文化遗迹美食小吃70.0%其他60.0%避暑
21、胜地50.0%40.0%无印象30.0%轻松自在20.0%10.0%0.0%常用分析方法:趋势分析法趋势图也叫走向图。它趋势图也叫走向图。它用用来显来显示示一定一定时时间间间间隔隔(例(例如如一天一天、一周一周或或一个一个月月)内)内所所得到得到的的测量测量结结果。果。以以测测得的数量为纵轴,以时得的数量为纵轴,以时间间为横为横轴轴绘成绘成图图形。形。趋势图分析法,有利于快趋势图分析法,有利于快 速了解旅游经济和人数等速了解旅游经济和人数等 随时间的变化趋势,同时随时间的变化趋势,同时 结合事件可以可以判断某结合事件可以可以判断某 个区间内的影响力变化。个区间内的影响力变化。53常用分析法:矩
22、阵图分析法矩阵图法就是从多维问矩阵图法就是从多维问题题的事的事件件中,中,找找出成出成对对的因的因素素,排,排列列成矩成矩阵阵图,图,然然后根后根据据矩阵矩阵图图来分来分析析问问 题,确定题,确定关键点的方法。关键点的方法。54矩阵图分析是一种通过矩阵图分析是一种通过多多因素因素综综合思合思考考,探探索问题的好方法从问索问题的好方法从问题题事项事项中中,找,找出出成成 对的对的因素群,分别排列因素群,分别排列成成行和行和列列,找,找出出其其 间行与间行与列的相关性或相列的相关性或相关关程度程度的的大小大小的的一一 种方法。种方法。参考案例参考案例41典型案例:福建福建省旅游营销专福建省旅游营销
23、专项项规规划划旅游营销专项规划是福建省旅游产业 发展体系的重要组成部分,方案以大 数据分析为依据,在市场分析、竞品 分析、游客分析和目的地旅游竞争力 等方面进行深度的分析,数据来自百 度和旅游局信息化平台,以营销为战 略手段,全面推动福建旅游的全面提 速和转型升级。5643摘自福建省旅游营销专项规划44摘自福建省旅游营销专项规划45摘自福建省旅游营销专项规划研究报告研究报告 报告编制方法 工作深度及大纲 数据可视化46不只是数据报告,更是一份旅游发不只是数据报告,更是一份旅游发展展的策的策略略建议建议47报告编制方法撰写、修正科学分析报告基本流程大众传播学统计学、社会学互联网技术新闻报道以及相
24、关数据评论以及观点受众反馈 数据整合 数据保存 整合观点 统计参数分析概述动态分析国内分析入境分析市场分析游客分析客源地分析提出观点制作图表撰写报告支撑理论&数据提交报告62技术路线63可视化呈现:热力图69可视化呈现:同类数据对比用户决策路径分析竞品分析普陀山观世音菩萨-求子求平安九华山大愿菩萨-求去病身体健康峨眉山普贤菩萨-求能力五台山 文殊菩萨-求聪明智慧70可视化呈现:客源地描绘71可视化呈现:动态客源路径72可视化呈现:多维数据呈现方式根据数据类型和要分析根据数据类型和要分析的的结论结论选选择:择:柏拉图、直方图、散点柏拉图、直方图、散点图图、相、相关关分析分析、回归回归分分析、析、
25、点点图、图、柱柱状图状图、雷达雷达图图、趋、趋势势图等图等分分析方析方法法;73可视化呈现:柱状图分析柱形图用于显示一段时间内(某个属性)的数据变化或显示各项之间的比较情况。柱形图用于显示一段时间内(某个属性)的数据变化或显示各项之间的比较情况柱形图也就是条形统计图。74数据接口服务数据接口服务 数据对接方案 核心区域热力图 实时网络诉求指数对比 实时游客进入数据 实时客源地分析数据56数据对接方案海量用户数据存储海量用户数据存储您无须服务器,只需通过API接口或可视化数据管 理器完成海量数据存储76海量用户数据检索海量用户数据检索|通过本地、周边、矩形检索方法可检索自有数据,且支持自定义字段
26、作为检索条件及POI详情检索。地图展示地图展示用户检索数据可同步展示在PC、移动设备(Android、iOS)端,且海量数据可使用麻点图展示。LBS云云APIWeb服服API 静静态图态图API全景静态图全景静态图API 车车 联联 网网 API URIAPI鹰眼鹰眼API开放接口为旅游局智开放接口为旅游局智 慧化提供更多服务慧化提供更多服务技术架构图分布式工作流引擎分布式工作流引擎旅游数据旅游数据 采集系统采集系统配置配置 管理管理综综 合合 数数 据据 管管 理理 系系 统统关系数据库集群关系数据库集群数据服务系统数据服务系统服务交付服务交付 框框架架分布式总线分布式总线分布式实时数据库分
27、布式实时数据库分布式文件系统分布式文件系统服务管理服务管理 系统系统API负负 载载 均均 衡衡前前 端端 服服 务务 器器交交 付付 管管 理理数据分析系统数据分析系统分布式计算模型分布式计算模型数据数据过滤过滤数据数据 预处预处 理理数据存储系统数据存储系统数据访问数据访问 服务服务业务逻辑业务逻辑 服务服务77实时游客检索数据对接诉求指数诉求指数数据描述数据描述纵向对比:两年内平均值2059,处于对比样本中的第三位第三位;2013年数据较2012年数据趋势无明显增长趋势无明显增长趋势,基本保持不变;横向对比:城市诉求指数随节庆变化特征与其他城市相比不明显;不明显;暑期、节庆前暑期、节庆前
28、是互联网用户进行搜索的高峰期,节庆当天或在旅途中,搜索行为放缓,对城市的诉求明显回落;数据洞察:城市诉求指数偏低,与其他城市存在差距,可提升空间较大提升空间较大;缺少部分在节庆、暑期等重要节点前期的营销重要节点前期的营销措施以引起关注;夏季更多人们倾向于海边、度假等目的地;6月份-8月底(暑期)是城市指数表现较长的时间,游客出行频率很高;暑期清明五一五一清明国庆国庆实时提供,每日旅游城市诉求指数,并建立城市对实时提供,每日旅游城市诉求指数,并建立城市对比比成都 2059 青岛 3712 丽江 1810 香港 253480实时游客数据统计实时提供,每日各时段进入的游客数实时提供,每日各时段进入的游客数据据81实时游客客源地属性统计实时分析,进入游客的客源地属实时分析,进入游客的客源地属性性8262