1、1234CHAPTER 1智能投研发展背景及概述智能投研发展背景及概述CHAPTER 2智能投研行业现状智能投研行业现状CHAPTER 3基于另类数据的投研服务市场基于另类数据的投研服务市场CHAPTER 4智能投研的未来发展智能投研的未来发展1智能投研行业发展概述智能投研行业发展概述智能投研行业发展背景智能投研行业发展背景金融信息服务市场发展人工智能、大数据等科技发展智能投研概述智能投研概述智能投研概念与分类智能投研的工作流程智能投研的特点 中国资本市场持续国际化、机构化、专业化中国资本市场持续国际化、机构化、专业化MSCI新兴市场指数纳入222支A股深港通、沪港通陆续开通私募规模2015-
2、2017年增长243%至9.2万亿人民币发展背景发展背景中国金融信息服务行业发展落后于资本市场发展中国金融信息服务行业发展落后于资本市场发展 投资机构在研究过程中痛点加剧投资机构在研究过程中痛点加剧传统数据频率低、维度少、深度不够灰色信息不可持续、难以规模化传统调研样本少、偏差大中国, 11.4, 17%全球股权市场市值:全球股权市场市值:440亿万元人民币亿万元人民币其他国家, 55.6,83%语言和文化的隔阂无法挖掘另类数据的大部分价值全球金融信息市场规模:约全球金融信息市场规模:约2100亿元人民币亿元人民币中国, 101, 5%其他国家, 1999, 95%来源:XX金融创新研究院发展
3、背景发展背景欧美欧美欧美金融信息服务市场是一个多元化、精细化的市场生态。以Bloomberg、S&P Global和Thomson Reuters三家巨头主导。近年来,以“数据+智能”为切入点,数百家公司成功切入另类数据投研领域。中国中国相比之下,中国目前的金融信息服务主要以Wind、同花顺及东方财富网等传统信息服务商为主,行业深度和精细细化数据、另类数据投研等数据投研咨询商尚未形成规模市场。来源:百观,XX金融创新研究院欧美金融信息服务市场呈多元化、精细化;中国细分领域尚未形欧美金融信息服务市场呈多元化、精细化;中国细分领域尚未形成规模市场成规模市场 基础数据终端基础数据终端 行业和精细化数
4、据行业和精细化数据 另类数据另类数据/智能投研智能投研来源: XX金融创新研究院发展背景发展背景大数据和人工智能应用于金融信息与数据,推动智能投研发展大数据和人工智能应用于金融信息与数据,推动智能投研发展智能投研以智能数据分析及决策为主要应用领域,智能数据分析及决策则是大数据与人工智能发展的产物。大数据、云计算以及智能硬件的发展作为基础技术支撑了人工智能技术的发展,相关技术的运用成为投资智能业务开展的基础。infrastructure AnalyticsCross-ingrastructure/ analyticsApplication - EnterpriseApplication - In
5、dustryOpen sourceData source & APIsFinanceinvestingBig Data Landscape来源:XX金融创新研究AI+FinanceNaturallanguageProcessingMachineLearningKnowledgeGraphArtificial IntelligenceFinanceInvestingInformation智能投研的工作流程智能投研的工作流程与传统投研价值链类似,从数据及信息分析的流程来化划分,智能投研的工作流程分为识别、获取数据,存储、结构化、预处理数据,分析数据、涉及信号、策略回测,最后产出交易思路及信号、并进
6、行风险分析。来源:XX金融创新研究院识别、获取数据识别、获取数据存储、结构化、存储、结构化、预处理数据预处理数据交易思路交易思路/交易信号交易信号/风险分析风险分析分析数据、分析数据、设计信号、设计信号、策略回测策略回测、CSVAPIJSONStreamingTextHTMLApache SparkCloudSQLR语言/PythonSpark MLTableauExcel报告预警信号数据管理团队法律合规部门软件工程师数据科学家量化分析师产品经理交易员产品经理系统工程师数据工程师实现方法实现方法/技术手段技术手段参与团队参与团队工作流程工作流程来源:XX金融创新研究院智能投研特点智能投研特点强
7、大的情绪控制和逻辑推理能力强大的情绪控制和逻辑推理能力有价值的数据投资者投资者原始数据&噪音结构化流程:非主观结构化流程:非主观&强逻辑强逻辑数据清洗与储存数据清洗与储存通过数据结构化模块和存储运算集群等,对原始数据进行清洗,存储有价值数据。数据采集数据采集包括有价值数据和噪音。数据挖掘与分析数据挖掘与分析通过机器学习、图像识别、自然语言处理等,提供数据分析框架和回测模型。交易信号和风险分析交易信号和风险分析输出交易信号和客观的分析报告,为投资者提供无差别的投资意见。来源:XX金融创新研究院智能投研特点智能投研特点强大的自我学习能力强大的自我学习能力除了静态的财务逻辑数据,智能投研优势之一在于
8、实现跨公司、跨行业的动态数据关联。基于海量结构化及非结构化数据数据,通过知识图谱和深度学习能力,智能投研可以发现事件与事件之间的关联关系,并通过机器学习的自我学习能力,实现信息向决策的进一步转化。模型模型相关性相关性预测预测数据数据根据历史事件建立原始分析预测模型寻找事件和资产之间的相关性基于事件对资产未来价格走势进行预测产生的预测数据反馈回原有模型搜索与收集搜索与收集数据和知识提取数据和知识提取分析研究分析研究观点呈现观点呈现目的目的寻找行业、公司、产品的基本信息从搜索的信息中获取数据/知识通过工具和研究方法完成分析研究将分析结果呈现出来传统投研传统投研(传统工具)(传统工具)百度、谷歌、书
9、籍、论坛、交流等万得、彭博、新闻媒体等ExcelPPT、Word智能投研智能投研(AI技术支持)技术支持)智能咨询推送智能搜索引擎公告/新闻自动化摘要、产业链分析、智能财务模型事件因果分析、大数据统计分析报告自动化关键技术关键技术自然语言查询、词义联想、语义搜索、企业画像实体提取、段落提取、表格提取、关系提取、知识图谱知识图谱自然语言合成、可视化、自动排版来源:XX金融创新研究院智能投研特点智能投研特点速度化、速度化、 自动化、规模化自动化、规模化智能投研智能投研传统投研传统投研搜索与收集搜索与收集数据和知识提取数据和知识提取分析研究分析研究观点呈现观点呈现自动实现搜索到投资观点的一步跨越自动
10、实现搜索到投资观点的一步跨越2智能投研行业现状智能投研行业现状美国智能投研行业发展现状美国智能投研行业发展现状发展态势初露雏形,细分领域优势公司获资本青睐 智能投研公司Kensho 智能投研公司Eagle Alpha中国智能投研行业发展现状中国智能投研行业发展现状 2014年,中国智能投研公司开始成立 国家政策:对金融提出了自动化和智能化的发展要求 智能投研公司文因互联智能投研公司因果树智能投研公司分类智能投研公司分类根据优化步骤不同,智能投研平台可分为四类美国智能投研行业发展现状美国智能投研行业发展现状发展态势初露雏形,细分领域优势公司获资本青睐发展态势初露雏形,细分领域优势公司获资本青睐自
11、2007年,美国逐渐出现智能投研公司,且专注领域各有侧重,部分公司获得资本青睐。公司公司成立时间所在地特点累计融资额(万,美元)Palantir Metropolis2004美国旧金山整合多源数据213,677.4Trefis2007美国波士顿细拆公司业务预测收入213AlphaSense2008美国纽约获取专业且碎片化信息3,500Dataminr2009美国纽约收集公共来源数据18,344Visible Alpha2012美国纽约设立专有的新数据集和工具套件N/AKensho2013美国剑桥寻找事件与资产的相互关系6,749.5注释:累计融资额截止至2017年12月来源:XX金融创新研究院
12、美国智能投研行业发展现状美国智能投研行业发展现状智能投研公司智能投研公司Kensho(1/2)Kensho是一个先锋级的实时数据计算系统、一个可量化的数据框架,是全球化金融系统的新一代升级产品。Kensho的主要产品Warren,是一个金融数据收集、分析软件,类,是一个金融数据收集、分析软件,类似似Google的金融搜索引擎的金融搜索引擎,可自动将发生的时间根据抽象特征进行分类。如美国总统任期的前100天内股票涨跌情况。Warren拥有强劲的云计算能力云计算能力、良好的人机交互界面人机交互界面和深度学习能力深度学习能力。Kensho公司的目标是让此软件的功能取代现有的大量投资分析人员的工作,为
13、客户提供更加优质、快速的数据分析服务。来源:XX金融创新研究院Kensho-美国总统任期的前美国总统任期的前100天股票涨跌情况天股票涨跌情况Warren寻找特定事件对某些资产价格的影响美国智能投研行业发展现状美国智能投研行业发展现状智能投研公司智能投研公司 Kensho(2/2)产品功能寻找事件和资产寻找事件和资产之间的相关性之间的相关性基于事件对资产未来基于事件对资产未来价格走势进行预测价格走势进行预测 例如,Apple 股价走势图中,在每个试点,可以得到具体的那些寻找影响资产价格的相关事件 事件影响了Apple 股价以及影响的百分比; 同时,可以展现事件对股价波动的P-Value 例如,
14、输入“美联储降低利率”,并选择时间段和投资品种类,Warren会以图表方式呈现该事件对资产价格走势的影响Warren通过数据库,判断哪些是用来预测价格的相关特征,以股票价格概率分布区间的图表呈现其预测的结果。数据类型产品特点EarningreleasesEconomicReportsStock pricemovementMovingaverageProductlaunchesFDA drugapprovalsStock pricetriggersMonetarypolicychangesPoliticalevents快速的快速的云计算能力云计算能力良好的良好的人机交互性人机交互性强大的强大的深
15、度学习能力深度学习能力美国智能投研行业发展现状美国智能投研行业发展现状Eagle Alpha成立于2012年,面向资产管理行业提供另类数据分析服务。其客户包括量化基金、对冲基金及传统共同基金。Eagle Alpha提供的服务可分为两类:另类数据培训(Education/Best Practice)、Alpah分析。来源:XX金融创新研究院智能投研公司智能投研公司 Eagle Alpha(1/2)来源:XX金融创新研究院美国智能投研行业发展现状美国智能投研行业发展现状智能投研公司智能投研公司 Eagle Alpha(2/2)Eagle Alpha具备强大的另类数据源搜集及校验能力,可以解决客户在
16、使用另类数据源过程中需要检测及校验数据源、排除数据源法律及隐私风险等问题。在线数据库在线数据库Eagle Alpha配备五位专职员工来校验全球范围内的另类数据集(截止2017年9月,已有515个数据集)。Eagle Alpha的数据库是目前对接了最多数据集的数据库之一。咨询服务咨询服务基于5年的另类数据经验,EagleAlpha向客户提供另类数据集相关咨询服务,如提供具有实践性的数据报告及另类数据集使用指引等。数据提供商渠道数据提供商渠道通过Eagle Alpha,客户可以对接不同的数据提供商。专属数据集专属数据集Eagle Alpha可通过网络爬虫及搜索数据等,向客户提供专属数据集。注释:统
17、计至2017年9月;因统计分类标准不同,统计数值可能存在差异来源:XX金融创新研究院19982001200320042005200620072008200920102011201220132014201520162017中国智能投研行业发展现状中国智能投研行业发展现状行业伊始:行业伊始:2014年,中国智能投研公司开始逐步成立年,中国智能投研公司开始逐步成立2009年是我国智能金融公司创业的分水岭,并于2014年至年至2015年出现创业高峰年出现创业高峰,两年内出现了近80家智能金融公司。根据下图,智能支付、智能营销、智能客服类公司出险时间较早;而智能投研、智能投顾智能投研、智能投顾类公司,主
18、要是从从2013年开始年开始成立与发展。中国智能金融公司成立时间分布中国智能金融公司成立时间分布50.0040.0030.0020.0010.000.00智能支付智能营销智能客服智能风控智能投研智能投顾2016年年7月月2016年年12月月2017年年5月月2017年年7月月中国银行信息科技中国银行信息科技“十三五十三五”发发展规划指导意见(征求意见稿)展规划指导意见(征求意见稿)构建绿色高效的数据中心,积极尝试开展人工智能、生物特征识别等技术的应用,打造智能化运维体系。十三五国家科技创新规划十三五国家科技创新规划重点发展大数据驱动的类人智能技术方法,完善科技与金融结合机制,建设国家科技金融创
19、新中心,发展支持创新的多层次资本市场,促进科技金融产品和服务创新。中国人民银行成立中国人民银行成立金融科技委员会金融科技委员会旨在加强金融科技工作的研究规划和统筹协调,切实做好我国金融科技发展战略规划与政策指引,并积极利用大数据、人工智能等技术丰富金融监管手段。新一代人工智能发展规划新一代人工智能发展规划建立金融大数据系统费,提升金融多媒体数据处理与理解能力。创新智能金融产品和服务,发展金融新业态,鼓励金融行业应用智能客服、智能控制等技术和设备。建立金融风险智能预警与防控系统。中国智能投研行业发展现状中国智能投研行业发展现状2016-2017年,基于普惠金融等需求,国家对金融提出了自动化和智能
20、化的发展要求,在十三五国家科技创新规划中也明确了重点发展大数据驱动的类人智能技术方法,推动科技与金融融合。2017年5月金融科技委员会的成立,标志着我国开始拥有专门研究规划和统筹协调金融科技工作的机构。来源:XX金融创新研究院国家政策:对金融提出了自动化和智能化的发展要求国家政策:对金融提出了自动化和智能化的发展要求投价投价研值研值注释:公司logo仅作图示,并未包含行业中全部公司来源:鲍捷、东吴证券,XX金融创新研究院智能投研公司分类智能投研公司分类根据切入投研不同步骤,智能投研平台可分为四类根据切入投研不同步骤,智能投研平台可分为四类资资究链究链获取数据获取数据扩展数据类型扩展数据类型 传
21、统的数据 另类数据预处理数据预处理数据获取方式优化获取方式优化 搜索体验升级 交互体验升级分析数据分析数据提取工具优化提取工具优化 数据提取优化 知识提取优化交易信号交易信号分析工具优化分析工具优化 分析研究优化 观点呈现优化来源:XX金融创新研究院智能投研两种发展模式智能投研两种发展模式扩展数据类型与体验优化升级扩展数据类型与体验优化升级通过前文可知,根据投资研究的步骤:搜索与收集、数据和知识提取、分析研究、观点呈现,我们将智能投研公司分为四类:扩展数据类型,获取方式优化,提取工具优化,分析工具优化。从本质上,智能投研相较于传统投研有两种方式的改进:扩展数据类型与体验优化升级。投资研究步骤投
22、资研究步骤智能投研分类智能投研分类智能投研发展智能投研发展将另类数据(如SaaS数据)结合传统投研数据(如财务数据),提供投研分析新模型。不改变原有投研数据类型,通过知识图谱等技术,改善数据清洗、提取、分析过程,提高投研效率。搜索与收集搜索与收集扩展数据类型扩展数据类型扩展数据类型扩展数据类型数据和知识提取数据和知识提取获取方式优化获取方式优化分析研究分析研究提取工具优化提取工具优化体验优化升级体验优化升级观点呈现观点呈现分析工具优化分析工具优化注释:基于46家资产管理机构和23家对冲基金的调查结果;百分比由于四舍五入缘故,其加总可能不等于100%。来源: XX金融创新研究院28%11%20%
23、22%9%17%11%24%44%33%37%46%52%33%39%35%20%33%41%28%26%37%37%35%7%17%2%11%11%13%2%7%2%4%2%4% 2%实时市场数据历史市场数据资产估值数据上市公司的另类数据私营企业数据宏观数据其他另类数据上市公司基本面数据22%30%17%26%9%9%4%17%44%26%39%35%35%26%30%48%9%26%39%22%35%39%48%30%13%13%4%13%13%17%4%13%4%4%9%13%9%4%5-最具研究性4321-最不具优势性资产管理机构资产管理机构对冲基金公司对冲基金公司智能投研发展模式一:
24、扩展数据类型智能投研发展模式一:扩展数据类型智能投研从另类数据中提取价值智能投研从另类数据中提取价值据调查,另类数据(如社交媒体的情绪分析和众包研究)已超越传统研究数据,获得资产管理机构和对冲基金公司的青睐。超过60的参与的资产经理相信上市公司的另类数据提供了最大的优势,而近一半的受访者赞成其他另类数据的价值。原因之一在于另类数据为专业投资机构提供了击败市场、发现alpha(无风险超额报酬)的可能性。不同数据类型提供的研究性程度不同数据类型提供的研究性程度智能投研发展模二:优化体验升级智能投研发展模二:优化体验升级 获取方式优化获取方式优化提高数据搜索效率。数据库覆盖企业运营数据、投资机构投资
25、数据、市场分析研报、招股书、全球知识产权数据、用户上网行为数据等,涵盖不同细分行业。 提取工具优化提取工具优化提取有价值信息。机器学习算法,构建出召回率、准确率、反欺诈等数据模型。形成用户画像,发掘事件内在联系,去除噪音。 分析工具优化分析工具优化提供可视化分析结果。自动生成报告,识别潜在交易信号、利用智能评估交易系统评估交易的可行性。来源: XX金融创新研究院获取方式优化,提取工具优化,分析工具优化获取方式优化,提取工具优化,分析工具优化项目项目项目项目主要内容主要内容投研机器人搜索搜索细分行业上市、早期项目信息,查看投资机构偏好与附属关系研究通过标的发现与进行研究,自动化生成报告订阅关注动
26、态变化,提取公告摘要,微信持续推送自动化报告企业秀自动化生成企业H5页面,加速企业推广微信机器人无需跳转应用,便捷化查询与记录所需信息行业研究细分行业简报,对标企业分析,可视化交互系统中国智能投研行业发展现状中国智能投研行业发展现状文因互联是一家用人工智能解决金融数据分析问题的创业公司,利用知识图谱的技术,主打自动化报告和投资研究机器人两款产品,对大量且复杂的数据进行结构化清洗,最终自动生成报告,实现人+机器的高效合作。来源:XX金融创新研究院智能投研公司智能投研公司文因互联文因互联中国智能投研行业发展现状中国智能投研行业发展现状来源:XX金融创新研究院智能投研公司智能投研公司因果树因果树因果
27、树因果树是以大数据为依托的人工智能股权投融资服务平台,针对国内外一级、二级股权投资市场,评估企业优劣的辅助工具。数据来源包括市场上的公开数据、多家运营商数据、知识产权数据,还包括定点行业数据,并分析每个项目在投前、投中、投后的信息,包括其所在行业状况、资本状况、项目团队水平、用户表现等。股权融资项目和机构数据库:1000个细分行业,3000万企业运营数据。1万+风险投资机构数据,100万+份市场分析研报等。一级市场投资机器人,每周挖掘未来3-6个月内最有可能获得融资的潜在明星公司。向客户提供产业链数据洞察系统解决方案、运营商数据和API接口等定制化解决方案。3基于可替代数据的基于可替代数据的投
28、研服务市场投研服务市场可替代数据的概念及分类可替代数据的概念及分类来自个人线上行为的数据 来自商业/业务的数据 来自传感器的数据金融投资角度下的可替代数据分类金融投资角度下的可替代数据分类基于可替代数据的投研服务基于可替代数据的投研服务 为什么要利用可替代数据进行投资研究 可替代数据在投研领域的应用情况可替代数据投研行业的市场规模可替代数据投研行业的市场规模基于可替代数据投研服务的市场结构基于可替代数据投研服务的市场结构基于可替代数据的投研公司基于可替代数据的投研公司来源:XX金融创新研究院另类数据概念及分类另类数据概念及分类另类数据(Alternative Data,又称另类数据)是指通过运
29、营商、网络、App、卫星等非传统方式手机的新型数据。依据另类数据的来源不同,另类数据可分为三类:个人数据、商业/业务数据及传感器数据。另类数据分类另类数据分类个人个人社交媒体新闻 评论网络搜索商业商业/业务业务交易数据企业数据政府机构传感器传感器卫星地理位置其他传感器来源:XX金融创新研究院另类数据概念及分类另类数据概念及分类来自个人线上活动的另类数据来自个人线上活动的另类数据来自个人线上活动的另类数据可以分为三类:社交媒体、新闻/评论、网络搜索及个人共享的行为数据。目前利用社交媒体数据进行舆情分析是最常见、应用程度最高的一类另类数据应用。来自个人线上活动的另类数据分类来自个人线上活动的另类数
30、据分类社交媒体社交媒体新闻新闻 评论评论网络搜索及网络搜索及个人共享的行为数据个人共享的行为数据新闻媒体新闻媒体产品评论产品评论商业评论商业评论电子邮件收据电子邮件收据分分类类示示例例交易数据电商消费信用卡消费换汇交易来源:XX金融创新研究院私营机构数据行业产业链数据分分类类示示例例另类数据概念及分类另类数据概念及分类来自商业来自商业/业务流程的另类数据业务流程的另类数据来自商业/业务流程的另类数据可以分为三类:交易类数据、来自公共机构及私营机构的数据。其中,部分公司为用户提供记账、理财服务,因此可以获得用户的交易数据来自公共机构的数据目前层次丰富,包含国际数据(如世界银行)、国家数据(如中国
31、央行)以及城市/州数据等来自商业来自商业/业务流程的另类数据业务流程的另类数据公共机构数据政府数据公共机构数据另类数据概念及分类另类数据概念及分类来自传感器的另类数据来自传感器的另类数据来自传感器的另类数据分为卫星数据、地理位置数据及其他传感器数据三类。卫星图片是目前应用最广泛的另类数据来源之一。微型微型、图片识别以及深度学习技术,大大降低了微型图片的获取成本和分析标准度和精度。目前,微信图片信息可以日为单位获取及更新,预计3-5年后可以实现实时数据获取及更新。来自传感器的另类数据来自传感器的另类数据卫星数据其他传感器数据地理位置数据卫星图分分类类示示例例GPSWiFiCDMA信号来源:XX金
32、融创新研究院视频数据音频数据来源:XX金融创新研究院资产类型股权大宗商品信贷利率外汇投资特色宏观行业特性股票特性风险导向量化信号Alpha因子独立投资可行组合投资可行不可行容量正交性已知性公开(无成本)熟知性鲜为人知性专有(不可知)有限销售项目处理阶段未加工半加工处理完成可交易信号研究报告/警示质量历史数据数据噪音缺失值方法论透明支持架构技术方面频率潜在因素形式稳定接口冲突/法律风险首席信息官/基金经理更关注的数据分类量化/数据科学家更关注的数据分类基于另类数据的投研服务基于另类数据的投研服务金融投资角度下的另类数据金融投资角度下的另类数据在金融投资角度下,从业人员并不十分关注数据的来源,而是
33、更关注这类数据是否可以提供相关的投资思路等。不同细分职能的从业人员会关注不同的数据种类。如高频量化交易员会更加关注实时变化的社交媒体数据,而不是具有一定滞后性的交易数据;数据分析师则更加关注某类数据是否可以用来建模并量化分析。金融投资角度下的另类数据分类金融投资角度下的另类数据分类“根据Greenwich Associate的调研报告,超过60%的投资人利用数据是为了预测未来:通过历史数据及历史表现来预测未来的走势。70%的投资人认为实时市场数据可以提供投资策略思路。但由于大部分投资人使用的是相同的数据,因此产生独特交易策略、并可获得超额收益的概率降低。可见,获取独一无二的另类数据将成为各个机
34、构积极追寻的获取超额收益的策略之一。注释:基于46家资产管理机构和23家对冲基金的调查结果来源:XX金融创新研究院基于另类数据的投研服务基于另类数据的投研服务为什么要利用另类数据进行投资研究为什么要利用另类数据进行投资研究37%31%37%33%63%64%61%40%40%39%48%44%2%2%0%预测未来市场或板块走向预测未来市场或板块走向寻找市场定价错误、套利寻找市场定价错误、套利获得投资思路获得投资思路支持具体公司研究支持具体公司研究作为一个指数使用、作为一个指数使用、而非为了超越指数的收益而非为了超越指数的收益使用另类数据的目的使用另类数据的目的超越指数超越指数or获取获取Alp
35、ha总体资产管理机构对冲基金目前最成熟的应用数据是传统金融数据,包含股票价格及加以数据、衍生品价格交易数据、基础面数据等。这类数据也是目前大部分数据终端可以提供的数据。应用的数据, 该领域已经出现不少创业公司。除此之外,物联网数据、监管数据等更多的数据来源正亟待开发和应用。基于另类数据的投研服务基于另类数据的投研服务另类数据在投研领域的应用情况另类数据在投研领域的应用情况已可成熟应用的数据已可成熟应用的数据该类型的数据是目前最成熟的应用该类型的数据是目前最成熟的应用数据。有相关应用供市场分析人员数据。有相关应用供市场分析人员使用。使用。正在逐步应用的数据正在逐步应用的数据该类型的数据正在开始应
36、用。该类型的数据正在开始应用。这类数据亟待有效来源、进行开发这类数据亟待有效来源、进行开发舆情数据和卫星图片分析数据是正在逐步开始尚未开发的数据尚未开发的数据股票价格股票价格股票交易数据股票交易数据期货价格期货价格期货交易数据期货交易数据基础面数据基础面数据数数据据类类型型舆情数据舆情数据广告主花销数据广告主花销数据卫星图片信息数据卫星图片信息数据经济数据经济数据交通数据交通数据数数据据类类型型微型卫星微型卫星无人机图片无人机图片物联网物联网可穿戴设备可穿戴设备发展中国家食品价格发展中国家食品价格监管科技监管科技数数据据采采集集来来源源来源:XX金融创新研究院创新者创新者早期使用者早期使用者早
37、期大多数早期大多数晚期大多数晚期大多数落后者落后者50+家资产管理公司已在多年前开始使用另类数据进行投资分析。2017年6月,据Jefferies统计,已有20%管理资产超过10亿美金的对冲基金,派专人从事另类数据的研究。基于另类数据的投研服务基于另类数据的投研服务另类数据投研应用的发展阶段示意另类数据投研应用的发展阶段示意2017年9月,据Eagle Alpha调查,关注另类数据的公司已由2017年初的125家增至226家。并预计在2018年底前,专业资产管理人跨越另类数据应用的“断层”。断断层层THECHASM据摩根大通(JP Morgan)统计,70%的公司认为大数据会渐渐影响所有的投资
38、公司。Greenwich的调查表明,80%的公司希望扩大对另类数据的使用权。2017年年2018年末年末来源:XX金融创新研究院2016年年2017年年2018年年2019年年2020年年2021年年2022年年金融信息服务(亿)-年增长率-渗透率另类数据投研(亿)44.16-6.79%3.0044.540.85%8.98%4.0048.709.35%11.29%5.5053.6510.16%14.17%7.6059.6511.19%17.69%10.5667.0912.47%21.96%14.7376.5214.1%27.02%20.67另类数据投研行业的市场规模另类数据投研行业的市场规模增
39、量数据拓展需求将为另类数据投研提供发展空间增量数据拓展需求将为另类数据投研提供发展空间我们估算,保守估计另类数据投研在金融信息服务市场的渗透率将逐年提升,至2021年将达到30亿人民币。另类数据投研市场规模预估另类数据投研市场规模预估来源:XX金融创新研究院另类数据投研行业的市场结构另类数据投研行业的市场结构另类数据范围延伸,三类中间商出现另类数据范围延伸,三类中间商出现总体来看,另类数据投研产业链基础结构分为三部分,分别由原始数据提供商、半加工数据提供商以及交易信号及报告提供商组成。随着另类数据范围的延伸,三类中间商开始出现:数据投研咨询服务商提供全程大数据投研服务(数据获取、整理、建模及输
40、出数据产品)综合数据提供商主要整合各原始数据提供商的数据,向机构投资者提供定制化的数据集原始数据原始数据提供商提供商半加工数据半加工数据提供商提供商交易信号及报告交易信号及报告提供商提供商综合数据综合数据提供商提供商技术解决方案提供商则向数据提供商们提供金融投资领域下的IT技术解决方案数据投研咨询服务商数据投研咨询服务商机机构构用用户户技术解决方案技术解决方案提供商提供商收集原始数据收集原始数据整合不同地区、行业数据整合不同地区、行业数据提供某类资产相关性数据提供某类资产相关性数据全程提供数据投研服务全程提供数据投研服务提供定制化投研分析提供定制化投研分析数据获取、处理及建模,数据获取、处理及
41、建模,提供数据产品提供数据产品整合多方数据源整合多方数据源基础基础结构结构提供定制化数据集提供定制化数据集注释:基础结构中间商来源:XX金融创新研究院基于另类数据的投研公司基于另类数据的投研公司百观:以另类数据为基础,提供投资研究数据产品百观:以另类数据为基础,提供投资研究数据产品百观(BigOne Lab)提供面向买方市场的另类数据研究分析服务,通过开发、挖掘、获取有价值的新型数据,高效能的数据分析,可视化及分版块的深度研究,机构投资者可以获得不同于传统数据终端与卖方市场的投资研究数据产品。原始另类数据原始另类数据网页爬虫APP爬虫移动运营商固网运营商银联支付卫星图像SDK日志SaaS数据非
42、结构化文本BigOne Lab数据库数据库公司深度数据行业全景数据新经济指标数据产品生产线客户端4智能投研的未来发展智能投研的未来发展智能投研未来发展智能投研未来发展 智能投研沿袭另类数据投研产品体系,二者遵从相同研发内核R&D Team在另类投研领域的布局策略在另类投研领域的布局策略 替代数据投研的需求分析难点与机会 R&D Team开展另类数据投研的策略 组建Alternative Data Group资资 价价究究 链链资资 价价询询 链链来源:XX金融创新研究院智能投研发展智能投研发展智能投研沿袭另类数据投研产品体系,二者遵从相同研发内核智能投研沿袭另类数据投研产品体系,二者遵从相同研
43、发内核我们认为,智能投研提高了投研人员的效率,而另类数据提供更广泛的交易思路、更及时有效的交易信号,进而可为资金端用户提供资产配置、交易策略与投资组合方案。在投资研究的数据库及投资模型/策略经过长期积累及校验后,另类数据可直接用于投资交易,即作为基金管理人直接进行投资或进入智能投顾服务领域。投投咨咨 值值大类资产配置大类资产配置投资组合选择投资组合选择交易执行交易执行投资组合投资组合再平衡再平衡投资损失避税投资损失避税投资组合分析投资组合分析客户档案客户档案创建及分析创建及分析投投研研 值值预处理预处理数据数据分析数据分析数据交易信号交易信号获取数据获取数据交易策略交易策略投资组合投资组合注释
44、:基于46家资产管理机构和23家对冲基金的调查结果来源:XX金融创新研究院R&D Team在另类投研领域的布局策略在另类投研领域的布局策略替代数据投研的需求分析替代数据投研的需求分析难点与机会难点与机会通过前文可知,大部分买方投资人认为另类数据可以提供独特的交易策略或思路,希望获取更多的另类数据源。然而当前另类数据投研尚障碍重重。高成本、内部审批流程的冗杂以及无法充分评估数据价值是当前机构进行另类数据投研的主要难点。可能的机会可能的机会机会机会1:基于买方投资人的要求,可以阐明自身数据质量的数据供应机会机会2:利用变量和指标,为用户及潜在用户来说明另类数据的数据质量、完整性机会机会3:更好、更
45、快的将投资人需要的数据整合至可使用、可分析、可交易的状态38%32%32%30%28%20%17%13%高成本内部批准流程缓慢缺少时间评估数据质量管理层认为数据无价值可替代数据集较难应用数据完整性较差整合数据的人力成本较高暂无难点买方机构开展另类数据投研的难点买方机构开展另类数据投研的难点R&D Team在另类投研领域的布局策略在另类投研领域的布局策略R&D Team开展另类数据投研的策略开展另类数据投研的策略投资机构R&D Team开展另类数据投研的方式分为三种:其中,利用中间商提供的服务是目前成本最低且可最大化接触各类另类数据源的方式。利用中间商提供的服务是目前成本最低且可最大化接触各类另
46、类数据源的方式。来源:XX金融创新研究院完全自建完全自建包括原始数据获取的能力(如网页爬虫)、数据处理能力、分析能力及产品化能力第三方第三方数据库数据库自建自建分析能力分析能力利用中间商利用中间商利用第三方数据库第三方数据库并自建另类数据挖掘、数据分析能力自建另类数据挖掘、数据分析能力利用中间商(如数据咨询提供商)中间商(如数据咨询提供商)提供的另类数据投研服务123来源:XX金融创新研究院第三方第三方数据源数据源原始数据原始数据数据提供商数据提供商数据获取&收集高效能数据计算数据分析可视化分板块研究R&DQuant指标指标公布交易信号公布交易信号说明分析说明分析L/SteamQuanttea
47、mR&D Team在另类投研领域的布局策略在另类投研领域的布局策略组建组建Alternative Data Group(1/2)Alternative Data GroupSourcingteamComputingGroupDataScientist数据收集能力数据建模能力产品化能力数据结构化能力来源:XX金融创新研究院R&D Team在另类投研领域的布局策略在另类投研领域的布局策略组建组建Alternative Data Group(2/2)量化分析师量化分析师R&D quant数据数据BD组组Sourcing Team拓展新的数据来源,维护与各数据提供商的关系。计算机技术组计算机技术组Computing group建立数据库和应用工具,保证另类数据投研流程的平稳进行。分析师及数据科学家分析师及数据科学家Analysts anddata scientists负责数据挖掘,处理差异极值并建模。依据另类数据的数据挖掘结果,产出量化策略。