金融智能(2)-数据可视化与数据化决策课件.pptx

上传人(卖家):三亚风情 文档编号:2219146 上传时间:2022-03-22 格式:PPTX 页数:42 大小:1.09MB
下载 相关 举报
金融智能(2)-数据可视化与数据化决策课件.pptx_第1页
第1页 / 共42页
金融智能(2)-数据可视化与数据化决策课件.pptx_第2页
第2页 / 共42页
金融智能(2)-数据可视化与数据化决策课件.pptx_第3页
第3页 / 共42页
金融智能(2)-数据可视化与数据化决策课件.pptx_第4页
第4页 / 共42页
金融智能(2)-数据可视化与数据化决策课件.pptx_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、经济信息工程学院 王涛金 融 智 能 1数据可视化西南财经大学西南财经大学 经济信息工程学院经济信息工程学院无图无真相?无图无真相?无图无真相?p 一张图片等于一千个字p 图形理解起来并不困难,这就是注入微软电子表格软件(Mocrisoft Excel)和苹果电子表格软件(Apple Number)这类程序内置图表生成功能的原因之一。无图无真相?p可视化是传递数据信息最有效的方法之一。p可视化是压缩知识的一种方法,减少数据粮食一种压缩方式,如采用速记、简写的方式来表示一个词或者一组词。但是,数据经过压缩之后,虽然更容易存储,但却让人难以理解。然而图片不仅可以容纳大量信息,还是一种便于理解的表现

2、方式。这就叫做数据的可视化。数据可视化的必要性p首先,一般数据很难满足人们希望将所有数据相互衔接并出现在同一个地方的愿望。p其次,内部环境和外部环境的数据信息可能存储在不同的地方(行业数据可能存储在市场调查报告之中,而公司的具体销售数据则存储在公司的数据库中,公司的销售数据可能按天存储,而行业的数据可能是季度数据)p最后,数据信息不统一的叫法也是我们难以理解数据真正想传达的信息(例如硬盘在行业报告中称为“硬盘驱动器”,但在内部销售数据中可能被叫做“产品编号”)p通过获取数据信息,并将之绘制成图表,数据就不再是简单的数据了,它变成了知识。可视化是一种压缩知识的形式,看似简单的图片却包含了大量结构

3、化或非结构化的数据信息。信息图p当代生物学杂志描述人类视网膜“视觉输入(信息)的速度可以和以太网的传输速度相媲美,人类视网膜能以大约每秒10兆的速度传达信息。p视觉接受的信息比其他任何一种感官都多。如果我们视觉接收信息的速度和计算机网络相当,那么我们通过触觉接受信息的速度只有他们的1/10,嗅觉和听觉接收信息的速度更慢,大约是触觉接收速度的1/10信息图信息图图片和分享的力量pFacebook的用户在2011年末,每天的图片平均下载量达到了2.5亿张,每月达到了75亿张。p一个拥有优先信息资源的营销人员该做些什么来让搜索更加吸引人呢?答案是制作一张信息图。信息图可以吸纳广泛的数据资源,使这些数

4、据相互吻合,然后编造一个引人入胜的故事 (例如,设计网页浏览器的时候,可以讲关于浏览器战争的故事)p京东案例:http:/ analysis)的工具。Twitter的用户每天在网络上发送大概5亿条推文,通过分析推文中使用的词语,计算机程序不仅可以发现流行的话题,即受到更多关注的话题,还可以得出人们感觉如何、持什么观点的结论。p具体做法就是通过分析大约每秒2万条的推文,分析这些推文所使用的语言,找出通用词汇,然后将所有的数据以可视化的形式呈现出来。p与电话投票耗时长且没场面太通常要花费大约20美元相比,上述公司所采用的实时调查只需话费几个计算周期,并且没有规模限制,它还可以将手机到的数据及时进行

5、可视化处理。打造最好的可视化效果p“神经营销学”(neuromarketing)运用科学方法来判断哪种可视化效果最好,神经营销学使用“核磁共振成像”和其他科技来观察在面对各种各样广告方式的时候,大脑的哪个部分会兴奋起来。营销人员甚至能通过场景模拟来确定广告放在哪里会产生最好的效果,例如将广告放在广告牌上还是公交车的车身上。 2数据量化西南财经大学西南财经大学 经济信息工程学院经济信息工程学院无形之物有法可测p经常发现有人说缺乏某些关键数据,这些数据对其决策产生重大影响,但他们根本没想过量化这些数据。当某人称呼某物为不可量化的东西时,其实可以找出一个量化它的具体方法。p当你能够量化你谈论的事物,

6、并且能用数字描述它时,你对他就确实有了深入了解。但如果你不能用数字描述,那么你的头脑根本就没有跃升到科学思考的状态 英国物理学家 开尔文p如果人们找到观测事物的方式,并找到某种方法,无论这种方法多么“模糊”,它能让你知道得比以前更多,那么他就是一种量化方法。解决商业领域中的量化难题的3个建议p关心量化工作,因为它会为决策提供信息。p决策前,需要量化多方面的事物,量化方案也很多,面对多种方案,管理者可能难以取舍。p管理者需要运用一些方法来分析、选择这些方案,以减少决策的不确定性不同领域的量化案例 爆炸当量p用碎纸片估算原子弹爆炸当量 1945年第一颗原子弹爆炸试验时,费米就展示了他的量化技巧。在

7、其他科学家对量化爆炸当量的仪器进行最后校正时,费米正在把一张纸撕成碎片。当第一波冲击波冲进营帐时,他把水纸屑慢慢撒向空中,观察他们在冲击波的冲击下能飘多远,最远的碎片承受的就是波的压力峰值。费米据此得出结论,爆炸当量应该大于10000吨。最终计算结果是18000吨。不同领域的量化案例 费米分解法p估算芝加哥的钢琴调音师的人数 芝加哥的当前的人数(19301950年,略超过300万)、 每家平均几口人(2或3)、 家庭平均拥有的需要定期调音的钢琴数量(10家里最多1家,但30家至少有1家) 每部钢琴需要调音的频率(也许平均1年1次) 一个调音师平均每天能调多少部钢琴(45部,包括交通时间)、 一

8、年工作多少天(约250天)由此就可以计算结果芝加哥调音师的数量=(人口/每家人口)X 有钢琴的家庭百分比 X 每年调音次数 / (调音师每天调音的钢琴数 X 年工作天数)根据选择的不同特定值,所得结果在20200之间,一般是50左右。当费米把猜测值和真实值比较死,发现他总是比学生们猜测的更接近真实值。或许20200这个范围看起来很大,但考虑到学生最初从“我们怎么猜得到”进而得来的,已经很不错了)不同领域的量化案例 开设心的保险公司获利空间如何p用新品牌在同一个市场上开设新的保险公司,获利空间大吗? 查克麦凯(Chuck McKay)号称广告巫师,为评估某种产品在规定区域的市场规模,一次,一个保

9、险机构请查克评估在德克萨斯州的一个小镇上简历一个新公司的市场机会,因为该公司在当地没有任何业务,不知这个市场是否还能容得下另一个保险公司。 为了评估商业可行性,查克利用搜索引擎回答了几个费米问题。 该小镇一共有62172辆汽车:德克萨斯州每辆车的每年保险金额是837美元,查克假设几乎所有汽车都有保险,这是强制性的,因此该镇一年汽车保险总额是52062833美元。保险公司的平均佣金率是12%,因此每年总佣金收入是6247540。根据Switchboard显示,该镇一共有38家保险机构,折合Y的数据十分接近。当总佣金被这38家机构瓜分时候,平均每家机构每年可得到164409美元。 City-D显示

10、,该镇人口从2000年的104197人下降到2005年的99846人,可见市场正在紧缩。而且几家大公司可能会扩大规模,因此年收益估计比预计的还要少。 查克的结论:开设新公司不太可能获得良好收益,应放弃这个机会。量化问题p请估算中国有多少加油站? 可提供信息如下: 中国有13亿人口 中国千人汽车拥有量是38辆p请估算本次PACIS会议能收到多少篇学术论文? 可提供的信息如下: PACIS官方网站 www.pacis2014.org PACIS的全名为Pacific Asia Conference on Information Systems没有什么不可以量化p量化不需要彻底消除不确定性。p量化通

11、常使用几种量表,包括“分类”和“等级”量表。p分类量表根据简单的属性分类,分类量表中没有次序之分(例如性别),数字不表示相对大小,仅仅表示某个事物是否属于某个集合而已。p等级量表可以让我们说一个值大于另一个值,而差值并不表示精确差距(例如金融信用评级,莫氏硬度表)莫氏硬度表量化方法隐藏在量化目标中p怎样量化师徒关系的好坏?首先要解决的是师徒关系是什么意思?如果回答“我不知道”,那么这就是你相信它难以量化的真正原因,因为你没有弄清楚他到底是什么?p确定真正要量化什么,是几乎所有研究的起点。商业领域的管理者需要认识到,某些食物看起来完全无影无踪,是因为你还没给所谈论的事物下定义。搞清楚它的意思是什

12、么,就已经完成了量化工作的一半。校准训练p对数量上不确定的一种表达方式是将它想象成一个可能取值的范围。在统计学中,以特定的概率表示一个正确答案的范围被称为“置信区间(Confidence Interval,CI)”。一个90%的执行取件就是它包含正确答案的可能性有90%。p例如根据目前的潜在客户数量,你不能确切地指导下一个季度有多少人会成为你的签约客户,但你觉得大概不会少于3个,但也不会多余7个。如果你有90%的把我认为实际的数字将在3和7之间,就可以说你的90%的置信区间是37。主观信心的两个极端p过于自信 当一个人经常自夸其拥有的知识,并且正确率要比他所估计的低时,就是过于自信的表现。例如

13、,当要求默认估算一个90%的置信区间时,实际结果在置信区间中的概率远小于90%。p过于不自信 当一个人经常低估其拥有的知识,并且正确率比他估计的高时,就是这种情况。例如,当要求某人估计一个90%的置信区间时,实际结果在置信区间中的概率明显大于90%校准测试题90%置信区间 对于每个90%置信区间的问题都提供上限和下限。请记住该范围应该足够宽,以便答案有90%的机会落在你设置的区间中。主观信心的两个极端p在完成后看答案之前,做一个小小的实验,看看你各处的范围是否真的反映了90%的置信区间。现在就考虑一个90%置信区间的问题,牛顿什么时候发表万有引力定律?假设给你一个赢得1000元的机会,青葱一下

14、两个方法中选择一种。pA方法 如果真正地发表年份确实在你给出的日期上下限之间,你就赢得1000美元,否则什么也得不到。pB方法 旋转一个分成两个大小不等的“扇形”转盘,一个扇形占90%的面积,而另一个占10%,转盘上有个固定指针。如果转盘指针停在大扇形区域,你就赢得1000元,否则什么也得不到(也就是说,你有90%的机会赢得1000元)主观信心的两个极端p80%以上的人会选择转盘,因为他们认为转盘有更高的或升级会,对此我们不得不得出这样的结论:你当初估计的90%的置信区间实际上并不是你的90%置信区间,或者他是你的50%,60%,或者80%。也就是说,你最初的估计是过于自信了,你表达的不确定性

15、的方式说明,你内心的不确定性比你声称的要大。p另外一个不希望的结果是你又选择了A方法:如果答案在你的范围里你就赢得1000元。这意味着你认为获胜的概率超过90%,虽然你声称的把握仅仅是90%。换句话说,A方法往往是归于不自信的人的选择。p对于过于自信的人,意味着你要扩大初次估计的范围;对于不自信的人来说,则要缩小初次估计的范围。量化时避免反应偏向的五个方法p问题简短精确 冗长的问题让人容易糊涂。p避免使用过多术语 问卷设计则或许没有意识到过多属于会影响被调查者的回答(例如询问民众是否支持某个领导人的“自由主义”政策“p避免引导性的问题 引导性的问题会告诉被调查者问卷设计者们期望得到什么样的回答

16、。(例如,公务员的工资低、压力大,是否应该提高他们的工资?)p避免复合问题 被调查者不知道该回答哪个问题,应该将复核问题拆分成多个问题(例如,你喜欢A品牌汽车或B品牌汽车的座位、方向盘还是控制系统?)p将问题翻转,以避免定向的反应偏向(例如,如果你让被调查者回答多个问题时都用范围从1到5的量表,就要注意在每个问题中,不要把“5”设置成总是“正面的”或“负面的”。这样做是为了鼓励被调查者阅读并回答每个问题,而不是条一列由上到下地对每个复选框打钩。 3数据、信息与知识西南财经大学西南财经大学 经济信息工程学院经济信息工程学院概念解析p 智能的表现 信息共享和企业信息集成(SCM)知识挖掘与管理(W

17、eb2.0)p 企业不管大小,都必须对瞬息万变的市场情况做出及时、高效地反应,而这些反应都必须建立在对全面、准确和及时的信息基础上。(快吃慢,智能手机)p 智能型企业表现为反应迅速、适应顾客变化的需要和采取正确的顾客解决方案。(随需应变,需求拉动)数据p 数据是可以记录、通信和能识别的符号,它通过有意义的组合来表达现实世界中的某种实体(具体对象、事件、状态或活动)的特征。p 商务智能技术可以分析结构化数据(数字、符号等)、半结构化数据(简历等)以及非结构化数据(音频、视频等)、静态的历史数据和动态数据流等各种类型的数据。 信息:有用的数据SenderReceiver处理数据信息知识一个人的垃圾

18、(数据)是另一个人的财富(信息)Data endowed with relevance and purpose(例如 180,70)信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。数据 是信息的载体, 信息是对数据的解释。决策离不开信息p 同一事物的信息对于不同的个人或群体具有不同的意义。信息的效用在于对决策的影响(例如,电话号码)。高层决策、中层管理、基层运营都要决策。p 越来越多的人从事与信息有关的工作,信息产业将成为全球最大产业。首席信息官 CIO (Chief Information Officer) 成为企业继 CEO、CFO之后又一重要职位。p70% of emplo

19、yee time spent searching for relevant information知识p Information from the human mind (includes reflection, synthesis),知识是对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。p 事实性知识和经验知识(隐性和显性,如企业文化等)。p 洞察力(insight)- 饥饿营销p Requires reflection and synthesisp Difficult to structure, capture p Often tacit信息和知识隐藏在数据中p 商务智能要求有一个

20、坚固、可靠的大型数据库作后盾,建立这样一个数据库的任务是极其艰巨的。数据的质量问题也是令人头疼而又不可以掉以轻心的。p 虽然数据是宝贵的财富,然而许多公司并不能充分利用这种财富,因为信息隐藏在数据中,并不易识别。p 为了在竞争中占得优势地位,必须识别和应用隐藏在所收集的数据中的信息。(例如:股市信息)挖掘管理就是决策决策需要信息,更离不开知识。知识更多地表现为经验学习的结晶。学习的过程是不断地对信息加工处理。信息的收集、加工、传输与利用贯穿着决策各阶段的工作过程。信息已成为企业经营中重要性仅次于人才的第二大要素。(固定资产贬值,人才信息创造价值,大学固定资产最多为310亿)决策=信息+经验+冒

21、险(缺一不可)商务智能是对企业信息的科学管理。决策需要信息与知识情报阶段:确定问题设计阶段:找出解决方案选择阶段:选出解决方案实施阶段:实施方案返回情报阶段返回设计阶段返回选择阶段决策过程的四个阶段决策的过程发现那些需要引起注意的征兆并加以解释, 如 销售滑坡、生产成本猛涨、老顾客对新产品的需求、新竞争对手带来的威胁等。最优 方案由多种因素决定,如成本、实施的难易程度、对员工的要求、方案实施的时间顺序等。执行选中的方案,检测实施的结果,并作出必要的调整。商务智能p 商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。p 商务智能不是通常的业务处理。它的目标是如何更快、更容易地做更好的决策。p IBM商务智能解决方案远远不只是数据和技术的组合,BI帮助用户获得正确的数据,发现它的价值,并共享价值。商务智能如何创造知识和价值客户智能是商务智能的重要组成p 客户智能不仅包括了客户知识-客户的消费偏好(爱奇艺广告)、喜欢选用的接触渠道(电话推销,植入广告)、消费行为特征等等许多描述客户的对话、观察知识的生成,而且更强调了客户知识在企业中的分发、使用(价值共创,微博互动),直到产生客户智能。谢谢! 金 融 智 能

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(金融智能(2)-数据可视化与数据化决策课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|