第10章-数据可视化课件.pptx

上传人(卖家):三亚风情 文档编号:3407910 上传时间:2022-08-28 格式:PPTX 页数:22 大小:1.48MB
下载 相关 举报
第10章-数据可视化课件.pptx_第1页
第1页 / 共22页
第10章-数据可视化课件.pptx_第2页
第2页 / 共22页
第10章-数据可视化课件.pptx_第3页
第3页 / 共22页
第10章-数据可视化课件.pptx_第4页
第4页 / 共22页
第10章-数据可视化课件.pptx_第5页
第5页 / 共22页
点击查看更多>>
资源描述

1、第10章 数据可视化目 录1数据可视化概述数据可视化概述可视化工具介绍可视化工具介绍数据可视化的未来数据可视化的未来23数据可视化,是关于数据视觉表现形式的科学技术研究。可视数据可视化,是关于数据视觉表现形式的科学技术研究。可视化技术是利用计算机图形学及图像处理技术,将数据转换为图化技术是利用计算机图形学及图像处理技术,将数据转换为图形或图像形式显示到屏幕上,并进行交互处理的理论、方法和形或图像形式显示到屏幕上,并进行交互处理的理论、方法和技术。数据可视化可以通过丰富的视觉效果,把数据以更直观技术。数据可视化可以通过丰富的视觉效果,把数据以更直观生动,更容易理解的方式呈现给用户,可以更好地提升

2、数据分生动,更容易理解的方式呈现给用户,可以更好地提升数据分析的效率和效果。析的效率和效果。数据可视化是大数据分析的最后环节,也是非常关键的一个环数据可视化是大数据分析的最后环节,也是非常关键的一个环节。节。1、数据可视化基本概念、数据可视化基本概念数据通常是比较枯燥的,人们对于大小、颜色、图形等会更加数据通常是比较枯燥的,人们对于大小、颜色、图形等会更加具有兴趣。数据可视化主要是借助于图形化手段,清晰有效地具有兴趣。数据可视化主要是借助于图形化手段,清晰有效地传达与沟通信息。传达与沟通信息。数据可视化技术主要包括以下几个基本概念:数据可视化技术主要包括以下几个基本概念:(1)数据空间:是由)

3、数据空间:是由n维属性和维属性和m个元素组成的数据集所构成个元素组成的数据集所构成的多维信息空间;的多维信息空间;(2)数据开发:是指利用一定的算法和工具对数据进行定量的)数据开发:是指利用一定的算法和工具对数据进行定量的推演和计算;推演和计算;1、数据可视化基本概念、数据可视化基本概念(3)数据分析:指对多维数据进行切片、切块、旋转等动作)数据分析:指对多维数据进行切片、切块、旋转等动作剖析数据,从而能从多角度多侧面观察数据;剖析数据,从而能从多角度多侧面观察数据;(4)数据可视化:是指将大型数据集中的数据以图形图像形)数据可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和

4、开发工具发现其中未知信息的处式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。理过程。可视化技术应用标准应该包含以下四个方面:可视化技术应用标准应该包含以下四个方面:(1)直观化。将数据直观、形象的呈现出来。)直观化。将数据直观、形象的呈现出来。(2)关联化。突出的呈现出数据之间的关联性。)关联化。突出的呈现出数据之间的关联性。(3)艺术性。使数据的呈现更具有艺术性,更加符合审美规)艺术性。使数据的呈现更具有艺术性,更加符合审美规则。则。(4)交互性。实现用户与数据的交互,方便用户控制数据。)交互性。实现用户与数据的交互,方便用户控制数据。数据可视化技术的基本思想,是将数据中每一个数

5、据项作为数据可视化技术的基本思想,是将数据中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。观察数据,从而对数据进行更深入的观察和分析。2、数据可视化的发展历程、数据可视化的发展历程图图10-1 10-1 经度差异统计图经度差异统计图图图10-2 10-2 反映霍乱患者分布于水井分布的地图反映霍乱患者分布于水井分布的地图图图10-3 10-3 南丁格尔的南丁格尔的“鸡冠花图鸡冠

6、花图”Excel统计图形如下图所示。统计图形如下图所示。二、信息图表工具二、信息图表工具1、EChartsECharts,Enterprise Charts的缩写,商业级数据图表,百度的的缩写,商业级数据图表,百度的一个开源数据可视化工具,纯一个开源数据可视化工具,纯 Javascript 的图表库的图表库2、D3D3的全称是的全称是Data Driven Document,一个用于实时交互式大,一个用于实时交互式大据可视化的据可视化的js库。库。由于这不是一个工具,由于这不是一个工具,所以在使用它来处理所以在使用它来处理数据之前,需要对数据之前,需要对Javascript有一个很好的理解。有

7、一个很好的理解。JavaScript文文件的后缀名通常为件的后缀名通常为.js,故,故 D3 也常使用也常使用 D3.js的称呼。的称呼。D3 提供提供了各种简单易用的函数,将生成可视化的复杂步骤精简到了几了各种简单易用的函数,将生成可视化的复杂步骤精简到了几个简单的函数,只需要输入几个简单的数据,就能够转换为各个简单的函数,只需要输入几个简单的数据,就能够转换为各种绚丽的图形。种绚丽的图形。3、TableauTableau是桌面系统中相对简单的商业智能工具软件,适合企业是桌面系统中相对简单的商业智能工具软件,适合企业进行日常数据报表和数据可视化分析工作。进行日常数据报表和数据可视化分析工作。

8、Tableau可以与可以与Amazon AWS,MySQL,Hadoop,Teradata和和SAP协作,使协作,使之成为一个能够创建详细图形和展示直观数据的多功能工具。之成为一个能够创建详细图形和展示直观数据的多功能工具。这样高级管理人员和中间链管理人员能够基于包含大量信息且这样高级管理人员和中间链管理人员能够基于包含大量信息且容易读懂的容易读懂的Tableau图形作出基础决策。图形作出基础决策。三、地图工具三、地图工具1、Modest MapsModest Maps是一个小型、可扩展、交互式的免费库,提供了是一个小型、可扩展、交互式的免费库,提供了一套查看卫星地图的一套查看卫星地图的API

9、,只有,只有10KB大小,可以用它创建在线大小,可以用它创建在线地图,设计者可以按照自己的设想定制,满足用户需求。地图,设计者可以按照自己的设想定制,满足用户需求。Modest Maps是网站中整合地图应用的理想选择。是网站中整合地图应用的理想选择。三、地图工具三、地图工具2、Leaflet Leaflet 是一个为建设移动设备友好的互动地图,而开发的现代是一个为建设移动设备友好的互动地图,而开发的现代的、开源的的、开源的 JavaScript 库,具有开发人员开发在线地图的大部库,具有开发人员开发在线地图的大部分功能。分功能。Leaflet 设计坚持简便、高性能和可用性好的思想,在设计坚持简

10、便、高性能和可用性好的思想,在所有主要桌面和移动平台能高效运作,支持插件扩展。所有主要桌面和移动平台能高效运作,支持插件扩展。四、高级语言分析工具四、高级语言分析工具数据可视化并非是一门简单的学科,可以由编程语言根据规则实数据可视化并非是一门简单的学科,可以由编程语言根据规则实现的。接下来简单介绍一些实现数据可视化的编程性语言。现的。接下来简单介绍一些实现数据可视化的编程性语言。(1)R R是用于统计分析、绘图的语言和操作环境。是用于统计分析、绘图的语言和操作环境。R是属于是属于GNU系统系统的一个自由、免费、源代码开放的软件,是一个用于统计计算和的一个自由、免费、源代码开放的软件,是一个用于

11、统计计算和统计制图的优秀工具。其主要功能包括数据存储和处理系统,数统计制图的优秀工具。其主要功能包括数据存储和处理系统,数组运算工具(强大的向量、矩阵运算方面),完整连贯的统计分组运算工具(强大的向量、矩阵运算方面),完整连贯的统计分析工具,优秀的统计制图功能,简便而强大的编程语言,可操纵析工具,优秀的统计制图功能,简便而强大的编程语言,可操纵数据的输入和输出,可实现分支、循环和用户可自定义功能。数据的输入和输出,可实现分支、循环和用户可自定义功能。(2)PythonPython既有通用编程语言的强大功能,也有特定领域脚本语言既有通用编程语言的强大功能,也有特定领域脚本语言(比如(比如 MAT

12、LAB 或或 R)的易用性。)的易用性。Python 包含数据加载、统包含数据加载、统计分析、自然语言处理、图像处理、可视化分析等各种功能的库。计分析、自然语言处理、图像处理、可视化分析等各种功能的库。这个大型工具箱为数据科学家提供了大量的通用功能和专用功能。这个大型工具箱为数据科学家提供了大量的通用功能和专用功能。本教程在第本教程在第11章详细介绍。章详细介绍。(3)WekaWeka是一款免费的、基于是一款免费的、基于Java环境的、开源的机器学习以及数环境的、开源的机器学习以及数据挖掘软件,不但可以对数据进行预处理,分类,回归、聚类、据挖掘软件,不但可以对数据进行预处理,分类,回归、聚类、

13、关联规则及数据分析,还可以在新的交互式界面上进行可视化。关联规则及数据分析,还可以在新的交互式界面上进行可视化。1、数据可视化面临的挑战、数据可视化面临的挑战随着大数据技术的日益发展,数据可视化技术也日渐成熟,但随着大数据技术的日益发展,数据可视化技术也日渐成熟,但还是面临着一些挑战:还是面临着一些挑战:(1)视觉噪声。在分析的数据集中,大多数数据具备很强的相)视觉噪声。在分析的数据集中,大多数数据具备很强的相关性,不能将其分离作为独立对象显示。关性,不能将其分离作为独立对象显示。(2)大型图像感知。数据可视化不止受限于设备硬件条件,也)大型图像感知。数据可视化不止受限于设备硬件条件,也受限于

14、现实世界的感受。受限于现实世界的感受。1、数据可视化面临的挑战、数据可视化面临的挑战(3)信息丢失。减少可视数据集的方法可行,但会丢失信息。)信息丢失。减少可视数据集的方法可行,但会丢失信息。(4)高性能要求。静态可视化对性能要求不高,但动态可视化)高性能要求。静态可视化对性能要求不高,但动态可视化对性能要求较高。对性能要求较高。(5)高速图像变换。用户不能对数据强化变化后迅速做出反应。)高速图像变换。用户不能对数据强化变化后迅速做出反应。1、数据可视化面临的挑战、数据可视化面临的挑战(3)信息丢失。减少可视数据集的方法可行,但会丢失信息。)信息丢失。减少可视数据集的方法可行,但会丢失信息。(

15、4)高性能要求。静态可视化对性能要求不高,但动态可视化)高性能要求。静态可视化对性能要求不高,但动态可视化对性能要求较高。对性能要求较高。(5)高速图像变换。用户不能对数据强化变化后迅速做出反应。)高速图像变换。用户不能对数据强化变化后迅速做出反应。2、数据可视化技术的发展方向、数据可视化技术的发展方向数据可视化技术发展方向主要表现为以下三个方面:数据可视化技术发展方向主要表现为以下三个方面:(1)数据可视化技术与数据挖掘紧密结合。)数据可视化技术与数据挖掘紧密结合。(2)数据可视化技术与人机交互紧密结合。)数据可视化技术与人机交互紧密结合。(3)可视化与大规模、高维度、非结构化数据高度融合。)可视化与大规模、高维度、非结构化数据高度融合。谢 谢

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第10章-数据可视化课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|