1、微微博轨迹可视化与可视分析博轨迹可视化与可视分析 20162016年年5 5月月2828日日我理解的可视化表达性一图胜千言有效性传递信息,获取知识数据驱动的设计需要领域专家的紧密合作交互性支持迭代的探索直观的用户反馈自然人机界面美观性没有人拒绝美2拿破仑进军图 Tobler et al.1987 时空可视分析 霍乱可视化 空间分布 空间关联 提出假设 验证3Snow 1854霍乱可视分析时空可视分析 近期4直接可视化 Wang et al.2011时空立方体 Kraak 2003聚合 Scheepens et al.2011基于事件检测Andrienko et al.2008社交媒体可视分析
2、数据 受众 可视化形式 分析流程 结果5社交媒体数据(以微博为例)6 用户 微博 时间 地点 内容 图片、视频等 转发行为大覆盖面与大量人群密度单人行为轨迹可视化单人行为轨迹特征比较10单人轨迹可视分析,我们可以发现不同的人的行为规律,包括(a)学者、(b)飞行员、(c)旅行者,以及一些人展示出的明显的地点周期行为特征(d)。单人行为轨迹特征交互探索11省级层次常住地:上海老家:东北市级层次活跃于浦东、杨浦与徐汇区域层次复旦大学张江校区:食堂、宿舍、教学楼、实验室等个人行为探索小结12 受众:每个拥有微博轨迹的人 用途:回忆过去的经历 探索形成的规律 分享历史的足迹 如何从个人行为轨迹,进一步
3、地探索群体行为特征?对人群移动行为的可视分析与探索 两周内在全国的分布简介 我们提供了一套可视分析系统,从微博轨迹中探索语义信息 分类的移动行为 不同的交通工具 不同的旅途 频繁访问模式 旅途的关键词 挑战 由于轨迹的稀疏性与非均匀采样的特征,导致了数据中含有较大的不确定性不确定性模型基于混合高斯模拟的不确定性模型目标:获得移动的语义理论基础 每种交通工具的时间花费是一个分布 在交通领域,正态分布可以进行时间花费的建模 并且不同的交通方式的时间花费分布是不同的输入 移动数据的时间花费输出 类别信息,并且包含了置信区间 通过文本进行语义的理解不确定性模型 案例说明往返北京和成都的移动行为1)原始
4、的时间花费分布(a)(a)不确定性模型 案例说明往返北京和成都的移动行为1)原始的时间花费分布(a)2)过滤异常值(时间花费小鱼1小时、大于60小时)(a)(b)不确定性模型 案例说明往返北京和成都的移动行为1)原始的时间花费分布(a)2)过滤异常值(时间花费小鱼1小时、大于60小时)3)用模型的不同参数得到的结果 k=3,4(a)(b)(c)(d)不确定性模型 案例说明往返北京和成都的移动行为 1)原始的时间花费分布(a)2)过滤异常值(时间花费小鱼1小时、大于60小时)3)用模型的不同参数得到的结果 k=3,4 4)研究(d)中的四个峰值 5)用外部数据,包括飞机、火车时刻表等进行辅助验证
5、 P1:坐飞机 P2:飞机延误 P3:坐火车 P4:延时高,无法判断(a)(b)(c)(d)Top 30 Keywords distributions in each peak of(d)可视分析系统系统包含如下五个子部分:1)时间轴视图,2)以地图为基础的总体工作区域;3)时空矩阵视图 4)细节移动轨迹视图 5)不确定性模型视图;6)参数控制视图可视分析流程 1)数据预处理可视分析流程 2)时空探索,包含过滤、区域选择等可视分析流程 3)动态聚集,包括空间、事件与属性上的聚集可视分析流程 4)细节分析,利用不确定性模型进行探索可视分析流程 5)语义探索可视分析流程 6)迭代循环可视分析可视分
6、析流程(0)数据预处理 计算数据统计信息 过滤无关数据 机器账号、服务账号 GPS跳跃数据 低频率使用地理信息的用户(不确定性大)可视分析流程(1)时空探索 时空视图 基于DB-Scan自动检测POI,用户可以手动修改调整 POI对应的时空分布(外圈)关键词视图Position of Interest(POI)可视分析流程(1)时空探索可视分析流程(2)属性筛选 基于属性空间的分析 时间花费与移动距离的关系 提供不同的刷选方式,来辅助用户进行交互31ST-Matrix视图可视分析流程(3)-基于不确定性建模的细节分析视觉设计 X轴:1维的空间投影 Y轴:时间花费(上)与空间距离(下)从中心向两
7、边发散细节分析 提供了聚合、细节、密度图选项、以及提供了刷选与关键词获取的功能 选出的轨迹作为不确定性模型的输入ST Detail View 展示地点、时间花费、移动距离的关系可视分析流程(3)-基于不确定性建模的细节分析可视分析流程(3)-基于不确定性建模的细节分析 基于不确定性模型的过滤 每个快照代表两地间移动的时间花费 计算不同的分布,以及相应的置信区间 通过用户进一步调节(a)ST Detail View 聚合模式,(b)关键词刷选(c)ST Model View 基于置信区间的筛选可视分析流程(4)-语义探索案例分析:台湾旅行宏观分析 从多个口岸进入台湾(北京、上海、厦门、广州等)(
8、a)在台湾主要的目的地包括台北、花莲、高雄、垦丁等等(b,c)逆时针的旅行路线占大多数(d)在具体景区,对夜市的探索是多数大陆游客不可错过的一个环节(d)案例分析:台湾旅行(2)移动轨迹特征(e1)高雄到垦丁与花莲到台北的路径时间较为可信,平均用时为4-8小时之间 垦丁到花莲的平均时间花费为24小时,意味通常人们可能会去其他城市或者在垦丁或花莲停留、旅行旅行(停留)时间假设(f2)高雄-垦丁(1天)垦丁-台北(2天)台北-高雄(3天)(e)(f)移动区域对的属性特征可视分析:(1)时间花费的分析(2)属性空间的分析(3)空间移动行为可视分析小结 语义探索针对稀疏轨迹的交互式可视分析视觉的反馈机
9、制分析的迭代循环探索移动群体的规律Visual Analytics Visual analytics is the science of analytical reasoninganalytical reasoning facilitated by interactive visual interfaces.C Computational and theory-based tools omputational and theory-based tools I Innovative interactive techniques and nnovative interactive techniqu
10、es and visual representations visual representations The goals is The goals is to enable human-information discourse.The design of the tools and techniques is based on cognitive,design,and perceptual principles.40Thomas et al.2005Visual Analytics Suitable situation Synthesize information and derive
11、insight from massive,dynamic,from massive,dynamic,ambiguous,and often conflicting data;ambiguous,and often conflicting data;detect the expected and discover the unexpecteddiscover the unexpected;provide timely,defensible,and understandable assessmentsunderstandable assessments;and communicatecommuni
12、cate assessment effectively for action.41Visual Analytics Understanding past and present situationspast and present situations quickly,as well as the trendstrends and eventsevents that have produced current conditions Identifying possible alternative futurespossible alternative futures and their war
13、ning signs MonitoringMonitoring current events for emergence of warning signs as well as unexpected eventsunexpected events Determining indicators of the intent of an action or an individual42The Value of Visualization/Visual Analytics Narrative Story telling Public needs to understand the data Info
14、rmation could better spread Explorative Analysis A platform for building up hypotheses,testing and refinement Maximize the human capability Unknown pattern exploration Fuzzy situation with uncertainty Information organization and semantic deriving43Geo-tagged social media data analysis Humans as sen
15、sors44q1q2 社交网络可视化45社交媒体中的关系数据可视化。(a)点边图可视化,直观展示社群关系Heer2005。(b)矩阵可视化,减少点边图中的边遮挡问题Henry2006。(c)层次结构可视化,展现不同社群间传播的结构特征Viegas2013。(d)多维属性可视化,利用交互探索社交网络中各个维度的关系Bezerianos2010。(e)动态图可视化,展示时变的社交网络关系Federico2011。(f)故事时间线可视化,更加直观地突出时间维度的变化Reda2011。(g)其他新颖可视化形式,本例是利用地图的隐喻构建动态网络结构并保持稳定性Hu2012。动态信息传播可视化46社交媒体
16、中的话题与情感可视化,基于河流隐喻的可视化形式。(a)LeadLine展现事件与话题随时间的变化Dou2012。(b)考虑了大量的话题随着时间变化,RoseRiver将其动态划分层次,并展示了不同细节层次的话题随着时间的变化Cui2014。(c)话题的竞争可视化,展现不同群体如何在不同的话题中参与与转发,导致不同的话题的更迭Xu2013。(d)EvoRiver,展现了不同话题的竞争与合作关系Sun2014。(e)情感可视化,将用户的八种情感随着时间的变化展示并辅以交互探索Zhao2014。(f)OpinionFlow,观察不同人群对于不同话题的态度,以及话题如何在这些人之间传播与扩散Wu2014。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。