1、1信息可视化检索2什么是信息可视化?l信息可视化就是利用计算机支撑的、交互的、对抽象数据的可视表示,来增强人们对些抽象信息的认知。l 可视化是这样一个过程,它将信息转化为一种视觉形式,充分利用人们对可视模式快速识别的自然能力去进行观测、浏览、识别和理解信息。在这个过程中,人们利用计算机系统从屏幕上观察交互图形、图像并通过可视模型处理信息。l信息可视化的任务在于搜索、发现信息之间的关系和信息中隐藏的模式。3信息可视化参考模型4信息可视化检索的概念l信息可视化检索是指把文献信息、用户提问、各类情报检索模型以及利用检索模型进行信息检索的过程中不可见的内部语义关系转换成图形,在一个二维或三维的可视化空
2、间中显示出来。5信息可视化检索的特点l检索过程透明化。l检索结果输出高效性。l更为有效的结果集排序机制。l有效的用户反馈机制。l检索过程的连续性、可逆性。6整个可视化检索的过程世界计算计算法匹配数据转换地图图片用户解释数据和模型的有效性检测数据预处理产生图像的系统化方法图像处理技术7为什么要研究可视化信息检索为什么要研究可视化信息检索 2020世纪世纪9090年代,因特网的迅速发展与年代,因特网的迅速发展与普及为信息检索开创了新局面。用户可以普及为信息检索开创了新局面。用户可以在浏览器上直接获取信息而无需知道繁琐在浏览器上直接获取信息而无需知道繁琐的检索命令和复杂的命令格式。然而,普的检索命令
3、和复杂的命令格式。然而,普通浏览器是一种获取信息的有效途径,但通浏览器是一种获取信息的有效途径,但不是信息检索的最佳方法。不是信息检索的最佳方法。常规浏览器在因特网上检索信息使人常规浏览器在因特网上检索信息使人们处于两难的境地:一方面看到因特网是们处于两难的境地:一方面看到因特网是最大的信息资源网络,到处都是信息;另最大的信息资源网络,到处都是信息;另一方面,用户所需的信息又很难找到。一方面,用户所需的信息又很难找到。8目前的网络检索系统在与用户交互上存在许多不足:l检索界面单一l缺乏对相关文档间关系的揭示机制l没有从用户的信息获取行为角度出发提供多种结果操作功能l目前的检索工具并不提供具备满
4、足探索型检索需求的结果文档l没有考虑到用户的检索需求将随着检索结果的浏览而发生改变l忽略了人在浏览选取检索出的结果文档时的交互作用9l 于是人们开始研究可视化技术、设计智能代理、进行网络信息资源的数据挖掘。在实践中人们深切的认识到:利用可视化、智能化的检索技术势在必行。同时可以看到信息检索的可视化、智能化必将信息检索技术推向一个崭新的阶段。10www信息检索的可视化n基于链接关系的检索 基于链接关系的浏览可视化的实现是由用户提供一个入口网址,把与该网址有链接关系的web网页可视化地显示出来,这种方法充分利用了web本身的以节点代表网页、以连线代表链接的图状结构可视化显示。目前在基于链接关系的浏
5、览界面可视化中,根据显示的图状结构可分为层次状和网状两大类型。层次状的代表有双曲线浏览技术(Hyperbolic Tree)和圆锥树(Cone Tree)。网状结构的代表是由Touchgraph提供的java小程序Google Browser。11双曲线浏览(Hyperbolic Tree)技术 双曲线浏览技术在基于双曲线的圆形平面区域内显层次结构信息,在相同的空间里,采用双曲线浏览技术显示的信息是普通二维技术的10倍。根在树的中间向外呈扇形扩展,当用户选择下游节点时,该节点被推到中心,同时放大其视图及细节信息。这种技术能帮助用户从整体上理解数据资源,并通过提供感兴趣部分的细节信息,使用户可以
6、对指定的信息进行深入的分析。双曲线树技术被用于开发浏览器、网站地图以及其他针对大型层次结构信息的可视化工具。特别适合浏览图库、文件系统、数据仓库、Web信息资源及其空间链接结构所包含的数据。12圆锥树(Cone Trees)技术 Cone Trees使用三维空间来描述等级信息,根节点或者放置在空间(锥形树)的顶端,或者放置在空间(凸轮树)的最左端,子节点均匀地分布在根节点的下面或者右面的锥形延展部分。节点的标识有一部分是透视的,这是为了表明节点间的空间分布,且不易于造成视觉上的混乱。Cone Trees不是静态的显示,当用户用鼠标点击了某个节点,这个选中的节点会高亮度显示,同时这个树结构发生旋
7、转,将该节点旋转到图形的前方。一个完整的Cone Trees图形能够持续旋转,使得用户可以观察大型等级结构,理解其中的关系。13谷歌浏览器谷歌浏览器Google BrowserGoogle Browser 它可以通过浏览Google的数据库,绘出以某一站点为中心的所有相关联的站点的关联图。由用户输入起始URL来指定浏览起点,然后由Google将与该URL有链接关系的网页搜索后返回,根据链接关系以互相连接的网状图显示,组成了一个事实上的Web地形图。以不同的颜色及连线宽度的变化来代表网站的相似度,点击某一站点的提示小图标,可以看到其基本信息和在Google中的目录分类。这个关联图是动态的,可以实
8、现互动,在双击某一站点后,过几秒,它就像一个巨大的蜘蛛开始缓慢地运动,绘制出以此站点为中心派生出来的新的关联图,实现动态浏览。14基于SOM的检索 基于SOM(self organizing map)的浏览界面是一种地图概念式的图形接口。SOM以直观的、图形化的方式来显示文本信息中的重要主题概念,被认为是组织大信息空间的最有效算法。SOM的目标在于把输入数据或信号的各种特征加以抽象和组织,把它们归并到不同的类目中,并用简单的几何关系表示出来。15www信息检索的可视化lSOM原理图 Input PatternInput LayerOutput Layer16基于分类的主题浏览 为了能让用户在浏览过程中快速找到所需要的信息,可将信息按其包含的语义内容分类,指明信息资源方位与联系,缩小用户浏览的范围。如Antarctic System公司开发的Visual Net,它以可浏览的主题地图来显示各种信息(Office文档、Web页、Email等),并可将如文档类型、日期、文件大小等可以快速帮助用户定。位所需要信息的元数据信息显示出来,用户通过点击地图上的相关类目来发现信息。它已广泛运用于图书馆、政府部门、网络信息提供者及搜索引擎。17
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。