ImageVerifierCode 换一换
格式:PPT , 页数:85 ,大小:1.17MB ,
文档编号:5682737      下载积分:20 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-5682737.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(ziliao2023)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(信息管理学基础-第6章-信息检索课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

信息管理学基础-第6章-信息检索课件.ppt

1、信息检索主讲人:孙祥主讲人:孙祥 经济信息管理教研室经济信息管理教研室Page 2第六章第六章 信息检索信息检索l信息检索的基本概念与原理信息检索的基本概念与原理l信息检索的发展历程信息检索的发展历程l信息检索的技术与方法信息检索的技术与方法l信息检索的步骤与策略信息检索的步骤与策略l网络信息检索网络信息检索Page 3l内容提要内容提要 本章介绍了信息检索的基本概念和原理,并以信息技术发展为主线,梳理了信息检索的发展历程及阶段,讨论了信息检索的步骤和策略的制定,以及信息检索语言和信息检索效率评价,同时介绍了网络信息检索的特点及网络检索工具。第六章第六章 信息检索信息检索Page 4l学习重点

2、学习重点 掌握信息检索的基本概念和原理,掌握信息检索的步骤和策略,熟悉信息检索的发展历程和网络信息检索的特点。第六章第六章 信息检索信息检索56.1 信息检索的基本概念和原理6.1.1 信息检索的含义 为什么要学习信息检索,掌握信息检索工具的使用?可以充分发挥人类知识宝库的作用,有利于开发智力资源;协助有关人员选择正确的科技策略,提高效率、减少人力或投资方面的浪费;可以节省科技人员的宝贵时间;促进专业学习。信息检索的基本概念和原理信息检索的基本概念和原理6信息检索的概念(广义)将信息按一定的方式组织和存储起来,并根据用户的需要检出所需信息的过程。(狭义,单从信息用户的角度)从已存储的信息资源中

3、找出与用户提问相关的文献、知识、事实、数据的逻辑运算和技术操作过程。信息检索的基本概念和原理信息检索的基本概念和原理7信息检索的本质 匹配,将用户提问与信息集合中的数据进行比较和选择的结果。信息检索的基本概念和原理信息检索的基本概念和原理 提问(检索)语言 文献标识 语言匹配匹配8信息检索的基本特征u有确定的目标;u有一个可能的信息解的集合;u有一定的线索可依;u搜索的过程是针对一定的目标、遵循一定的线索、不断缩小搜索范围的求解过程。信息检索的基本概念和原理信息检索的基本概念和原理9信息检索的两个子系统信息检索的基本概念和原理信息检索的基本概念和原理106.1.2 信息检索的分类 按照内容划分

4、u文献检索 (Document Retrieval)u数据检索 (Data Retrieval)u事实检索 (Fact Retrieval)信息检索的基本概念和原理信息检索的基本概念和原理11文献检索 文献检索是以文献为检索对象的一种检索,凡是查找某一主题、某一学科、某一著者的有关文献均属于文献检索的范畴。文献检索是相关性检索,即检索系统不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考。如:查找经济信息处理流程方面的相关论文.信息检索的基本概念和原理信息检索的基本概念和原理12注意:信息检索(Information Retrieval)与文献检索(Document Retri

5、eval)是两个不同的概念,文献检索是信息检索的一种最基本的、最主要的形式。信息检索的基本概念和原理信息检索的基本概念和原理13数据检索(Data Retrieval):是以数据为检索对象,从已收藏数据资料中查找出特定数据的过程。数据检索是一种确定性检索,系统要直接回答用户提出的问题,即直接提供用户所需要的确切的数据。如:某种材料的电阻;某变压器的参数;化学分子式、数据图表等。信息检索的基本概念和原理信息检索的基本概念和原理14事实检索(Fact Retrieval)事实检索即通过对信息集合中已有的基本事实或数据进行处理(逻辑推理),然后得出新的(即未直接存入信息集合中的)事实的过程。如:某产

6、品是哪个厂家生产,第一颗人造卫星是什么时候升空的,按高考分数划分,每个段的新生有多少人?信息检索的基本概念和原理信息检索的基本概念和原理15l 数据和事实检索是要检索出包含在文献中的具体情报;l 文献检索则是要检索出包含所需情报的文献。信息检索的基本概念和原理信息检索的基本概念和原理16按照信息的组织方式划分全文检索多媒体检索超媒体检索依信息存储与检索方式划分手工检索计算机检索信息检索的基本概念和原理信息检索的基本概念和原理17信息检索的特性信息检索的相关性 相关性表明用户是否认为一文献与一提问吻合。信息检索的不确定性 标引的不确定性是指不同标引员在给同一篇信息对象进行标引时会选用不同的标引词

7、,即标引词选用的不一致性。检索词选用的不确定性是指候选检索词集不止一个,检索过程具有试探性。信息检索的逻辑性 检索语言、检索策略(处理信息检索提问的逻辑与查找步骤的科学安排)信息检索的基本概念和原理信息检索的基本概念和原理186.1.3 信息检索的基本原理 对信息资源集合与信息需求集合的匹配和选择。一方面是用户的信息需求,一方面是组织有序的文献信息集合,检索就是从用户特定的信息需求出发,对特定的信息集合采用一定的方法、技术手段,根据一定的线索与规则从中找出相关的信息。匹配有其匹配标准,这里涉及到两者一致性、相关度等问题,按一定的标准筛选出符合要求的信息。信息检索的基本概念和原理信息检索的基本概

8、念和原理196.1.4 信息检索的模型布尔逻辑检索模型向量空间检索模型概率检索模型模糊检索模型信息检索的基本概念和原理信息检索的基本概念和原理20信息检索的模型 信息检索的模型,就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和抽象,表述为某种数学公式,再经过演绎、推断、解释和实际检验,反过来指导信息检索实践。信息检索的基本概念和原理信息检索的基本概念和原理21信息检索模型的组成 (1)用户的需求表示:用户查询的获取与表示。(2)文档的表示:文档内容的识别与表示。(3)匹配机制:用户需求表示与文档表示之间的查询机制,以及它们之间相关性排序的准则和函数表示。(4)反馈修正:对

9、检索结果进行优化。信息检索的基本概念和原理信息检索的基本概念和原理22布尔检索(精确匹配检索)假设检索到的集合中,所有文档关于相关性都是等价的,也假设了相关性是二元的。对于检索评价有2种输出结果:TRUE and FALSE 查询项被描述为布尔逻辑操作符 AND,OR,NOT例 一个文档当且仅当它能够满足布尔查询式时,才将其检索出来信息检索的基本概念和原理信息检索的基本概念和原理23小例子简单查询项为“林肯”,会返回大量包含林肯汽车和林肯总统的文档。不管“林肯”这个词出现多少次,也不管上下文,所有这些文档根据布尔检索模型的排序性质都是等价的。查询项“总统AND林肯”,会返回一组同时包含这两个查

10、询词的文档查询项“总统AND林肯AND Not(汽车OR轿车)”,会去除包含“汽车OR轿车”的文档信息检索的基本概念和原理信息检索的基本概念和原理24优点简单、易于理解;能处理结构化查询,易于表示同义关系和词组;速度快。缺点严格,使用的限制性强;结果不易控制;难以进行定量比较;无法满足特殊查询。信息检索的基本概念和原理信息检索的基本概念和原理25向量空间模型 相比于布尔模型要求的准确匹配,Salton在60年代末提出的向量空间模型采用了“部分匹配”的检索策略(即:出现部分索引词也可以出现在检索结果中);这个模型对于查询与文档的相关度有较强的可计算性和可操作性,并且被广泛应用于文本检索、自动文摘

11、、关键词自动提取、文本分类等方面。信息检索的基本概念和原理信息检索的基本概念和原理26优点使得对查询向量中关键词权重的赋值成为可能;可根据相似度大小对查询结果进行排序并控制输出数量;相比布尔模型要求的准确匹配,VSM模型采用“部分匹配”检索策略。实验表明:向量空间模型比布尔模型检索效果更好。信息检索的基本概念和原理信息检索的基本概念和原理27缺点在模型中,特征项被假设为相互独立,而实际上一个文档中的特征项之间可能存着一定的联系;不能像布尔模型一样支持布尔结构化查询;基于向量空间模型的检索系统较基于布尔模型的检索系统而言,要复杂得多,在大型商业检索系统中使用较少。信息检索的基本概念和原理信息检索

12、的基本概念和原理28概率模型概率排序原则-Robertson(1977)如果一个参考检索排序系统对每个查询的反馈都是数据集中所有文档根据和用户查询的相关性概率值降序排序的结果并且其中的概率值都被尽可能精确地估计出来那么该系统对于用户的整体效果就是基于这些数据能够获得的最好结果给定一个新的文档,搜索引擎的任务是判定这个文档是否属于相关文档集合或者非相关集合。也就是说,系统应该判断文档是相关的还是非相关的,如果相关就返回文档。信息检索的基本概念和原理信息检索的基本概念和原理29优点 文档可以按照他们相关概率递减的顺序来排序。缺点开始时需要猜想把文档分为相关和不相关的两个集合,一般来说很难实际上这种

13、模型没有考虑索引术语在文档中的频率(因为所有的权重都是二值的)假设索引词独立信息检索的基本概念和原理信息检索的基本概念和原理306.2 信息检索的发展历程手工信息检索阶段 机械信息检索阶段 计算机信息检索阶段网络信息检索阶段信息检索的发展历程信息检索的发展历程316.2.1 手工信息检索阶段 信息检索起源于参考咨询工作,参考咨询工作产生的标志是1876年召开的美国图书馆协会第一届大会。1883年,波士顿公共图书馆首次设置了专职参考馆员和参考阅览室;20世纪初,多数图书馆成立了参考咨询部门,主要利用图书馆的书目工具来帮助读者查找图书、期刊或现成答案。逐渐发展到从多种文献源中查找、分析、评价和重新

14、组织信息;“索引”突破了以前的狭隘范畴,成为独立的检索工具;信息检索的发展历程信息检索的发展历程32 40年代进一步包括回答事实性咨询,编制书目、文摘,进行专题文献检索,提供文献代译等。“信息检索”从此成为一项独立的用户服务工作,并逐渐从单纯的经验工作向专业化方向发展。信息检索的发展历程信息检索的发展历程336.2.2 机械信息检索阶段机械信息检索两种基本类型机电信息检索系统光电信息检索系统 机械信息检索并没有发展信息检索语言,只是采用单一的方法对固定的存贮形式进行检索,而且过分依赖于设备,检索复杂,成本较高,检索效率和质量都不理想。信息检索的发展历程信息检索的发展历程346.2.3 计算机信

15、息检索阶段 1971年以前建立的信息检索系统,是传统的批处理检索方式。1971年以后,产生并发展的联机信息检索系统,如OCLC、Dialog在线数据库联机检索系统。信息检索的发展历程信息检索的发展历程356.2.4 网络信息检索阶段 20世纪90年代以来,产生并发展的网络信息检索阶段。信息检索的发展历程信息检索的发展历程366.3 信息检索的技术与方法信息检索技术两个发展方向:传统信息检索向全文文本、多媒体、多载体等新型信息检索的发展,在深度上提高管理和组织信息的能力;信息资源的网络化和分布化,面向互联网中海量的信息资源,在广度上提高管理和组织的能力。信息检索的技术与方法信息检索的技术与方法3

16、76.3 信息检索的技术与方法从检索手段看,信息检索分为:手工信息检索机械信息检索计算机信息检索网络信息检索信息检索的技术与方法信息检索的技术与方法386.3.1手工信息检索的技术与方法手工信息检索工具主要是各种类型的工具书。工具书是根据一定的需要,比较完备地汇集某一方面的资料,并按特定的方法加以编排,专供读者查考检索有关知识、资料、事实的书籍。据工具书的体例和功能,可分为检索型工具书、参考性工具书、词语性工具书、表谱性工具书、图录性工具书和边缘性工具书6种类型。信息检索的技术与方法信息检索的技术与方法39手工信息检索工具目录:它是图书、期刊等单位出版物外表特征的揭示和报道,它以一个完整的出版

17、或收藏单位为著录的基本单位,多按类或题名编排,强调有具体的收藏单位。是以某一“种”文献为一个记录款目。包括:国家书目、出版社目录、馆藏目录、专题目录、联合目录等。信息检索的技术与方法信息检索的技术与方法40索引:是对一组文献集合有系统的指引。一般只起指引特定信息内容及其存储地址的作用。是检索工具的辅助工具。它对文献的外表特征和内容特征用各种检索标识符(字母、数字、汉字等)进行描述,并将它们按一定的规则及排列方式组织起来,然后用文摘号来注明它在文献信息集合中的位。信息检索的技术与方法信息检索的技术与方法41文摘 它也是以“篇”为著录单元,但却是在对文献外部特征进行著录的基础上,还将文献的内容加以

18、浓缩,以最精炼最概括的文字报道文献的主题、方法和结论,并将这些外部特征和内容摘要的记录按一定顺序排列起来所形成的一种文献检索工具。它是检索工具的主体,二次文献的核心。信息检索的技术与方法信息检索的技术与方法42文摘按其目的和用途可分为:指示性文摘 这是旨在把原文的主题范围、目的和方法概括的指示给读者的一种文摘,帮助读者判断原文是否与自己相关以及是否需要阅读原文。字数一般限制在几十个字(中文50100个字,外文3050个词),也有人将其称为简介或简介性文摘。阅读指示性文摘不能代表原文。信息检索的技术与方法信息检索的技术与方法43l 报道性文摘 又称叙述性文摘,它是用来概括原文的内容要点,向读者提

19、供原文中的定量信息和定性信息的一种文摘,基本能反映原文的技术内容,一般数字为200300字(西文250个实词)。l 评论性文摘 评论性文摘插入有文摘员个人的看法或分析,评论性文摘的价值如何,主要取决于文摘员的专业水平。信息检索的技术与方法信息检索的技术与方法44年鉴 年鉴是以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书。汇辑一年内的重要时事、文献和统计资料,按年度连续出版的工具书。它具有资料权威、反应及时、连续出版、功能齐全的特点。属信息密集型工具书。信息检索的技术与方法信息检索的技术与方法45手册 手册是汇集某一学科或某一主题等需要经常查考的资料,供读者随时翻检的工

20、具书。手册的类型:数据性手册条目性手册图表性手册综合性手册信息检索的技术与方法信息检索的技术与方法46百科全书 百科全书是概要记述人类一切知识门类或某一知识门类的工具书。信息检索的技术与方法信息检索的技术与方法47手工信息检索工具的排检技术 字顺排检技术:将检索工具的内容按字、词的一定顺序或规律,有系统地组织排列起来的技术。分类排检技术:将信息素材按学科或事物性质系统地加以排列。主题排检技术:以规范化的自然语言为标识符号来标引信息内容的排检技术。时序排检技术:按时间的顺序组合信息素材的技术,多用于编制年表、年谱等检索工具。如:国内外大事记 地序排检技术:按一定时期的行政区域来排列信息素材的技术

21、。如:中国名胜词典 信息检索的技术与方法信息检索的技术与方法48手工信息检索方法顺查法:时间上,由远至近,查全率高,费时费力。倒查法:时间上,由近至远,查准率高,漏检率高。抽查法:集中于学科的兴旺阶段,检索效率高。追溯法:A.一次文献参考文献一次信息参考文献 由近至远B.一次文献引用该一次信息的文献新的一次文献 实际是由“远近”越查文献越新,扩大信息源,效率低,检全率低,漏检率高。信息检索的技术与方法信息检索的技术与方法49循环法:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找。信息检索的技术与方法信息检索的技术与方法506.3.2 机械信息检索的技术与方

22、法 机电信息检索系统 继手检穿孔卡片之后,出现了机检穿孔卡片和选卡机。这就形成了机电信息检索系统。光电信息检索系统 主要是以缩微胶卷(片)检索方式出现的。缩微胶卷(片)的检索方式大致可以分为两种类型:寻址检索方式 编码检索方式 信息检索的技术与方法信息检索的技术与方法516.3.3 计算机信息检索的技术与方法联机信息检索 信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程。优点:检索速度快;检索范围广而全面;检索途径多、质量高;检索内容新、实时性强;检索辅助功能完善、使用方便,检索结果输出方式灵活、实用。缺陷:主机负担重

23、,一旦出现故障,则整个网络都将瘫痪;信息组织方式以线性为主,不够灵活;联机检索不像Internet是面向最终用户的,操作也没有后者方便。信息检索的技术与方法信息检索的技术与方法52联机信息检索系统的结构 由检索服务机构(联机存取中心)、国际通讯网络及终端三部分构成。终端设备用于输入检索程序、显示检索过程、控制打印检索结果。通讯网络用于实现远程人机对话。检索服务机构(联机存取中心)是存储和检索信息的核心。由中央计算机、数据库检索与管理软件、联机数据库以及相应的检索服务体制组成。信息检索的技术与方法信息检索的技术与方法53联机信息检索的技术原理 一个典型的计算机信息系统,能完成数据收集、分析、加工

24、处理、存储、传递通信和检索信息的全过程。联机信息检索的服务方式定题信息提供(SDI)专题回溯检索(RS)联机订购原文 电子邮件 信息检索的技术与方法信息检索的技术与方法54 我国联机存取服务始于1974年,比较有影响的联机存取系统有:(1)万方数据资源系统 http:/ http:/ (3)维普数据资讯系统 http:/ 光盘信息检索的特点:光盘存贮容量大、耐用。检索成本低。一次购买可多次使用,节省了电讯费和联机系统使用费。操作简单,检索效果好。用户按提示或帮助功能使用检索系统。运行速度快。单机检索,不受线路影响。安全性能高。只读光盘,一般局域网用户使用。信息检索的技术与方法信息检索的技术与方

25、法56光盘信息检索的缺陷:如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘数据库,又要受到经费限制更新周期长。一般的光盘数据库更新要1个月或更长,而网络数据库的更新周期一般是1周或更短。检索时需不断换盘。一个大型数据库,一般都是几张光盘,特别是全文数据库,如中国学术期刊全文光盘数据库,每年都有一百多张光盘,检索时需要不断更换光盘。信息检索的技术与方法信息检索的技术与方法57光盘信息检索方法 光盘检索系统的功能和指令与联机检索没有很大区别,但更方便。功能键:Help(Help(帮助帮助)、Index(Index(索引索引)、History(History(查阅历史查阅历史)、Displ

26、ay(Display(显示显示)、Print(Print(打印打印)、Select Database(Select Database(选择数据库选择数据库)、Format Window(Format Window(格式窗格式窗)、Quit(Quit(退出退出)等。检索信息时可用单元词、多元词(短语)、数字及布尔运算符和位置运算符把几个检索术语组配成一个提问逻辑式。用户可以在任何时刻回顾其查找的历史,重新使用或修改以前的任何提问。屏幕帮助是光盘数据库最常用也是重要的功能之一。信息检索的技术与方法信息检索的技术与方法586.3.4 网络信息检索的技术与方法网络信息检索模式 广义:从根本上解决有效利

27、用网络信息资源问题的关键。如何对网络上的海量多态信息进行组织,如何对这些信息建立索引,如何对索引及时更新;如何设计检索算法以使检索提问在检全、检准、响应时间、检索结果控制与显示方面表现良好;如何为用户设计一个简单易用的友好界面。信息检索的技术与方法信息检索的技术与方法59网络信息检索模式 狭义:在现实世界中有效利用网络资源的核心 只是以网络(如互联网)为媒介,利用网上已提供的一些信息检索工具,探索如何使用这些工具及如何综合各工具,使它们扬长避短,最后能实现对信息提问的检索查询的一种方法与技术。信息检索的技术与方法信息检索的技术与方法606.4 信息检索的步骤与策略6.4.1 信息检索的步骤(1

28、)分析检索课题,明确信息需求明确信息检索课题所涉及的领域和范围;明确所需信息的内容及其内容特征;明确所需信息的类型,包括文献媒体、出版类型、所需文献量、年代范围、涉及的语种、有关著者及机构等;明确信息检索课题对查新、查准和查全的指标要求。信息检索的步骤与策略信息检索的步骤与策略61(2)选择检索工具,了解检索系统 信息检索工具是人们为了充分、准确、有效地利用已有的信息资源而加工编制的用来报道、揭示、存贮和查找信息资源的卡片、表册、计算机信息系统和特定出版物。(3)确定检索途经,选定检索方法 每一种信息检索方法都有自己的特点,在实践中可以根据信息检索要求选择使用或配合使用,以快速、准确地完成信息

29、检索任务,实现预期的目标。信息检索的步骤与策略信息检索的步骤与策略62(4)掌握获取原始信息的线索 在获取信息线索时要仔细阅读,判断所检出的信息是否符合检索的要求,不仅看篇名,还要阅读整个著录格式,进行综合分析。(5)获取原始信息判断文献的出版类型。整理文献出处。根据出版类型在图书馆或信息机构查找馆藏目录或联合目录确定馆藏。尽可能多渠道、多方式地获取原始信息。信息检索的步骤与策略信息检索的步骤与策略636.4.2 信息检索策略 检索策略是科学地运用检索词和逻辑运算符正确地构造逻辑提问式的原则和方法。其核心内容在于检索策略的构造与检索的步骤。常用信息检索策略包括:分块概念组配检索策略、逐步组配检

30、索策略、对偶组配检索策略、增长组配检索策略等。信息检索的步骤与策略信息检索的步骤与策略646.4.3 信息检索语言 信息检索语言就是信息组织和信息检索时所使用的语言(包括自然语言)。信息检索语言是文献信息标引的规则和标准,标引人员可用它来标引文献以便将文献整理、加工、存储于检索系统中,同时,检索人员可用它来表达检索课题信息的内容,以便把特定文献从检索系统中检索出来。因此,检索语言就是一种把文献的存储与检索联系起来,把标引人员和检索人员沟通起来的约定人工语言。信息检索的步骤与策略信息检索的步骤与策略65信息检索语言主要功能:对文献的信息内容及其外表特征加以规范化的标引。对内容相同及相关的文献信息

31、加以集中或揭示其相关性可使文献信息的存储集中化、系统化、组织化,便于检索者按一定的排列次序进行有序化检索。便于将标引用语和检索用语进行相符性比较。信息检索的步骤与策略信息检索的步骤与策略66信息检索语言的作用信息检索的步骤与策略信息检索的步骤与策略67信息检索语言的分类信息检索的步骤与策略信息检索的步骤与策略686.4.4 信息检索效率的评价 检索效率是指全、准、快、便、省(检全率、检准率、检索速度、检索方便性、检索成本与效益),最主要的是全和准。在评价信息检索效率过程中,主要通过检全率、检准率、漏检率和误检率四个评价指标进行评价,其中重点是检全率和检准率。信息检索的步骤与策略信息检索的步骤与

32、策略69检全率=检出的相关文献量/系统中的相关文献总量检准率=检出的相关文献量/检出的文献总量漏检率=未检出的相关文献量/系统中的相关文献总量误检率=检出的非相关文献量/检出的文献总量 信息检索的步骤与策略信息检索的步骤与策略70信息检索的步骤与策略信息检索的步骤与策略检全率与检准率的互逆相互曲线716.5网络应用:网络信息检索6.5.1 网络信息检索特点信息丰富,检索空间拓宽信息资源的异构式分布检索趋于简单方便,适合非专业用户网络应用:网络信息检索网络应用:网络信息检索726.5.2 网络信息检索工具非WEB检索工具FTP类的检索工具.如Archie(文档查询服务)Telnet类的检索工具.

33、Gopher(菜单式检索服务)WEB检索工具 关键词检索工具 目录型检索工具 混合型检索工具网络应用:网络信息检索网络应用:网络信息检索736.5.3 搜索引擎及其应用搜索引擎 是提供给用户进行关键词、词组或自然语言检索的工具,简言之,就是一种在互联网上查找信息的工具。基本工作原理 用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。检索的结果 WWW上的主页、新闻组中的文章、软件的存放地址及其作者、企业网站、个人主页等。网络应用:网络信息检索网络应用:网络信息检索74搜索引擎的分类综合型独立搜索引擎 用户可以利用此类工具检索几乎所有方面的网络资源。垂直型独立搜索引擎

34、(专业、专用搜索引擎)专门收录某一方面、某一行业或某一主题的信息,单一垂直搜索引擎、综合型搜索引擎垂直化、门户网站引擎垂直化网络应用:网络信息检索网络应用:网络信息检索75元搜索引擎 元搜索引擎又称集合型搜索引擎,将多个单一搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问同时提交给多个独立的搜索引擎,同时检索多个数据库;并根据多个独立搜索引擎的检索结果进行二次加工,如对检索结果去重、排序等,输出给用户。网络应用:网络信息检索网络应用:网络信息检索76移动搜索引擎 移动搜索是基于移动网络的搜索技术的总称,用户可以通过SMS(短信息)、WAP(无线应用协议)、语音搜索等多种接入方式进行搜索

35、,获取互联网信息、移动增值服务及本地信息等信息服务内容。网络应用:网络信息检索网络应用:网络信息检索77SMSSMS搜索 短信搜索是利用电信运营商的短信服务平台通过短信的方式向搜索引擎或数据系统发送搜索请求,搜索或查询结果同样通过短信的方式提供给用户。示例:无线音乐短信搜索是中国移动为您提供的最快捷的音乐搜索引擎。无需申请,编辑短信就可以免费获取相关歌曲的彩铃音乐、来电铃声音乐、音乐全曲相关内容资源。网络应用:网络信息检索网络应用:网络信息检索78WAPWAP搜索 基于无线网络引用协议的移动搜索,用户通过移动终端登录搜索引擎进行相关内容的搜索,访问的多为移动网站。网络应用:网络信息检索网络应用

36、:网络信息检索79IVRIVR网络应用:网络信息检索网络应用:网络信息检索806.5.4 网络信息检索发展趋势多媒体信息检索多媒体:把不同的但相互关联的媒体集成在一起而产生的一种存储、传播和表现信息的载体,通常包括文本、音频、图形、图像、动画和视频。多媒体信息:是各种媒体的组合体,即将音频、视频、图像和计算机技术、通信技术集成到同一数字环境中,以协同表示更丰富和复杂的信息。多媒体信息检索是根据用户的要求,对图形、图像、文本、声音、动画等多媒体信息进行检索,得到用户所需的信息。网络应用:网络信息检索网络应用:网络信息检索816.5.4 网络信息检索发展趋势跨语言信息检索跨语言检索即可用一种提问语

37、言检索出用另一种语言书写的信息,也就是一种跨越语言界限进行检索的问题。跨语言信息检索研究涉及了语言学、情报学、计算机科学等多门学科知识,是一个综合性强、崭新的研究领域。跨语言检索技术的实现应用了信息检索、文字处理、和机器翻译等技术,如文字切分技术、词汇翻译、词频技术、索引技术等。网络应用:网络信息检索网络应用:网络信息检索826.5.4 网络信息检索发展趋势智能信息检索智能信息检索能理解自然语言,允许用自然语言提出各种询问。具有推理能力,能根据存储的事实,演绎出所需的答案。智能信息检索系统应具有如下的功能:允许用自然语言提出各种询问;具有推理能力,能根据存储的事实,演绎出所需答案;系统具有一定常识性知识,以补充学科范围的专业知识。网络应用:网络信息检索网络应用:网络信息检索836.5.4 网络信息检索发展趋势信息检索可视化信息检索可视化是信息可视化技术在信息检索中的应用,是指把文献信息、用户提问、各类情报检索模型以及利用检索模型进行信息检索的过程中不可见的内部语义关系转换成图形,在一个二维或三维的可视化空间中显示出来,并向用户提供信息检索的技术。网络应用:网络信息检索网络应用:网络信息检索84WEB2.0 环境下的信息检索网络应用:网络信息检索网络应用:网络信息检索851.信息检索的基本原理是什么?2.信息检索包括哪些主要步骤?作业作业

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|