信息组织(检索一)课件.ppt

上传人(卖家):晟晟文业 文档编号:3941033 上传时间:2022-10-27 格式:PPT 页数:49 大小:244.55KB
下载 相关 举报
信息组织(检索一)课件.ppt_第1页
第1页 / 共49页
信息组织(检索一)课件.ppt_第2页
第2页 / 共49页
信息组织(检索一)课件.ppt_第3页
第3页 / 共49页
信息组织(检索一)课件.ppt_第4页
第4页 / 共49页
信息组织(检索一)课件.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

1、2、6 信息检索(一)1、信息检索概述2、信息检索发展历史一、信息检索概述:v信息检索是一门关于信息资源存储、整序、查找理论和方法的学科,是利用一定的检索算法,借助于特定的检索工具,从结构化或非结构化的数据中获取有用信息的过程。文档集合(document collection)在信息检索中,把文档看作一个检索单元,组成检索对象的多个文档称为文档集合。用户提交的检索需求又称查询(query)。原理:相 关 反 馈 检索系统查询的内部表示文档的内部表示匹配检索结果查询请求文档集合用户检索步骤 明确需求,分析主题选择检索工具或数据库提交检索表达式显示与优化检索结果完成完成确定检索式构造检索表达式修改

2、检索式1、信息检索的类型 v数据检索数据检索(Date Information Retrieval):是针对回答某一问题数据的检索。如回答“2005年经济增长率是多少”?v事实检索事实检索(Fact Information Retrieval):查找某一事件发生的时间、地点、经过等情况。它即包括对数值的检索、运算和推导,也包括概念比较、判断,比数据检索复杂。v文献检索文献检索(Document Information Retrieval)是关于对某一主题文献的线索的查找,通常通过目录、索引、文摘等二次文献,查找出原始文献,所以,又称为“书目检索”。2)按组织方式 3)按检索设备 手工检索机器检

3、索联机检索光盘检索网络检索全文检索超文本检索超媒体检索2、信息检索研究内容、信息检索研究内容:信息检索是一门关于信息资源存储、整序查找理论和方法的学科,其研究内容主要包括:检索服务检索策略检索系统信息表音著录法数据库检索语言检索理论研究内容研究内容1、检索理论研究v内容包括:内容包括:信息与信息资源定义;信息检索的定义、类型、特点、作用、研究对象、方法、内容、理论基础、术语规范、原理与原则、相关学科等的研究。2、检索语言研究v原指受控语言的集合,现指受控语言和自然语言(未规范的书面语言)。其研究内容包括:关键词、主题词、词表编制、分类表编制、概念分析、规范档、代码标识等。尤其还包括网络数据库中

4、不同检索语言的转换、自动分类、自动标引、网络检索根据等的研究。3、数据库的研究数据库建设规划与协调共享收录信息与文献的筛选文档结构、维护与更新版权、市场跨库检索等4、著录法研究、著录法研究v包括国内外著录标准的研究v各种著录方法的研究v电子型文献及网络信息的著录研究5、标引和组织法的研究标引:通过对信息资源的分析,选用确切的检索标识反映信息资源内容的过程。组织方法:即排检法,主要是词表的编制与选用。当前研究重点为网络信息资源的标引与排序、数字资源的全球统一分类体系、自动标引与排序、智能搜索引擎、网格研究等。6、检索系统研究 v检索系统是由有序化的信息资源、设备、检索方法和策略等组成的集合体。其

5、研究内容主要包括:系统设计、运行和评价。7、检索策略研究、检索策略研究所谓检索策略是指:在分析信息需求提问时确定的检索途径与检索用词,并明确各词之间逻辑关系和查找步骤的安排。包括:用户需求提问分析检索式表达检索符号的设置与应用、步骤优化等。8、检索服务研究服务范式检索效果用户培训服务手段检索服务研究检索服务研究3、信息检索的研究方法、信息检索的研究方法v信息检索的研究涉及到诸多学科,如认知科学、计算机科学、信息科学、语言学、逻辑学以及概率论、最优化理论、模式识别、系统分析等,因此研究方法也多种多样。v除各科学通用的观察法、实验法、调查法、模拟法、归纳与演绎法、分析与比较法外,还采用:文献计量学

6、方法目录学方法分类法主题法排序法咨询法二、信息检索发展简史二、信息检索发展简史v20世纪中期以前:完全手工阶段v1950S:第一个计算机情报检索试验系统v1960s:批处理检索(脱机检索)v1970s-1980s:联机检索v1990以后:Internet信息检索信息检索的源起v信息检索源起于19世纪前期。由于近代科学团体的大量涌现,文献数量的增多,导致了文献检索业务社会分工的出现。19世纪20世纪初,出现了多种覆盖各个专业的检索工具,其中一些经长期发展调整,成为世界著名的检索工具,如美国的工程索引、化学文摘、英国的科学文摘等。、20世纪中期以前:手工检索阶段一般以1830年柏林科学院在柏林和莱

7、比锡出版的文摘刊物药学总览为手工检索的开端。以1876年美国图书馆协会第一届大会的召开为规范化信息检索工作的正式起点。v直到20世纪40年代,信息检索还只有手工检索一种方式。这一时期的特点表现为:以印刷文献,(图书、期刊、会议、专利文献等)为主要检索对象;以各类(文摘、题录、和目录性)工具书为检索工具;以图书馆的参考咨询部为开展信息检索的中心机构。手工检索工具:2、计算机化检索阶段、计算机化检索阶段v(20世纪50年代初-90年代初)v1951年,世界上出现了最早的计算机检索系统。v自20世纪60年代起,随着计算机性能的提高,储存量的增大,价格的下降,为计算机检索的发展提供了坚实的物质基础。3

8、、网络化检索阶段(20世纪90年代初期-):v信息检索的主流平台转移到以WWW为核心的网络环境中。v1994年春,网上出现了第一个web搜索引擎。v网络检索以极低的费用、海量的信息、迅速地存取以及对多媒体功能的支持等,对联机检索和光盘检索造成冲击。手工信息检索工具手工信息检索工具v检索性工具书书目、索引、文摘v参考性工具书百科全书、类书、政书、年鉴、名录、手册v词语性工具书字典、词典v图录性工具书地图、历史图录、人物图录、文物图录、艺术图录、科技图录等v边缘性工具书位于工具书和非工具书之间,如资料汇编、史书、方志等。手工检索工具的排检技术手工检索工具的排检技术v1、字顺排检技术v2、分类排检技

9、术v3、主题排检技术v4、时序排检技术(多用于编制年表、年谱等)v5、地序排检技术(集中某一地区的有关信息)介绍几种著名的科技检索期刊1、美国工程索引(The Engineering Index,简称EI)。1884年10月创刊。目前由美国工程信息公司负责编辑。EI名为索引,实际上是文摘性刊物,是世界著名的工程技术方面的综合性检索工具。特点:1)收录范围大。收录50多个国家26种文字的5400多种工程期刊、会议录、科技报告年报道量约22万条。中国有60多家期刊被EI收录。v2)报道的学科多、内容广。较全面地报道了工程技术各个领域和科学管理方面的文献。v3)报道的文献质量高。大多经编辑人员精选,

10、比较有参考价值的才予以收录。v4)查找方便。可根据文献主题或姓名查找。对于光盘数据库和网络数据库还可以根据著者的工作单位、刊物名称、年代等途径查找。EI的出版形式包括有:工程索引月刊 印刷版 工程索引年刊 工程索引累积索引 缩微版 磁带版 机读版 光盘版EI的检索途径 确定主题词核对工程叙词表确定正确主题词EI的主题索引 文献正文 EI的个人著作索引已知著者姓名已知团体机构EI年刊本中的劳动者单位索引原文个人团体著者主题2、英国、英国科学文摘科学文摘(Science Abstracts,简称SA)v1898年创刊,由英国电气工程师学会负责编辑出版。分4个分辑出版:A辑 物理文摘,半月刊。B辑

11、电器与电子学文摘,月刊。C辑 计算机与控制文摘,月刊。D辑 信息技术,月刊。vSA是科学技术方面的综合性文摘,文献来源包括50多个国家4200多种的期刊、科技报告、会议文献、学位论文等。以英美文献为主,年报道量大约40万条。vSA有印刷版、缩微版、磁带版、网络版、光盘版等不同形式的出版物。SA的体系结构 1、文摘(SA的正文,最主要的组成部分)2、辅助索引 主题指南主题索引 著者索引 参考文献索引 图书索引 会议索引 团体著者索引SA的检索途径分类索引主题索引著者索引3、美国、美国化学文摘化学文摘(Chemical Abstracts,简称CA)v1907年创刊,由美国化学学会化学文摘服务社编

12、辑出版,现为周刊。每年出版两卷,每卷26期。特点:范围广(不仅报道化学化工文学,还报道生物医学相关文献。收录150多个国家56种文字的约14000种化学化工期刊,年报道量达773000条,其中专利占123000条,占据了化学化工世界95%的文献)。出版迅速、内容准确、详细、索引系统完备。v出版物形式有:印刷、缩微、磁带、光盘、网络版。CA的索引体系 期索引关键词索引著者索引专利索引登记号索引索引指南登记号索引资料来源索引卷索引累积索引化学物质索引普通主题索引分子式索引环系索引杂原子索引专利索引著者索引4、美国、美国科学引文索引科学引文索引(Science Citation Index,SCI)

13、v1961年创刊,双月刊,美国费城“科学信息研究所”编辑出版。v收录40多个国家的科技期刊、会议录、论文集、专著、丛书等。报道范围为数、理、化、农、林、医、生物科学、工程技术等。v有印刷版、数据库、联机版、网络版。SCI的主要用途v1、作为检索工具作为检索工具可以从引文入手进行检索,提供了一条新的检索途径。v2、作为分析工具、作为分析工具常被用于引文分析,在研究工作中得到广泛应用:1)文献评价 2)科学史研究 3)科学交流模式研究 SCI的结构1、引文索引2、来源索引3、轮排索引4、专利引文索引5、机构索引SCI的检索途径1、引文途径2、主题途径 3、来源著者途径 4、著者机构途径 5、综合循

14、环检索法5、美国、美国生物学文摘生物学文摘(Biological Abstracts,BA)创刊于1926年,有美国“生物学文摘生物科学情报服务社”编辑出版,半月刊,一年两卷,摘录110多个工架9000多种期刊、以及专题论文、科技报告、学位论文、图书、会议文献、档案资料等16000多种文献。BA的结构v1、文摘v2、索引 著者索引 生物系统索引 属种索引 主题索引6、日本科学技术文献速报v1958年创刊,由日本情报中心编辑出版。内容以理工科为主,但不包括数学和天文学。v收录一万多种期刊和其他出版物,以日文文献为主,一般只收录原始文献、评论性文章、实用技术资料等。v分12个分册,各册每年第一期于4月出版,最末一期于次年3月出版。12分册分别为:v物理与应用物理编v化学与化学工业编(外国编)v化学与化学工业编(国内编)v金属工程、矿山工程与地球科学编v机械工业编v电气工程编v土木与建筑工程编v原子能工程编v环境公害编v管理与系统技术编v能源编v生命科学编速报的结构与检索途径v1、结构 文摘正文 辅助索引 其他辅助工具2、检索途径 分类途径 主题途径 著者途径特种文献及其检索v1、专利文献v2、科技报告v3、会议文献v4、标准文献v5、学位论文

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(信息组织(检索一)课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|