1、第一章第一章 信息检索基础知识信息检索基础知识第一节 信息资源与信息检索一、信息一、信息(一)信息的概念广义:信息是对各种事物的存在方式、运动状态 和相互联系特征的一种表达和陈述,是自然界、人类社会和人类思维活动普遍存在的一切物质和事物的属性。狭义:信息是指具有新内容或新知识的消息,即对接受者来说预先不知道的报道。l在信息检索领域,一般将信息理解为关于现实世界事物存在的方式或运动状态的反映。l医学信息,就是用语言、文字、符号、图像及影视数据等反映人类与疾病做斗争的过程中疾病运动状态及其变化方式的信息(二)信息的分类l按属性分:1.文字信息2.图像信息3.数值数据信息4.语音信息(三)信息的特征
2、1.客观性2.可知性3.传递性4.无限性5.时效性二、信息资源二、信息资源(一)信息资源的概念l信息资源是人类在认识世界与改造世界过程中所产生、整理和记录的有用信息的集合。该概念有三层含义:1.信息资源是信息的集合;2.信息资源是经过人类选择的、对人类有用或能满足人类需求的那部分信息的总和或集合;3.信息资源是经过人类组织序化的集合。(二)信息资源的类型1.按载体形式划分印刷型缩微型视听型电子型2.按出版形式划分图书期刊特种文献3.按信息内容的加工级次划分一次文献二次文献三次文献零次文献(三)信息资源的特征1.智能性2.有限性3.不均衡性4.整体性三、信息检索三、信息检索(一)信息检索原理 任
3、何信息检索系统都具有存储和检索功能。信息检索原理就是指通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效地获取和利用信息。1.信息存储过程 这一过程是由信息专业人员完成的。信息专业人员根据收集到的原始文献的主题内容、学科归属以及其外表特征(标题、著者、来源、文种等)进行概念分析,选用特定的文献信息检索语言表达相应的文献特征,再转换成对应的文献信息特征标识(如:主题词、分类号、篇名、作者等),然后把这些特征性标识进行编排,按一定格式输入信息检索系统存储起来,完成信息的加工存储过程。2.信息检索过程 这一过程是用户根据信息需求,对检索课题加以分析,明确检索范围,弄清主题概
4、念,然后选用特定检索语言来表达主题概念,形成检索提问标识,根据提问标识到检索系统中查找文献信息线索,对所查到的文献信息线索进行筛选,以确定需要阅读的文献。检索原理 信息源信息源 信息用户信息用户 筛选信息筛选信息 检索需求检索需求 分类法、词表等分类法、词表等 信息描述与组织信息描述与组织 需求描述与组织需求描述与组织 转换转换 转换转换 信息录入信息录入 检索提问式检索提问式 信息存储信息存储 信息数据库信息数据库 信息检索信息检索 信息存储与检索原理信息存储与检索原理(二)信息检索类型 信息检索经历了手工检索、联机检索、光盘检索和网络检索等多个发展阶段,根据检索目的和检索对象的不同,信息检
5、索可以分为文献型信息检索、数据型信息检索和事实型信息检索。1.文献型信息检索:又称文献信息检索,通常以某些特定的文献为检索对象,其检索结果是切题文献或相关文献的线索或全文。2.数据型信息检索:又称数值检索,检索对象为特定的数值数据,包括物质的各种理化参数、观测数据以及各类统计数字等数值类数据,也包括图标、化学结构式、计算公式等数据。3.事实型信息检索:事实型信息检索以事项为检索目的和对象,又称事项检索。(三)信息检索语言l检索语言是根据文献信息存储与检索需要而创造的用来描述文献特征和表达检索提问的人工语言,这种语言用在文献整序时称标引语言;用在编制索引工具时称索引语言。l检索语言是连接标引人员
6、和检索人员双方思路的桥梁。l各种检索语言的基本原理是一致的,但是它们在表达各种概念以及相互关系时所采用的方法不同,因而形成了不同类型的检索语言。按照检索语言所描述的文献信息特征的内容可分为描述文献外表特征的检索语言和描述文献内容特征的检索语言。1.描述文献外表特征的检索语言 文献的外表特征包括题目、作者、作者工作单位,文献发表时间、专利号、报告号等。描述文献外表特征的检索语言,是以文献的外表特征作为文献存储的标识和文献检索提问的出发点而设计的语言。2.描述文献内容特征的检索语言 狭义的检索语言主要是指描述文献内容特征的检索语言,这里我们也主要介绍此类检索语言。其按结构原理主要分为分类检索语言、
7、主题检索语言和代码检索语言三种类型。分类检索语言:用分类号来表达学科体系的各种概念,将各种概念按学科性质进行分类和系统排列。如:杜威十进分类法、美国国会图书馆分类法、美国国立医学图书馆分类法、中国图书馆分类法l我国广泛使用的分类检索语言是中国图书馆分类法(Chinese Library Classification,CLC),简称中图法。l中图法是等级列举式分类体系,采用汉语拼音字母和阿拉伯数字组合的混合制号码作类目标识,用一个字母标记一个基本大类,在字母后用数字表示大类的下位类划分,号码的位数一般能反映相应类目的分类等级,每一个分类号代表特定的知识门类。A A 马克思主义、列宁主义、马克思主
8、义、列宁主义、毛泽东思想毛泽东思想B B 哲学哲学C C 社会科学总论社会科学总论D D 政治、法律政治、法律E E 军事军事F F 经济经济 G G 文化、科学、教育、体育文化、科学、教育、体育H H 语言、文字语言、文字I I 文学文学 J J 艺术艺术K K 历史、地理历史、地理N N 自然科学总论自然科学总论O O 数理科学和化学数理科学和化学P P 天文学、地球科学天文学、地球科学Q Q 生物科学生物科学R R 医药、卫生医药、卫生S S 农业科学农业科学T T 工业技术工业技术U U 交通运输交通运输V V 航空、航天航空、航天X X 环境科学环境科学Z Z 综合性图书综合性图书中
9、图法二十二个大类中图法二十二个大类R1 预防医学、卫生学 R2 中国医学 R3 基础医学 R4 临床医学 R5 内科学 R6 外科学 R71 妇产科学 R72 儿科学R73 肿瘤学 R74 神经病学与精神病学 R75皮肤病学与性病学 R76耳鼻咽喉科学R77 眼科学 R78 口腔科学R79 外国民族医学 R8 特种医学 R9 药学R1 R1 预防医学、卫生学预防医学、卫生学R11卫生基础科学R12环境卫生R13劳动卫生R14放射卫生R15营养卫生、食品卫生R16个人卫生R17妇幼卫生R18流行病学与防疫R19保健组织与事业(卫生事业管理)中图法中图法类目表等级关系类目表等级关系R 医药、卫生R
10、1 预防医学、卫生学 R13 劳动卫生 R135职业性疾病预防 一级类目二级类目三级类目四级类目O数理科学和化学数理科学和化学l6 化学l61 无机化学l62 有机化学l63 高分子化学(高聚物)l64 物理化学(理论化学)、化学物理学l65 分析化学l69 应用化学l7 晶体学主题检索语言:主题检索语言是用语词来表达各种概念,将各种概念不管其相互关系,完全按字顺排列。主题检索语言具有专指性和直接性的特点,主要包括主题词和关键词两种类型。l主题词:又称“叙词”(descriptor),是经过人工规范化处理的,最能表达文中主题概念的词语。所谓规范化处理,就是在文献存储时,对文献中的同义词、近义词
11、、拼写变异词、全称缩写等加以严格的控制和规范,使得同一主题概念的文献相对集中在一个主题词下,从而体现了主题词的单一性。l关键词:又称键词、自由词,是从文献的题名、摘要、章节标题或正文中抽取出来的,具有实质意义,并能表达文献的主题内容的词语,但未经规范化处理,需由检索者在检索时加以控制使用。所以关键词又称后控语言或非规范化语言,属于自然语言范畴。l关键词语言的优点在于能够及时反映文献中的最新信息,直接、灵活、方便,用户容易掌握和利用。但由于用关键词直接标引文献,对同义词、近义词等未经严格规范,因此同一主题概念的文献可分散在多个关键词下,容易造成漏检或误检。l代码检索语言:代码检索语言是根据文献信
12、息中论述事物的代码作为标、加以标引和排列的检索语言。代码检索语言是自然语言的一种,特别适用于专业人员检索有关特定专业的文献信息。例如:化合物的分子式索引系统、环状化合物的环系索引系统。四、检索途径四、检索途径l引例:某医学院在上外科学课程时老师提到“黄家驷是我国著名的医学家、医学教育家,他主编的黄家驷外科学是当前中国最权威的外科学著作,多次修订再版。”一名学生对此非常感兴趣,决定去学校图书馆借阅黄家驷外科学,并想详细了解一下黄家驷的详细信息。l问题:1.该学生到学校图书馆如何借阅黄家驷外科学?如何获得图书馆收藏的黄家驷编写的全部图书信息?2.该学生如何获得黄家驷的个人信息及其研究领域?这属于何
13、种类型的信息检索?如何了解目前该领域的研究热点?如需进一步了解临床上肺切除术治疗肺结核的研究情况如何检索?l分析:1.该学生可以使用学校图书馆的书刊借阅系统,分别选择题名途径和著者途径进行检索即可获得所需信息。2.该学生可以通过网络或中国年鉴全文数据库的“名人录”检索黄家驷的个人信息,属于事实型信息检索。通过检索可知黄家驷是我国胸腔外科学奠基人之一,欲了解胸腔外科学目前的研究热点情况,可以通过分类检索途径检索。如果想了解胸腔外科领域内某一具体课题的研究现状,可利用课题具体内容,选择主题、关键词、题名、默认等检索途径进行检索。l检索途径是指检索文献信息的出发点和路线,在用检索语言有序存储文献的同
14、时,也就形成了多个检索入口,为检索者提供了多条检索途径。不同的检索工具所提供的检索途径不完全相同,常见的检索途径主要有以下几种:分类途径;主题途径;关键词途径;题名途径;著者途径;引文途径;机构途径;默认途径;其他途径。(一)分类途径 分类途径是根据文献内容所属的学科类别,按照类目名称或分类号查找文献的途径。通过分类途径检索文献信息时,首先要先了解检索工具书或数据库所采用的分类体系,熟悉预查文献信息所属的学科分类,选准大类类目,在逐层逐级地深入,直到检索到合适的类目。(二)主题途径 主题途径是以文献内容所涉及的主题感念为检索入口,利用主题索引查找文献的途径。利用主题途径查找文献,要根据所查内容
15、选准检索词,然后按照主题索引或主题系统的参见提示,选择正确的主题词,根据课题检索需要,决定是否扩展主题词树状结构、组配相关联的副主题词,以便快速、准确地查找所需文献信息。(三)关键词途径 关键词途径又称自由词检索途径,是以文献的题名、摘要、章节标题或正文中具有实质意义、并能表达文献信息主题内容的语词为检索入口查找文献的途径。关键词不受主题词表约束,同一概念用词取决于著者的偏爱,因此,利用关键词查找文献,应注意同义词、近义,以免造成文献信息的漏检。(四)题名途径 题名途径是以书名、刊名或文献的篇名为检索入口,利用书名目录(索引)、刊名目录(索引)或题名索引查找文献的途径。利用题名中的字词或其中的
16、一部分进行检索,其结果是所有提名中出现该字、该词或该部分的图书、期刊或文献。(五)著者途径 住着途径是用文献中署名的作者、译者、编者的姓名或团体名称作为检索入口,利用著者索引或机构名称索引查找文献的途径。通过著者途径检索,可获得某一著者发表的所有文献。(六)引文途径 引文途径是以引文(被引用文献,参考文献)作为检索起点来查找引用文献的途径。由于被引用文献和引用文献在内容上相关联,所以通过一个作者或一篇文献进行引文检索,常可以获得一系列主题相关、内容上有所继承和发展的新文献。(七)机构途径 机构途径检索是以机构(单位)名称为检索词,查找该机构学者发表的文献。由于一些数据库把机构名称并入了地址字段(address),所以还可按机构所在的城市名和国家名进行检索。使用机构途径检索时,需要注意机构名称的不同表达方式以及名称相同的不同机构的问题,可根据城市名称、邮编号码等其他信息进行区分。(八)默认途径 默认途径又称缺省途径,指在检索系统预先设定的多个字段中检索。(九)其他途径 除了以上几种常见的检索途径外,一些检索系统还提供了许多其他检索途径。如:专利号检索、国际标准连续出版物编号检索、化学物质登记号检索、分子式检索等。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。