1、整理课件1医学信息检索与利用概论整理课件2Where is the wisdom we have lost in knowledge?Where is the knowledge we have lost in information?T.S.Eliot(1888-1965)我们在信息里面失去的知识,到哪里去了?我们在知识里面失去的智慧,到哪里去了?艾略特(1888-1965)整理课件3第一节 基本概念1信息(Information)英国科学家K.Popper认为信息可分为:l有关客观物质世界的信息l有关人类主观精神世界的信息l有关概念世界的信息整理课件4基本概念2知识(knowledge)l
2、人类在认识世界、改造世界的过程中,不断接受客观事物发出的信息,经过思维加工,获得对事物本质及其运动规律的认识,由此信息转化为知识。国际经济合作与发展组织提出知识的4W概念:know-what;know-why;know-how;know-who整理课件5基本概念3情报(Information)当人们为了解决某一特定问题去搜寻所需要的知识,那一部分知识就是情报,是被传递的知识或事实。情报的三个基本属性:l知识性、传递性、效用性整理课件6基本概念4文献(document,literature)文献是记录有知识的一切载体。整理课件74个概念之间的关系信息知识系统化文献记录情报交流整理课件8网络环境下
3、的信息资源1电子信息资源l文本型(text)l多媒体型(multimedia)l超文本型(hypertext)整理课件9网络环境下的信息资源2传统文献l印刷型l缩微型l声像型整理课件10按文献发布的类型分类图书期刊特种文献整理课件11按揭示文献内容程度分类一次文献二次文献三次文献整理课件12第二节 计算机检索与数据库计算机检索:利用计算机从文献数据库或因特网上查寻所需文献信息的过程。包括:联机检索、光盘检索、网络检索整理课件13计算机检索发展简史脱机检索(off-line retrieval)联机检索(on-line retrieval)光盘检索(optical disc retrieval)
4、网络检索整理课件14数据库的类型与结构数据库是指有计算机进行处理的一定数量同类信息的有序集合,是用来存储和查找文献的电子化检索工具。整理课件15数据库的类型书目型数据库(bibliographic database)事实型数据库(fact database)数值型数据库(numeric database)全文数据库(full text database)图像型数据库(image database,atlas online)整理课件16书目数据库(Bibliographic Database)存储的是二次文献,包括文献的外部特征、题录、文摘和主题词等,检索结果是所需文献的线索而非原文。许多书目数
5、据库是印刷型文献检索工具的机度版,如MEDLINE、CBMDISC等整理课件17数值数据库(Numeric Database)主要包含的是数字数据,如各种统计数据、科学实验数据、科学测量数据等。l例如医学上使用的化学制剂、药物的各种理化参数、人体生理上的各种数值,人口统计数据都可收入数值数据库。l美国国立医学图书馆编制的化学物质毒性数据库RTECS,包含10万多种化学物质的急、慢性毒理实验数据。整理课件18事实数据库(Fact Database)存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据。l如名人录、机构指南、大事记等,均可归入事实数据库。l美国MEDLARS系统的医生
6、咨询数据库(PDQ),能提供有关癌症治疗和临床实验的相关病因、诊断标准、治疗方案以及最新研究进展等信息。整理课件19全文数据库(Full Text Database)存储的是原始文献的全文,如杂志论文、报纸新闻、法院案例等。l全文检索可直接获取原始资料,而不是书目检索时的线索,提高了用户的检索效率。l在DIALOG中有48种医药期刊全文数据库,我国有中国学术期刊数据库、万方数据库、维普数据库等全文数据库。整理课件20图像数据库(Image Database)以图像为信息主体,配有文字解释,如:解剖图谱、中药图谱、诊断图谱、手术图谱等。如:NLM的The visible Human Projec
7、t;哈佛大学医学院的The Whole Brain Atlas等。整理课件21数据库的结构文档(file)记录(record)字段(field)整理课件22数据库的结构文档(file)数据是能满足某种特定目的或某一特定数据处理系统需要的一种数据集合,由一个或多个文档构成l现期文档、回溯文档(如MEDLINE)l顺排文档、倒排文档整理课件23记录(record)数据库中基本文献单元一个记录在数据库中通常记录着一篇文献的相关信息整理课件24字段(field)组成记录的基本信息单元。每一个字段都描述文献的某一方面特征,包括外表特征和内容特征。每个字段有自己的名称和缩写,如:题名(ti)、著者(au)
8、、文摘(ab)、出版年(py)等整理课件25整理课件26整理课件27计算机检索的途径检索途径是指用记录的某一特征为检索切入点进行检索。整理课件28自由词检索自由词又称文本词(text word),是作者写文章时所使用的自然词语,包括:l标题词(title word)l关键词(key word)l文摘词(abstract word)l全文词(full text word)整理课件29主题词检索主题词(subject,subject headings)l又称叙词,是一种规范化的检索语言。l主题词的规范作用在于:对同义词、近义词、异形词、全称与缩写进行归并,以保证一词输入,多词命中。l规范的依据:医
9、学主题词表(MESH)l例:renal failure see kidney failure整理课件30分类检索分类法(Classification):l利用学科、专业、概念之间的逻辑关系建立起来的一种等级体系。l分类号:由数字或数字加字母构成,代表一个个概念;概念间有上下隶属关系,也有同位间的并列关系。l国内常用的分类法是:中国图书资料分类法整理课件31著者检索著者(author)检索是用文献上署名的作者或编者的姓名作为检索入口词。检索时注意著者姓名的处理:姓前,名后;姓用全称,名用首字母。如:Charles Greenberg处理为:Greenberg c 闻玉梅 处理为:wen ym整理
10、课件32引文检索参考文献:在学术论文、综述、专著文献后面,列有的著者撰文借鉴利用过的书目清单。引用文献:列有参考文献的文献。参考文献又称为被引用文献。引文检索:以被引用文献为检索起点来查找引用文献的过程。整理课件33机构检索以机构名称为检索词,来查找该机构学者发表的文献。整理课件34刊名检索检索指定刊物上发表的文章。有的数据库提供刊名浏览,只需点击刊名链接即可有的数据库则需输入刊名:刊名全称或刊名缩写刊名缩写全称转换可查Pubmed的Journal Database(http:/www.ncbi.nlm.nih.gov)整理课件35默认检索默认检索又称缺省检索、隐含检索,是指在检索系统预先设定
11、的多个字段中进行检索。如:在WinSPIRS系统的MEDLINE数据库中,Search状态为默认检索所有非限制字段,包括:ti,ab,MH等字段。CBMdisc中的“缺省”检索是在中文标题、文摘、主题词、关键词、特征词、刊名等6个字段中搜词检索。整理课件36限定检索不少数据库提供limit检索功能,用来对检出结果进行数量限制.常用的限定检索有:语种(language)、文献类型(publication type)、出版日期(publication date)、只要含有全文的记录(full text only)、限于临床医学期刊(clinical journals)等。整理课件37其他检索途径专
12、利号、国际连续出版物编号、化学物质登记号检索,分子式检索、特征词检索、记录顺序号检索等。整理课件38计算机检索途径的另一划分法简单检索复合检索高级检索目录检索导航检索专家检索整理课件39简单检索(Simple Search)也称初级检索、自由词检索、基本检索。指在数据库首页的检索词输入框(查询提问框)内输入一个单词或词组,提交检索工具查询的一种检索方式。整理课件40基本检索说明基本检索说明检索字段基本检索整理课件41复合检索(Combine Search)也称布尔逻辑组配检索(Boolean Search),或简称组配检索。复合检索指在任意字段情况下在检索词输入框中输入复合逻辑检索式提交检索工
13、具查询的一种检索方式。整理课件42高级检索(Advanced Search)高级检索指在已设定的高级检索窗口中输入多个检索词,运用逻辑组配关系,查找同时满足多个检索条件的数据,在高级检索界面上一次性实现本应多次检索的结果的一种检索方式。整理课件43高级检索多栏复合检索词表查询多栏逻辑组配整理课件44目录检索(Category Search)或称分类检索,有些检索工具如雅虎、万方,提供分类目录检索。目录检索指按类名分类,每类又分为若干子类目,层层逐级展开,最后点击末级类名,显示网页名链接和简短内容提要,点击链接,显示相关网页内容(如雅虎),或显示该类的文献记录(如万方、维普)。整理课件45整理课
14、件46导航检索(Navigation Search)或称浏览检索(Browse Search),与目录检索类似。指在系统设置的导航区内按检索树格式逐级展开和进行浏览选择的检索方式。导航检索有学科分类导航和刊名导航检索。整理课件47NGC的导航检索导航检索整理课件48专家检索(Expert Search)指系统在检索界面设置的一个较大的提问框供用户输入检索策略。用户可根据检索课题的需要,调用相应的检索技术编制比较细致复杂的检索提问式,以一次达到比较满意的检索结果。这种方式适用于有丰富检索经验的用户。整理课件49专家检索整理课件50计算机检索的步骤分析检索课题,明确检索要求选择数据库和检索途径确定
15、检索标识,构筑检索提问式上机检索操作整理检索结果,获取原始文献整理课件51计算机信息检索技术布尔逻辑检索位置检索截词检索指定字段检索整理课件52布尔逻辑检索检索系统中应用最为广泛的检索技术理论基础是集合论与布尔逻辑采用布尔逻辑表达式来表达用户的检索要求l通过布尔逻辑运算符来连接检索词,以及表示运算优先级的括号组成的一种表达检索要求的算式整理课件53 逻辑或(OR)A OR B:记录中出现检索词A或检索词B或两词同时出现在一条记录中。其作用是扩大检索范围,提高查全率A OR B如查有关维生素C方面的文献,检索式可写成:Vitamin C or Ascorbic acid整理课件54逻辑与(AND
16、)A AND B:检索词A和检索词B同时出现在一条记录中。其作用是缩小检索范围,提高查准率。A and B例如查有关“妇女吸烟”的文献,检索式可写成:Women and smoking整理课件55逻辑非(NOT)A NOT B:记录必须包含检索词A但不能包含检索词B。即在含有A检索词的文献中去除含有B检索词的文献。其作用是缩小检索范围,提高查准率。A NOT B例如查找有关“非儿童白血病”的文献,检索式可写成:Leukemia not child*整理课件56布尔逻辑算符的运算次序:NOT AND OR()号里的部分运算优先整理课件57位置检索With 同字段检索 A with B AB同时出
17、现在一个字段中Near 相邻检索 A near4 B AB出现在一个句中相隔n-1个单词整理课件58截词检索截词(Truncation):检索者将检索词在他认为合适的地方截断。截词检索:检索时针对检索词附加一个截断符号,指明该检索词在与数据库中的词比较时,采取完整匹配还是部分匹配。整理课件59无限截断检索词串与被检索词实现部分一致的匹配,被截断的部分没有限定有多少个字符。l左截断:*leukemia:preleukemia、leukemial右截断:leukocyt*:leukocyte leukocytic leukocythemial中间截断:leuk*ic:leukemic leukae
18、mic leukemogenic leukocytoctasticl左右截断:*leukemia*:leukemia preleukemia leukemias整理课件60有限截断检索词串与被检索词只在指定的位置可以不一致。每个被屏蔽的字符通常都有“?”来替代。如:leukemi?:leukemia leukemid leukemic整理课件61指定字段检索同样的词出现在记录的不同位置对表达文献的主要内容所起的作用不同。l题名文摘全文有些词在记录的不同位置出现表示的意义不同.l人名在著者字段中出现,表明其为著者之一l人名在摘要或全文中出现,可能为文献评论的对象整理课件62TI Title题名
19、AIDS IN TIAU Author著者 He M IN AUSO Source文献出处 circulation in soPY Publication Year PY=1998LA Language Chinese in laAB Abstract hypertension in abMesh Medical Subject hepatitis in mesh Headings整理课件63检索结果的反馈调整扩大检索范围的措施l降低检索词的专指度,可从词表或检出文献中选择泛指词。l调节检索式的网罗度,如删除某个不重要的检索词。l进行族性检索,可用分类号或用OR连接一组同义词和近义词。l取消某些限制过严的限制符。整理课件64缩小检索范围的措施l提高检索词的专指度。l增加AND连接,进一步限定主题词。l把检索词限定在主要字段,如标题字段、主题词字段等。l缩短检索年限,或限定某些刊物。整理课件65