1、医 学 文 献 检 索 E-mail:puh3_lib,课程安排: 9.4 概论,PubMED 9.5 中文数据库 9.6 引文数据库 9.11 循证医学数据库 10.16 外文全文数据库 数字图书馆应用 10.17 实习 30% 10.18 考试 70%,授人以鱼,不如授之以渔,授人以鱼只救一时之急,授人以渔则可解一生之需。 -老子 检索(渔)需要的文献(鱼),课程介绍 文献检索是一门关于如何查询、获取文献、知识和信息的工具性课程,是培养人们独立学习能力的专门知识。 理论基础-图书馆学、情报学 国家教委明确指出“文检课是培养学生掌握利用文献检索,不断提高自学能力和科研能力的一门科学方法课”。
2、,医学信息素质教育的目标,使医学毕业生有能力通过数据库或其他资源检索、管理、运用生物医学信息,解决医疗问题,作出正确决策。 信息检索是信息素养的主要内容之一。,为什么要文献检索 1、信息量高速增长 网络信息庞大 70年代以来全世界每年出版 图书50万种以上 期刊10万种以上 专利约50万件 科技报告约90万件 会议文献10多万篇 产品样本50多万种 每年发表的科技论文总数近500万篇,并呈指数式增长 “一个科学家即使目前夜以继日地工作,也只能阅读有关他自己专业世界上全部出版物的5%。” -德国学者哈根,2、在前人研究成果基础上进行新的研究,减少 人、物、时间的浪费 -最大限度的继承前人的经验,
3、创造自己的科研成果。,美国科学基金会凯斯工学院基金委员会、日本国家统计局的数字 一个研究人员的全部工作时间分配:,概论主要内容,文献 文献类型 文献检索过程 检索语言 原文索取 数据库类型,一、文献 1、文献(literature) 记录着知识的一切载体 2、医学文献(medical literature) 记录着医学知识的一切载体,二、文献分类 1、按内容划分 零次文献:最原始或不正式的记录,大多数未公开传播的文献。包括口头交流的信息、参加报告会、实验的原始记录、工程草图等。 一次文献(primary literature):是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是
4、否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。大部分期刊上发表的文章和在科技会议上发表的论文均属一次文献。,二次文献(secondary literature):是指文献工作者对一次文献进行加工和整理之后所得到的,是为了便于管理和利用一次文献而编辑、出版的工具性文献。馆藏目录、索引、文摘数据库等。 三次文献(tertiary literature):是指围绕某个专题,利用二次文献查找一次文献并进行广泛深入的分析研究综合概括而成的产物。如教科书、综述、工具书、年鉴、大百科全书等。,图 书,连续出版物,特种文献,教科书,工具书,报纸,期 刊,科技报告,专利文献,学位论文,
5、标准规范,政府出版物,产品资料,会议文献,专著,2、按出版形式划分,2、按出版形式划分 图书:是对某专门知识或某学科进行系统论述的一种出版物。其主要特征是内容比较成熟,但相对陈旧。合法出版的图书均有版权页,国际标准书号ISBN(11位-13位)。如教科书、专著等 期刊:是指一些记录的知识比较新颖,所含信息比较大的连续出版物,一般都有固定的期刊名称,按一定时间编定卷号,如每年一卷,每一卷又分若干期,国际标准刊号ISSN 。 Lancet 52:53-9 Int J Oncol 2008, 33(1):153-9 刊名 年,卷(期):起止页码,2、按出版形式划分-特种文献 会议文献 学位论文 科技
6、报告 专利文献 标准文献 政府报告 产品报告,会议文献 (conference、proceeding): 在各种学术、专题会议上发表的论文和报告。 文献特征:会议信息 (会议名称、召开地点时间等) Qi JP, Shao SH, Zhu Y. Mathematical modeling of P53 gene regulatory network. International Conference on Intelligent Systems and Knowledge Engineering, APR 06-07, 2006. DYNAMICS OF CONTINUOUS DISCRETE
7、AND IMPULSIVE SYSTEMS-SERIES B-APPLICATIONS & ALGORITHMS 13: 11-15, Suppl. S DEC 2006,学位论文( dissertation ):高等学校或研究院所的学生在导师指导下从事某一学术课题的研究,为获得某种学位而撰写的学术性较强的研究论文。文献篇幅长、论述循序渐进,实验方法表达详尽。 文献特征:教学机构(大学或研究所)为来源出处。 党建武.神经网络方法求解组合优化问题的研究D.成都:西南交通大学,1996.,专利文献 (patent document) 申请专利时经专利局审查或授权后,定期公开出版的文献。包括专利申请
8、书、专利说明书、专利公报、专利检索工具等与专利有关的一切资料。 文献特征:专利号、发明人、专利权人 例:姜锡洲.一种温热外敷药制备方案:中国, 88105607.3P.1989-07-26.,标准 (standard) 经公认的权威机构批准的,在特定领域内必须执行的规格、规则、技术要求等规范性文献。 文献特征:标准号(ISO、GB) 例:全国文献工作标准化技术委员会第七分委员会. GB/T 5795-1986 中国标准书号S. 北京:中国标准出版社, 1986.,Tips:参考文献著录格式,图书,21,期刊文献,会议论文,学位论文,电子文献,三、文献检索(Information Retriev
9、al) 1、概念 广义:文献检索(Information Retrieval),也称信息检索,是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(Information Storage and Retrieval) 。 狭义:指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。,文献检索,文献检索的概念有狭义和广义之分。 广义的检索包括信息的存储和检索两个过程: Storage Retrieval 本门课程主要侧重于Retrieval这一过程。,2、原理:用
10、户所选定的检索语言(检索策略)与目标文献之间的匹配。,3、文献检索的过程: 例:消化科:近十年有关胃癌筛查的中外文 文献 蓝激光在食管癌诊断中的应用 妇产科:有关多胎产前诊断的外文综述文献 ,Step 1:分析课题 提取概念,课题类型、学科范围、检索年限、信息的深度与广度:开题、申请专利、资料类型 检索需求: 新:及时获得最新的内容,对查全没有过高要求。 准:要解决研究中的具体问题,要求检出的文献有针对性,对查准要求较高。 全:要全面了解某一特定领域的发生、发展和现状,是一种回溯性检索,对查全有较高要求。,Step 2:选择数据库,选择数据库是明确要在哪里找的过程 各种专业数据库 pubmed
11、,cnki,万方,OVID、springer、Cochrane Library. 网上的一些搜索引擎,北医系统可用数据库171种,Step 3:确定检索路径,即检索入口、检索项:题名途径、主题途径、作者途径、引文途径. 进一步细化在哪里找的过程,“字段” 数据库 记录 字段,字段的意义,方便用户使用,为检索者提供检索入口 如果不限定检索字段,通常系统会在所有字段(或默认的常用字段)中检索 在特定字段内进行检索可以提高文章的查准率,字段的意义,例: 著者=杜军保 出版年=2002 Moran JMAU PY=2000 orthopaedicso autoimmune pancreatitisti
12、 hypertensionMeSH,Step 4:拟定检索用词 制定检索式,即选择检索语言 检索语言是一种专门用来描述文献特征和表达检索提问内容的人工语言,是在文献存贮与检索过程中共用的语言。分规范化语言和非规范化语言两种 检索语言的选择要科学、规范, 可以使用*和? 例:“anemi*” “hepatiti?” 可以使用逻辑运算符 and or not 对于不同的数据库,在检索语言的选择上会有不同的要求。,规范化语言:是指对文献检索用语的概念加以人工控制和规范,把检索语言中各种同义词、多义词、近义词、同形异义词等进行规范化处理,使每个检索词只能表达一个概念。 主题词:肿瘤(癌症)、获得性免疫
13、缺陷综合症(艾滋病) 分类号:R743 脑血管疾病 非规范化语言:它对检索用语中的各种同义词、多义词、近义词、同形异义词等不加处理,所以也叫自然语言,如关键词、自由词。,37,检索式是检索策略的逻辑表达式,检索过程中用来表达用户检索提问的逻辑表达式。由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。,Step 5:浏览检索结果并输出,浏览目标文献的信息,选择相关文献并输出,如作者、题名、文献出处等。,Step 6:获取原文,记录文献线索,掌握各种缩写的还原 本馆馆藏(馆藏目录) 本馆电子资源(全文数据库) 网上免费期刊(OA) 馆际互借(联合目录) 向作者索取,44,检索
14、步骤图示:,分析课题,明确检索需求,选择数据库和检索途径,确定检索标识,制定检索式,检索操作,浏览检索结果,调整检索策略(反复),获取全文,3、文献检索的过程 分析课题需求提取主题概念选择数据库 选择检索途径拟定检索用词制定检索 式检索操作浏览检索结果(调整检索策 略重新检索操作)筛选检索结果并输出 (获取原始文献),*关键:制定检索式*,确定检索途径,注意各种检索途径的配合使用 确定检索标识 ,正确使用各种运算符,编制检索提问式 检索过程方案调整,通过上下位词的选择和逻辑算符的应用,可进行扩大或缩小检索范围,使检出的结果符合要求 将课题进行语义分析,提炼出表达概念的检索词,检索词应是不可再分
15、的最小的单元词。,四、数据库分类,文摘索引型数据库(MEDLINE,CBMDisk等) 循证医学数据库(Cochrane Library) 引文分析型数据库(SCI,CMCI、CSCD) 全文型数据库(CNKI, EBSCO,elsevier,OVID,proquest) ?选择全文数据库 or 文摘索引数据库,信息收集 收集、筛选原始信息。 信息存储与标引 提取、标注原始信息的特征,并进行规范化处理。 把每个特征录入到对应的字段(field)中。,数据库的建立,信息源(原始信息),特征1,特征2,特征3,特征4,特征5,特征n,提取特征,数据库对文献的记录方式(CBM),标注特征 规范化处理
16、,中国 图书馆分类法,医学 主题词表(MeSH),格式规范,字段名,书目数据库中,描述一篇文献的 所有字段组成一条记录(record) 一段时间或 某一主题等 范围内的记录集合构成数据库文档(file) 数据库的结构: 文档(File) 记录(Record) 字段(Field),数据库的结构,TI 题名 AU 作者 SO 文献来源 AB 文摘 主题词字段(MeSH) MH - HIV Infections/*prevention & control MH - *HIV Seropositivity MH Male,PubMed的字段,文献题录,56,检索举例:冠心病的治疗,自由词,冠心病,冠状动脉疾病,冠状动脉粥样硬化性心脏病,冠状动脉心脏病,冠状动脉疾病,主题词,文献,治疗,治疗,学习目标,1.掌握信息、情报、文献、知识的基本概念 2.了解科技文献的类型、特点 3.知道数据库的类型与结构 4.掌握信息检索的途径、步骤 5.理解检索式的编写与检索策略的调整 6.熟悉信息网络技术与网络信息检索,