1、南方医科大学医学情报学教研室 张政宝 Tel: 020-61648053 E-mail: newinfoman,信息资源获取与应用 绪论,绪论,课程简介 几个基本概念 文献的类型与级别 检索语言及其应用(重点) 检索策略与检索技术(重点),课程简介,内容体系 课程安排 上网账号 精品课程网站:,观察两张照片有什么区别?,苏联最早一批宇航员合影,后排站着的格里戈里耶奈尔尤伯夫(上图)后来被人从照片上抹去(右图)。,失踪的宇航员,马家窑。人抬、肩扛。 1959国庆观礼台,信息分析无处不在,日本从新闻联播和电视剧着手研究中国 中国电视剧成日本民间智囊研究课题 外国借用互联网图片搜索引擎捕捉中国情报
2、美国地质专家凭录像岩石判断:拉登藏身阿富汗西南深谷,信息素养:信息检索其实离我们很近,广州某公司在报纸上刊登了一则招聘营销人员的招聘启事,应聘条件、工资待遇等内容一应俱全,参加笔试、面试等要求也非常明确,可通篇启事从头看到尾,就是没有发现应聘的联系方法。 多数人认为这是招聘单位疏忽或是报社排版错误,于是,便耐心等着报社刊登更正或补充说明。 有3位应聘者见招聘的岗位适合自己,不是等待: 小王通过因特网搜索 小张立即通过114查号台查询 小刘依稀记得该公司在某商业区有一个广告牌,于是骑车围着城区转了一下午,终于找到了广告牌,信息、知识、情报、文献的基本概念,信息:信息是物质存在的一种方式、形态或运
3、动状态,是事物的一种普遍属性,一般指数据、消息中包含的意义,可以使消息中所描述事件的不定性减少。 知识:人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。 情报:为解决一个特定的问题所需要的激活了的、活化了的特殊知识或信息。 情报的基本属性:知识性、传递性、效用性,信息、知识、情报、文献的基本概念,文献:记录有知识的一切载体。 (GB3792.1-83文献著录总则) 文献的三个基本要素: 记录知识的具体内容; 记录知识的手段,如文字、图形、符号、声频、视频等; 记录知识的物质载体,如纸张、光盘、录像带等; 信息、知识、情报与文献的关系,文献的类型与级
4、别,目,一、文献的类型(按载体类型分): 印刷型:传统的图书、期刊等 视听型:唱片、录音带、录像带等 缩微型:缩微胶卷、缩微胶片等 数字型(或电子型):电子图书、电子期刊、数据库等,文献的类型与级别,二、文献的级别(按文献加工深度分) 一次文献:即原始文献,指著者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作。 例如:专著、期刊论文、研究报告、会议文献、专利文献、学位论文、会议论文、译文、电子期刊、电子图书等。,文献的类型与级别,二、文献的级别(按文献加工深度分) 二次文献:将大量无序、分散的一次文献收集、整理、加工、著录,并按一定的顺序加以编排,形成可供检索一次
5、文献线索的新的文献形式。因其检索功能而称之为检索工具或检索系统。 例如:题录、目录、索引、文摘等。 题录:以期刊论文为例,加下划线部分为文献出处。 题名/著者/期刊名.年,卷(期).页码,文献的类型与级别,二、文献的级别(按文献加工深度分) 三次文献:围绕某一专题,利用二次文献的检索,在吸取一次文献内容的基础上形成的文献。如综述、述评、进展等期刊文献和百科全书、年鉴、指南、手册等参考工具书。 综述(Survey, Review)是指综合分析和描述一定时间范围内某一学科或专业科研发展和现状,并预测未来的一类文献。,文献的类型与级别,二、文献的级别(按文献加工深度分) *零次文献:未经信息加工,直
6、接记录在载体上的原始信息,如实验数据、试验记录、调查材料、设计草图、私人笔记、口头交流的信息等。,检索语言及其应用,检索(Retrieval):利用检索工具查询问题答案的全过程。 文献检索(Literature retrieval):指以获取文献为目的,科学地借助各种检索工具,查询相关文献资料的过程。 信息检索(Information retrieval):指从任何信息集合中查出所需信息的活动、过程和方法,有广义和狭义两种理解。广义的信息检索还包括信息存储,合称信息存储与检索。狭义的信息检索仅指信息的查找过程。,检索语言及其应用,检索语言是信息存储与检索过程中描述信息特征和表达用户信息提问的一
7、种人工语言。 它是根据文献的外表特征或者内容特征,把某些具有检索意义的语言或符号加工编制成为文献信息检索服务的特殊语言。 检索语言的主要作用是对文献的外表特征和内容特征进行多层次描述,提供多种检索途径,以方便用户从不同角度进行检索查找。,检索语言的结构,检索语言,描述文献外表特征,描述文献内容特征,书刊篇名题名索引(途径) 著者姓名著者索引(途径) 文献序号序号索引(途径) 引用文献引文索引(途径),体系分类语言分类索引(途径) 主题语言(单元词、关键词、叙词等) 代码语言(分子式、结构式等),分类语言,中国图书馆图书分类法(中图法) 国际十进分类法(Universal Decimal Cla
8、ssification, UDC) 美国国会图书馆图书分类法(Library of Congress Classification, LC),中图法基本大类,A 马克思主义、列宁主义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经 济 G 文化、科学、教育、体育 H 语言、文学 I 文学 J 艺术 K 历史、地理,N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、劳动保护科学(安全科学) Z 综合性图书,R 医药卫生,R1 预防医学、卫生学 R2 中国医学
9、R3 基础医学 R4 临床医学 R5 内科学 R6 外科学 R71 妇产科学 R72 儿科学 R73 肿瘤学 R74 神经病学与精神病学 R75 皮肤病学与性病学 R76 耳鼻咽喉科学 R77 眼科学 R8 特种医学 R9 药学,主题语言,关键词:指出现在文献的标题、文摘或全文中,能表达文献实质内容的,或者能被人们作为检索入口的关键性专业名词术语。是一种没有规范化的自然语言,又称为自由词。 主题词:是一种反映文献内容主题、经过严格规范化了的人工语言。即是将反映文献主题的各种同义词进行书写形式的统一化后定下的检索语言。,例:肺癌的手术治疗,肺癌 肺鳞状细胞癌 肺母细胞瘤 肺类癌 肺腺癌 肺肿瘤
10、外科学,主题词,关键词(自由词),副主题词,医学主题词表 (MeSH词表) 汉语主题词表 中医药学主题词表,主题语言,检索策略与检索技术,检索策略: 1.课题分析,明确检索目的; 2.根据检索要求,选择检索工具; 3.确定检索途径,制订检索策略; 4.评价检索效果; 5.调整检索策略; 6.根据文献出处,获取原始文献。,检索效果的评价,检出的相关文献量 检出的文献总量,检出的相关文献量 系统中相关文献总量,查准率 =,查全率 =,100%,100%,数据库(Database)是能满足某种特定目的或某一特定数据处理系统需要的一种数据集合,它可以由一个或多个文档组成。 文档(File)是数据库中一
11、部分记录的集合。 记录(Record)是数据库中的基本文献单元,一条记录往往记录着一篇文献的相关信息。 字段(Field)是组成记录的基本信息单元。每一个字段都描述文献的某一方面的特征,包括外表特征和内容特征,如题名、作者、刊名、出版年、主题词等等。各个描述文献一部分特征的字段组合就成了记录。,数据库及其结构,数据库,文档,记录字段(如题名、作者、主题词、摘要等) 记录字段 ,数据库及其结构,文档 索引 索引 ,每条记录由若干个字段组成,计算机信息检索主要技术,布尔逻辑检索 截词检索 指定字段检索,布尔逻辑检索,布尔逻辑检索是检索系统中应用最为广泛的检索技术,是最简单、最基本的匹配模式,其理论
12、基础是集合论与布尔逻辑。 布尔逻辑检索采用布尔逻辑表达式来表达用户的检索要求。布尔逻辑表达式是指通过布尔逻辑运算符来连接检索词,以及表示运算优先级的括号组成的一种表达检索要求的算式。 例: (肺癌 or 肺肿瘤)and 手术,常用的逻辑运算符有: 逻辑“与” (and) 逻辑“或” (or) 逻辑“非” (not),布尔逻辑检索,布尔逻辑运算符,1. 逻辑“与” :是具有概念交叉关系和限定关系的一种组配(通常用 and 表示)。,检索式A and B,表示检出的文献中必须同时包含检索词A和B。其作用是缩小检索范围,提高查准率。,例:青霉素 and 肺炎,2. 逻辑“或” :是具有概念并列关系的
13、一种组配(通常用 or 表示)。,检索式A or B ,表示检出的是含有检索词A或检索词B,或同时含有A和B的文献。其作用是扩大检索范畴,提高查全率。,例:乙肝 or 乙型肝炎,布尔逻辑运算符,3. 逻辑“非”:是具有不包含某种概念关系的一种组配 (通常用“not”或 “and not”表示)。,检索式A not B,表示检出文献只包含检索词A而不包含检索词B。其作用是缩小检索范围。,例:阿霉素 not 表阿霉素,布尔逻辑运算符,截词检索是在检索时针对检索词附加一个截断符号,指明该检索词在与文献数据库的词比较时,采取完整匹配还是部分匹配。 截词符分为无限截断和有限截断。 无限截断:一个截词符代
14、表多个字符,常用截词符 “*”。有前截断、中截断、后截断之分。 后截词符:如: vaccin*,可以查出vaccine; vaccines; vaccination; post-vaccinal 等。,截词检索,有限截断:一个截词符只能代表一个字符,常用截词符 “?”(又称通配符)。 例: 环孢?素,可以查出环孢霉素、环孢菌素; Leukemi?,可以查出Leukemia、Leukemic、Leukemid等。,截词检索,指定字段检索是指为了达到某种检索目的,把检索的范围限制在某个或某几个字段内进行的检索方法。,指定字段检索,中国生物医学文献服务系统(SinoMed),中国期刊全文数据库 (CJFD),绪论,课程简介 几个基本概念 文献的类型与级别 检索语言及其应用(重点) 检索策略与检索技术(重点),