ImageVerifierCode 换一换
格式:PPT , 页数:109 ,大小:3.77MB ,
文档编号:3021915      下载积分:29 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3021915.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(布尔逻辑检索技术课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

布尔逻辑检索技术课件.ppt

1、第一章 文献信息检索基础第一章 文献信息检索基础v第一节 文献信息资源及其检索概述v第二节 文献信息检索系统v第三节 文献信息检索技术v第四节第四节 文献信息检索策略文献信息检索策略一、文献信息的概念v1 1文献文献v2 2知识知识v3 3信息信息第一节第一节 信息检索概述信息检索概述一、一、信息、知识、情报、文献(一)定义v信息(Information):是物质存在的一种方):是物质存在的一种方式、形态或运动状态,是事物的一种普遍属性。式、形态或运动状态,是事物的一种普遍属性。v知识(Knowledge):是人们在认识和改造客):是人们在认识和改造客观世界的实践中所获得的认识和经验的总和。是

2、观世界的实践中所获得的认识和经验的总和。是人们对客观事物的本质和规律的认识。人们对客观事物的本质和规律的认识。v情报(intelligence) :是满足一定需求的、:是满足一定需求的、激活激活了的知识了的知识v文献(Literature,Document):):是记录有是记录有知识的一切载体。知识的一切载体。 记录知识的具体内容; 记录知识的手段:如文字、图像、符号、声频、视频等; 记录知识的物质载体:如纸张、光盘、录像带等; 记录知识的表现形态:如图书、期刊、专利说明书等。(二)关系(二)关系 信息知识情报文献二、文献信息的类型v 按载体的不同,常将文献划分为:按载体的不同,常将文献划分为

3、:1.印刷型 2.2.电子型电子型 3.声像型v 按出版类型,又常将文献划分为:按出版类型,又常将文献划分为:1.图书 2.期刊 3.会议文献 4.学位论文 5.科技报告 6.专利文献 7.WHO出版物v 教科书参考书专著综述期刊论文v论文综述专著教科书()图书()图书 图书:图书:通常被认为是由正式出版社出版的出版物。其范通常被认为是由正式出版社出版的出版物。其范围很广,包括专著、文集、教科书、普及读物、百科全围很广,包括专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等。特征为书、年鉴、手册、词典等。特征为出版社名称出版社名称( Publication 、Press) 、ISBN号

4、号等等 分为阅读型和工具型分为阅读型和工具型v特点:特点:成熟,全面,可靠,时效性差成熟,全面,可靠,时效性差v用途:用途:初步了解一般性问题初步了解一般性问题 v实例:实例:v作者: 胡鞍钢 著v出 版 社: 北京大学出版社v出版时间: 2007-1-1 v字数: 297000 v版次: 1 v页数: 395 v印刷时间: 2007/01/01 v开本: v印次: v纸张: 胶版纸 vI S B N : 9787301115367 v包装: 平装 ()期刊()期刊期刊:俗称杂志。是定期或不定期周期性出的连续出版物,特征为刊名、卷Vol.、期No.、国际标准刊号ISSN期刊分为:学术性学术性(

5、Journal) 情报型:情报型:工具型(Abstracts, Index) 报导型(News)综合型综合型(Review)v特点:特点:数量大,品种多,内容丰富,出版周期短数量大,品种多,内容丰富,出版周期短v用途用途:获取最新研究成果和动态:获取最新研究成果和动态v实例:实例:v 主管:中国科学技术协会主管:中国科学技术协会v 主办:中华医学会主办:中华医学会v 编辑:中华医学杂志编辑委员编辑:中华医学杂志编辑委员会会v 总主编:巴德年总主编:巴德年v 编辑部主任:陈新石编辑部主任:陈新石v 出版:中华医学会杂志社出版:中华医学会杂志社v ISSN 0376-2491v CN 11-213

6、7/R()特种文献()特种文献 特种文献:形式比较独特,一般是单独成册,主要出版特征是号码,主要特种文献有以下八种类型。学位论文学位论文 学位论文:是高等院校硕士(Ms.D)或博士(Ph.D)毕业生为申请学位而提交的毕业论文。 特征:学校名称及学位科技报告科技报告 科技报告:研究机构关于某项科研成果的正式报告,或者是对研究过程中阶段进展情况的实际记录。国防与航空航天方面居多。 特征:报告号 例如:例如:NASA20050082846 (美国宇航局科技报告)(美国宇航局科技报告)ADA207606(美国国防系统研究报告)(美国国防系统研究报告)DE91011930(美国能源系统研究报告)(美国能

7、源系统研究报告)PB 90226341(美国民用系统研究报告)(美国民用系统研究报告)AGARDR775(北大西洋公约组织研究报告)(北大西洋公约组织研究报告)HY93007(航空信息研究报告)(航空信息研究报告) 实例:实例:v 中国核科技报告 China Nuclear Science and Technology Reportv 主办:主办:中国核科技报告中国核科技报告编辑部编辑部v 周期:周期: 半年半年v 出版地:北京市出版地:北京市v 语种:语种: 中英中英v 开本:开本: 16开开ISSN 1671-7430v CN 11-9253/TLv 创刊年:创刊年:1985会议论文会议论

8、文 会议文献:会议文献:主要是学术会议上宣读的论文或交流主要是学术会议上宣读的论文或交流的书面论文,形式有单行本的书面论文,形式有单行本(会议预印本会议预印本preprint)和会议论文集。特征为:会议名称、和会议论文集。特征为:会议名称、时间、地点时间、地点会议论文会议论文v特点:特点:文献论题集中,内容新颖、丰富、专、深、文献论题集中,内容新颖、丰富、专、深、学术性强,能反映出一个国家、一个地区或国际学术性强,能反映出一个国家、一个地区或国际上当前某一科学技术领域的最新成就、最高水平上当前某一科学技术领域的最新成就、最高水平和发展趋势。和发展趋势。 v实例实例专利专利 专利:专利:发明人申

9、请专利时发明人申请专利时 呈交的申请说明书。呈交的申请说明书。一般包括:发明人、发明的详细说明、专利权一般包括:发明人、发明的详细说明、专利权范围、插图等。范围、插图等。 特征:特征:专利号专利号实例:实例:v 输液自动呼叫器 v 福建省大田星海科技开发有限公司福建省大田星海科技开发有限公司 v 程开海程开海 v 1、输液过程中瓶内药液将要滴尽时能提、输液过程中瓶内药液将要滴尽时能提前自动发出声响信号,提醒护理人员注意;前自动发出声响信号,提醒护理人员注意;v 2、旋动呼叫器上的旋钮可直接选择用于、旋动呼叫器上的旋钮可直接选择用于各种规格容量药瓶(袋)输液终了的自动各种规格容量药瓶(袋)输液终

10、了的自动呼叫;呼叫;v 3、自动呼叫后病人躺在床上可直接拉动、自动呼叫后病人躺在床上可直接拉动拉线控制停呼。拉线控制停呼。 政府出版物政府出版物 政府出版物:政府出版物:这是各国政府部门及其设立的专门这是各国政府部门及其设立的专门机构发表、出版的文件,分为行政性文件(如法机构发表、出版的文件,分为行政性文件(如法令统计等)和科技文献(令统计等)和科技文献(3040)。)。标准标准 标准:标准:主要是对工农业产品和工程建设的质量、主要是对工农业产品和工程建设的质量、规格及其检验方法等方面所作的技术规定,是从规格及其检验方法等方面所作的技术规定,是从事生产、建设的一种共同技术依据。事生产、建设的一

11、种共同技术依据。 特征为:特征为:标准号标准号产品资料 产品资料:产品资料:产品资料是制造厂商为了推销产品而产品资料是制造厂商为了推销产品而发出的,以介绍产品性能为主的出版物。发出的,以介绍产品性能为主的出版物。 实例:实例:科技档案科技档案科技档案:科技档案:科技档案是科学技术研究和生产建设部科技档案是科学技术研究和生产建设部门,在科学技术研究和生产建设活动中形成的,有门,在科学技术研究和生产建设活动中形成的,有具体工程对象的技术文件、图样、图表、图片、原具体工程对象的技术文件、图样、图表、图片、原始记录的原本或代替原本的复制本等始记录的原本或代替原本的复制本等282.认识不同内容层次的文献

12、认识不同内容层次的文献一次文献一次文献零次文献零次文献二次文献二次文献三次文献三次文献文献整理文献整理知识重组知识重组知识浓缩知识浓缩v(1)零次文献(Zero Document) 零次文献指未经正式发表或未进入学术交流的最原始的文献。v(2)一次文献(Primary Document):是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,如专著、期刊论文、科技报告、学位论文等。v(3)二次文献(Secondary Document):是将大量无序、分散的一次文献收集、整理、加工、著录其特征,如著者、篇名、分类、主题、出处等,并按一定的顺序加以编排,形成供读者

13、检索所需一次文献线索的新的文献形式,如索引、文摘、目录以及其相应的数据库等。v因其具有的检索功能而称之为检索工具或检索系统。 v (4)三次文献(Tertiary Document):是科技人员围绕某一专题,借助于二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归纳、概括,撰写而成的新的文献。v 表现形式主要有:综述(Review)、述评(Comment)、进展(Progress、Advance)、现状(Update)、发展趋势(Trend)等期刊文献和百科全书、年鉴、手册等参考工具书。 文献级别举例一次文献 二次文献文献级别举例v 三次文献三次文献v 零次文献零次文献 科技文

14、献层次结构科技文献层次结构知识产生 记录 原始文献知识重组 知识浓缩词典 名录 指南手册 年鉴 书目等述评 专著 教科书 论文丛集百科全书等三次文献 期刊论文会议论文科技报告学位论文专利说明书文献整理目录 索引 文摘新书通报等二次文献一次文献零次文献 研究活动(实验、观察、思考)研究活动(实验、观察、思考) 信息的直接记录或传递信息的直接记录或传递 零次文献(创造知识的素材)零次文献(创造知识的素材) 将知识以文字等形式固化将知识以文字等形式固化 一次文献(初始的知识产品)一次文献(初始的知识产品) 将分散的文献序列化将分散的文献序列化 二次文献(一次文献的替代品)二次文献(一次文献的替代品)

15、将知识重新组合,使知识序列化将知识重新组合,使知识序列化 三次文献(浓缩的新的信息产品)三次文献(浓缩的新的信息产品)3.认识不同载体的文献认识不同载体的文献 印刷型文献:纸质 电子型文献: 缩微型文献 声像型文献 机读型文献(电子文献) 多媒体型文献四、文献信息的特点四、文献信息的特点v1.1.数量庞大,增长迅速数量庞大,增长迅速v2.2.文种繁多,但呈明显的英文化趋势文种繁多,但呈明显的英文化趋势v3.3.内容交叉重复内容交叉重复v4.4.文献形式呈现多样化文献形式呈现多样化v5.5.文献分布既集中又分散,但呈专题化或专集化文献分布既集中又分散,但呈专题化或专集化趋势趋势v6.6.知识老化

16、加快,文献寿命(半衰期)缩短知识老化加快,文献寿命(半衰期)缩短 v7.7.交流传播及变化速度加快交流传播及变化速度加快五、文献信息的社会功能五、文献信息的社会功能v1.1.科技文献是科学表现的存在形式,是汇集人类科技文献是科学表现的存在形式,是汇集人类财富的主要场所。财富的主要场所。v2.2.科技文献是衡量科学技术水平的重要依据。科技文献是衡量科学技术水平的重要依据。v3.3.科技文献是传播科学知识的最基本、最主要的科技文献是传播科学知识的最基本、最主要的手段手段v4.4.科技文献是确认科学发现与技术发明优先权的科技文献是确认科学发现与技术发明优先权的认证记录。认证记录。六、检六、检索基本原

17、理索基本原理经选择经选择的信息的信息主题主题分析分析标引标引语言语言表达表达文献文献特征特征标识标识经确立经确立的课题的课题主题主题分析分析检索检索语言语言表达表达文献文献需求需求标识标识信息信息集合集合词表词表存储存储检索检索检索检索结果结果什么样的文献信息什么样的文献信息能够得以输出呢?能够得以输出呢?匹配匹配检索时匹配的检索时匹配的究竟是什么?究竟是什么?第二节 文献信息检索系统v一、文献信息检索系统的构成v二、数据库的结构v三、文献信息检索系统的分类v四、文献信息检索系统的功能一、文献信息检索系统的构成v1.1.信息资源信息资源v2.2.硬件设备硬件设备v3.3.软件条件软件条件v4.

18、4.人力资源人力资源v上述四方面内容构成了文献信息检索系统的空间结构,是系统运行的最基本前提。42二、类型手工检索手工检索检索手段检索手段计算机检计算机检联机检索联机检索光盘检索光盘检索网络检索网络检索43二、类型二、类型文本信息检索数据格式和数据格式和检索技术检索技术多媒体信息检索超媒体和超文本检索三、数据库的结构v(一)从数据库组成的层次来划分 1.1.文档(文档(FileFile) 2.2.记录(记录(RecordRecord) 3.3.字段(字段(FieldField)v(二)从数据库组成的方式来划分 1.1.顺排文档顺排文档 2.2.倒排文档倒排文档v 上述数据库的结构,可用英文单词

19、的单复数形式更直观地表述为: Record Fields (记录)(记录) Database Flies(数据库)(数据库) File Records (文档)(文档) Field searching entry (字段)(检索入口(字段)(检索入口主文档主文档序号:N5序号:N4序号:N3序号:N2序号:N1主题词:S1著者:Au1标题:t1S1:N1,N3S2:N2,N3S3:N1,N4Au1:N1,N4Au2:N3Au3:N4主题词倒排档主题词倒排档著者倒排档著者倒排档主题词检索途径主题词检索途径著者检索途径著者检索途径其它检索途径其它检索途径主文档和倒排文档的关系示意图四、文献信息检索

20、系统的分类v1.书目型数据库 v2.事实数值型数据库 v3.全文型数据库49 书目型数据库书目型数据库全文全文型型数据库数据库事实事实型型数据库数据库数值数值型型数据库数据库类型类型文献信息数据库文献信息数据库v书目型型数据库(bibliographic database): 是二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读版的文摘、题录、目录、索引等。用户可从大量文献记录中筛选出有参考价值的文献源,并依据记录提供的来源指示获取一次文献。v举例:中国生物医学文献数据库、PubMed(P84)、EMBASE(P93)等。1、书目型型数据库v全文型型数据库(Full-tex

21、t Database): 收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。v优点:能直接获取文献原文,集文献检索和全文提供于一体;提供全文字段检索。v 举例:中国学术期刊网络出版总库(CNKI)、万方数据资源的数字化期刊、OVID全文数据库、Elsevier Science的SDOS等。、全文型型数据库、事实型型数据库v事实型型数据库(Fact Database):提供有关事物、人物、机构等方面的事实性信息。v举例:Clinical Trials(临床试验数据库)是通过对自愿接受试验患者的临床研究,观测药物、诊断方法、疫苗和其他治疗方法对

22、某一种疾病或症状是否安全和有效。v数据型数据库(数据型数据库(Numeric Database):提供数值性信提供数值性信息,包括各种统计数据、科学实验数据、各种测量数据息,包括各种统计数据、科学实验数据、各种测量数据等。等。v举例举例:WHOSIS:可以获取以下统计数据和资料:疾病负担统计、可以获取以下统计数据和资料:疾病负担统计、死亡原因统计、世界卫生报告年度统计、卫生从业人员统计、人死亡原因统计、世界卫生报告年度统计、卫生从业人员统计、人口统计、口统计、HIV/AIDS信息与数据、精神病死亡率统计、免疫接种信息与数据、精神病死亡率统计、免疫接种统计等统计数据,以及疾病负担计划、国际疾病分

23、类法及统计等统计数据,以及疾病负担计划、国际疾病分类法及WHO术术语信息系统、卫生系统成就、全球酒精数据库语信息系统、卫生系统成就、全球酒精数据库(Global Alcohol Database)等与卫生和卫生统计有关的资料。等与卫生和卫生统计有关的资料。(P264)v 美国疾病控制与预防中心(美国疾病控制与预防中心(CDC)的)的Data and Statistics等。等。 (P266)、数据型数据库数据型数据库四、文献信息检索系统的功能四、文献信息检索系统的功能v1 1汇集文献信息汇集文献信息v2 2组织文献信息组织文献信息v3 3检索文献信息检索文献信息v上述三者之间的关系如何?上述三

24、者之间的关系如何?v理解这个问题对于整个文献检索课学习的意义何理解这个问题对于整个文献检索课学习的意义何在?在?思考题:思考题:v1.1.信息、知识、情报三者的联系与区别。信息、知识、情报三者的联系与区别。v2.2.分别用抽象文字与具体图示表达上述三者关系分别用抽象文字与具体图示表达上述三者关系的意义。的意义。v3.3.文献级别演化的本质及意义。文献级别演化的本质及意义。v4.4.文献信息综合应用中文献信息综合应用中“综合综合”二字的含义。二字的含义。v5.5.科技图书与科技期刊之与学术生涯。科技图书与科技期刊之与学术生涯。v6.6.信息检索系统中信息检索系统中“系统系统”二字的含义。二字的含

25、义。v7.7.信息检索系统构成与信息检索原理的关系。信息检索系统构成与信息检索原理的关系。v8.8.如何理解信息检索系统的诸多功能。如何理解信息检索系统的诸多功能。第三节 文献信息检索技术一、信息检索技术一、信息检索技术v概念概念 广义的包括信息组织、数据库建设在内的涉及信息科学、情报学、计算机科学等诸多学科领域的技术方法; 狭义仅指从现有的信息资源中提取相关信息的技术方法。信息检索技术信息检索技术v发展阶段发展阶段 手工检索方式:包括纸质文献的检索和缩微式检索; 脱机检索方式:包括机读磁带、磁盘检索、光盘数据库检索等; 计算机联机检索方式; 网络化信息检索方式:如: SCI、E I、Spri

26、nger Link数据库、EBSCO数据库等。布尔逻辑检索技术布尔逻辑检索技术 最常用的方法; 用户的信息需求通过检索提问式表达; 采用布尔代数中的逻辑符AND、OR和NOT作为逻辑组配算符; 计算机根据表达式确定命中文献的基本条件与查找途径,同文档中各篇文献的标识进行匹配。 凡符合条件的文献即为命中文献,予以输出。布尔逻辑检索技术布尔逻辑检索技术v布尔运算符布尔运算符 AND、OR、NOT,分别表示逻辑与、逻辑或、逻辑非三种逻辑运算关系,如图1-3-1所示。 A and B A or B A not B图图 1-3-1 布尔逻辑运算示意图布尔逻辑运算示意图 布尔逻辑检索技术布尔逻辑检索技术名

27、称符号表达式功能逻辑与逻辑与ANDA AND B同时含有提问词同时含有提问词A和和B的文献,的文献,为命中文献为命中文献逻辑或逻辑或ORA OR B凡是含有提问词凡是含有提问词A或或B的文献,的文献,为命中文献为命中文献逻辑非逻辑非NOTA NOT B凡是含有提问词凡是含有提问词A但不含有但不含有B的文献,的文献,为命中文献为命中文献布尔逻辑运算一览表布尔逻辑运算一览表布尔逻辑检索技术布尔逻辑检索技术v逻辑逻辑“与与”,检索表达式为检索表达式为 “A and B”。 数据库中同时含有检索同A和B的文献为命中文献; 作用是缩小检索范围,提高查准率; 例如,查找“胰岛素治疗糖尿病”的文献,检索式为

28、 insulin(胰岛素) and diabetes(糖尿病)。布尔逻辑检索技术布尔逻辑检索技术v逻辑逻辑“或或”,检索表达式为检索表达式为“A or B”。 数据库中的文献中含有检索词A或B的文献为命中文献; 作用是扩大检索范围; 例如,查找“肿瘤”的文献,检索式为cancer(癌) or tumor(瘤) or carcinoma(癌) or neoplasm (新生物)。布尔逻辑检索技术布尔逻辑检索技术v逻辑逻辑“非非”,检索表达式为,检索表达式为“A not B”。 数据库中凡含有检索词A而不含B的文献为命中文献; 作用是缩小检索范围,提高查准率; 例如,查“动物的乙肝病毒(不要人的)

29、”的文献,检索式为 hepatitis B virus(乙肝病毒) not human(人类)。布尔逻辑检索技术布尔逻辑检索技术v布尔逻辑运算的优先顺序布尔逻辑运算的优先顺序 当一个检索表达式含有多个布尔算符时,执行的顺序为not优先运算,and其次,or最后。 可用圆括号改变运算顺序,将需要优先运算者置于圆括号中。 例如,查找“维生素C或维生素E对糖尿病患者肾脏的保护作用”,检索式为:(维生素C or 维生素E)and 糖尿病 and 肾。截词检索截词检索v截词检索,利用截断的词的一个局部即截词,进截词检索,利用截断的词的一个局部即截词,进行检索的技术;行检索的技术;v自动地对同一概念检索词

30、的不同词尾变化、词根自动地对同一概念检索词的不同词尾变化、词根相同等一类提问词进行检索,并自动用相同等一类提问词进行检索,并自动用OR连接连接各词的检出结果,避免文献的漏检和逐词键入的各词的检出结果,避免文献的漏检和逐词键入的麻烦,提高查全率;麻烦,提高查全率;v常用的截词符号有常用的截词符号有“ * ”、“ ?”。截词检索截词检索v分类分类 按是否采用截词符号分为,采用截词符号、不用截词符号; 按截断位置的不同分为,右截词、左截词、中间截词; 按截断的字符数量的不同分为,无限截词、有限截词。邻近检索邻近检索v邻近检索(邻近检索(Proximity Searching)是用来表)是用来表示检索

31、词与检索词之间位置关系的检索技术,通示检索词与检索词之间位置关系的检索技术,通常用位置算符来实现;常用位置算符来实现;v采用的位置算符有采用的位置算符有near,with。 “near”,表示检索词位置相邻,检索词出现的顺序可前可后,如gene NEAR apoptosis; “with”,表示检索词位置相邻,且两词出现的顺序与输入顺序一致,如liver WITH cancer。限定检索限定检索v限定检索(限定检索(limit Searching)又称限定字段检)又称限定字段检索(索(limit Field Searching),是利用检索词),是利用检索词出现的字段进行的检索;出现的字段进行

32、的检索;v用户可以指定检索某一字段或某几个字段以使检用户可以指定检索某一字段或某几个字段以使检索结果更为准确,减少误检;索结果更为准确,减少误检;v检索系统的限定检索会采用缩写形式的字段标识检索系统的限定检索会采用缩写形式的字段标识符;符; 如 TI表示Title,AD表示Address。扩展检索扩展检索v扩展检索(扩展检索(Expand Searching)是同时对多)是同时对多个相关检索词执行逻辑或检索的技术;个相关检索词执行逻辑或检索的技术;v即当用户输入一个检索词后,系统不仅能检出该即当用户输入一个检索词后,系统不仅能检出该检索词的文献,还能检出与该检索词同属于一个检索词的文献,还能检

33、出与该检索词同属于一个概念的同义词或下位词的文献,概念的同义词或下位词的文献, 如PubMed中主题词的扩展检索。加权检索加权检索v加权检索(加权检索(weighing searching)不仅检索)不仅检索提问词是否存在,而且计算提问词的权值,当权提问词是否存在,而且计算提问词的权值,当权值之和超过阈值的记录才能在数据库中被检出来。值之和超过阈值的记录才能在数据库中被检出来。 在某些数据库中表现为仅检索主要概念主题词,如MEDLINE; 而有些数据库表现为词频检索,如中国学术期刊全文数据库。精确检索和模糊检索精确检索和模糊检索v精确检索(精确检索(Exact Searching)是指所检信息

34、)是指所检信息与输入的词组完全一致的匹配检索技术;与输入的词组完全一致的匹配检索技术; 在许多系统中用引号来表示,如检索“Acute Pancreatitis”;v模糊检索(模糊检索(Fuzzy Searching)允许所检信息)允许所检信息与检索提问之间存在一定的差异。与检索提问之间存在一定的差异。 如检索Acute Pancreatitis,可检索出Acute necrotizing Pancreatitis、Acute gallstone Pancreatitis等。跨库检索跨库检索v跨库检索(跨库检索(Cross database searching、One-stop searchin

35、g)是一次对多个数据库)是一次对多个数据库同时进行检索的技术。同时进行检索的技术。 跨库检索能为用户提供统一的检索接口,将用户检索需求转化为不同数据库的检索表达式,并发地检索本地和广域网上的多个分布式异构数据库,并对检索结果加以整合,以统一的格式将结果呈现给用户。跨库检索跨库检索相关信息反馈检索相关信息反馈检索v相关信息反馈检索,是将与已检结果存在某种程相关信息反馈检索,是将与已检结果存在某种程度相关的信息检索出来的检索技术,多由检索系度相关的信息检索出来的检索技术,多由检索系统自动进行检索。统自动进行检索。 如Google(http:/)的“类似网页”、PubMed的“Related Art

36、icles”。相关信息反馈检索相关信息反馈检索智能检索智能检索v自动实现检索词、检索词对应主题词及该主题词自动实现检索词、检索词对应主题词及该主题词所含下位词的同步检索。所含下位词的同步检索。v如中国生物医学文献服务系统(如中国生物医学文献服务系统(SinoMed)的)的智能智能检索。PubMed的“自动词语匹配检索”属于智能检索。二、多媒体信息检索技术二、多媒体信息检索技术v基于内容的检索基于内容的检索 基于内容的检索(Content Based Retrieval,CBR),主要是对多媒体对象的语义、媒体的视觉特征或听觉特征进行检索。v基于内容的图像检索基于内容的图像检索 基于内容的图像检

37、索(Content Based Image Retrieval,CBIR) 使用了可以直接从图像中获得的客观的视觉内容特征,如颜色、纹理、形状等来判断图像之间的相似性。基于内容的图像检索基于内容的图像检索 现有图像检索技术研究的主流。 与传统数据库技术相结合,可以方便地实现海量多媒体数据的存储和管理;与传统Web搜索引擎技术相结合,可以用来检索html网页中丰富的多媒体信息; 还可以广泛应用在多媒体数据库、知识产权保护、数字图书馆、网络多媒体搜索引擎、交互电视、艺术收藏和博物馆管理、遥感和地球资源管理等许多领域中。三三、可、可视视化信息检化信息检索技术索技术v信息可视化(信息可视化(Infor

38、mation visualization) 是将抽象数据用可视的形式表示出来, 以利于分析数据、发现规律和决策制定。 可实现对信息数据的分析和提取,以图形、图像、虚拟现实等易为人们所认识、可视的方式,展示数据间的复杂关系、潜在信息和发展趋势,以便更好地掌握和利用信息资源。可视化检索可视化检索v可视化检索(可视化检索(Visual Retrieval)是信息可视)是信息可视化的一种。是指把文献信息、用户提问、各类情化的一种。是指把文献信息、用户提问、各类情报检索模型以及利用检索模型进行信息检索的过报检索模型以及利用检索模型进行信息检索的过程中不可见的内部语义关系转换成图形,在一个程中不可见的内部

39、语义关系转换成图形,在一个二维或三维的可视化空间中显示出来。二维或三维的可视化空间中显示出来。 可视化检索的特点可视化检索的特点v检索过程透明化检索过程透明化 v检索结果输出高效性检索结果输出高效性 v更为有效的检索结果排序机制更为有效的检索结果排序机制 v有效的用户反馈机制有效的用户反馈机制 第一章 文献信息检索基础第四节 文献信息检索策略一、文献信息检索途径一、文献信息检索途径v 检索途径为检索系统的检索入口,即检索系统所检索途径为检索系统的检索入口,即检索系统所提供的、用以查询获取资源的各种标识,在计算提供的、用以查询获取资源的各种标识,在计算机检索系统中通常表现为字段检索。机检索系统中

40、通常表现为字段检索。主题词检索主题词检索v主题词检索途径,是利用主题词(主题词检索途径,是利用主题词(Subject Headings)作为检索入口来查找文献;)作为检索入口来查找文献; 主题词是经过优选和规范化处理的词汇,由主题词表来控制;v目前支持主题词途径的检索系统主要有,目前支持主题词途径的检索系统主要有,CBMDisc和和PubMed。自由词检索自由词检索v 通过从文献篇名、正文或文摘中抽取出来的能表通过从文献篇名、正文或文摘中抽取出来的能表达文献主要内容的单词或词组查找文献的检索途达文献主要内容的单词或词组查找文献的检索途径。径。v自由词途径,灵活、自由、直观、符合用户习惯,自由词

41、途径,灵活、自由、直观、符合用户习惯,为目前检索系统中应用最为广泛的一种检索途径;为目前检索系统中应用最为广泛的一种检索途径;v但自由词因未经规范化处理,检索时必须同时考但自由词因未经规范化处理,检索时必须同时考虑到与检索词相关的同义词、近义词等,容易造虑到与检索词相关的同义词、近义词等,容易造成漏检。成漏检。分类检索分类检索v分类检索途径是利用文献在分类体系中的位置分类检索途径是利用文献在分类体系中的位置(类目名称或分类号)作为检索入口查找文献的(类目名称或分类号)作为检索入口查找文献的途径,可满足用户从学科、专业等内容出发获取途径,可满足用户从学科、专业等内容出发获取文献的需要。文献的需要

42、。 例如,CBMDisc提供的分类途径,即以文献在中国图书馆分类法中的分类号作为检索入口来查找文献。引文检索引文检索v引文检索途径,是利用引文(引文检索途径,是利用引文(citation,即文章,即文章末尾所附参考文献)这一特征作为检索入口查找末尾所附参考文献)这一特征作为检索入口查找文献的途径;文献的途径;v许多检索工具提供的引文检索途径允许以引文中许多检索工具提供的引文检索途径允许以引文中出现的任何信息(如作者、题名、出处)等作为出现的任何信息(如作者、题名、出处)等作为检索入口。检索入口。 如Web of Science的Cited Reference Search(引文检索)。缺省检索

43、缺省检索v缺省检索是指自动在脊索系统预先设定的多个字缺省检索是指自动在脊索系统预先设定的多个字段中同时进行检索。段中同时进行检索。 例如,在CBMDisc的基本检索界面直接输入检索词,系统默认在缺省字段中进行检索即同时在中文题名、关键词、主题词、文摘、刊名、特征词等字段进行检索。其它途径其它途径v著者检索著者检索 利用文献上署名的作者、编者或机关团体名称作为检索入口查找文献的途径。v题名检索题名检索 利用题名(Title,如书名、刊名、篇名等)作为检索入口查找文献的途径。v序号检索序号检索v机构检索机构检索二、文献信息检索策略二、文献信息检索策略v检索策略的含义检索策略的含义 广义的检索策略是

44、指用户根据检索需求选择相应的数据库、确定检索方式、检索途径及相应检索表达式进行检索的一系列操作或方案,是用户检索目标的体现; 狭义的检索策略仅指用户确定检索表达式进行检索的系列操作。检索策略的构建检索策略的构建v1.分析研究课题,明确检索要求;分析研究课题,明确检索要求;分析课题要解决的问题,即它所包含的概念和具体要求及它们之间的关系;是制定检索策略的根本出发点,也是检索效率高低或成败的关键。 分析课题的主题内容 确定课题的文献类型 确定检索时间范围 分析用户的检索评价要求检索策略的构建检索策略的构建v2.选择检索系统,确定检索方法;选择检索系统,确定检索方法; 根据检索课题的要求,选择最能满

45、足检索要求的检索系统或工具书; 数据库的选择原则,即3C原则: Content,即数据库的内容、学科范畴、文献质量、数据库类型和文献来源; Coverage,即数据库和及时性,数据库的更新频率和周期; Cost,即检索成本。检索策略的构建检索策略的构建v3.确定检索途径,编写检索策略表达式;确定检索途径,编写检索策略表达式; 根据信息需求或检索课题的已知条件和检索要求,以及所选定的信息检索系统所提供的检索功能,确定适宜的检索途径。 检索途径确定后,编写检索策略表达式。检索策略的构建检索策略的构建v4.评价检索结果,修正检索策略;评价检索结果,修正检索策略; 按照预定的检索策略进行检索,并对检索

46、结果的相关性进行分析、评价; 如果满足自己的检索需求,将检索结果输出;如对检索结果不甚满意,应对检索策略进行调整,以获取更好的检索结果。检索策略的调整检索策略的调整v扩大检索扩大检索 重新选择数据库:选择多个数据库进行检索,或增加所检数据库的检索年限; 选择多种检索方式:采用多种检索方式相结合,可以适当扩大检索; 重新选择检索途径:如选择篇名字段检出结果较少时,可选择文摘、组合字段或全文字段,获取较多检出结果。检索策略的调整检索策略的调整 重新建构检索表达式: 主题词检索时采用扩展检索,选用所有副主题词或扩展下位副主题词; 自由词检索时考虑其同义词、近义词等,并用OR相连; 采用截词检索,且截

47、词不宜太长; 去掉次要的主题词或非核心的检索词,减少AND组配面; 对检索词不做限定; 采用邻近算符检索时,不要过于严格等。检索策略的调整检索策略的调整v缩小检索缩小检索 重新选择数据库:减少所检数据库的数量,或减少所检数据库的检索年限; 选择最佳检索方式:如选择高级检索或专家检索,输入较多的限定条件,可以适当缩小检索; 重新选择检索途径:如全文字段检出文献较多时,可重新选择在篇名、关键词和文摘等字段。检索策略的调整检索策略的调整 重新建构检索表达式 尽量采用主题词检索,并借助主题词表选择更专指的下位词进行检索,选择特定的限定词进行组配检索; 自由词检索时进行各种限定; 采用文献形式特征进行限定; 增加AND的组配面,使检索表达式更为准确第表达检索需求;减少OR的组配面; 用运算符(如NOT、-)排除带有干扰性的概念或不需要包含的概念; 词语检索时采用精确检索等。文献信息检索的步骤文献信息检索的步骤分析课题,明确实质需求选择合适的工具数据库概念分析,并转换成系统检索用词拟订检索提问式或检索途径检索检索结果是否满意修正调整检索策略输出检索结果yesno图图1-4-1 检索流程图检索流程图

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|