ImageVerifierCode 换一换
格式:PPT , 页数:345 ,大小:2.28MB ,
文档编号:2804054      下载积分:32 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-2804054.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(文献检索与论文写作ppt-ppt课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

文献检索与论文写作ppt-ppt课件.ppt

1、2020/12/21第一节第一节 信息信息一、信息的概念哈特莱:信息是选择通信符号的方式 申 农:信息是使不确定性消除的某种东西 维 纳:信息是我们适应外部世界,并把适应反作用于外部世界的过程中同外部世界进行相互联系、相互作用、相互交换的一种内容 2020/12/22第一章 绪论中国大百科全书: 狭义:用来消除对客观事物认识的不定性的东西,是符号、信号或消息所包含的内容。 广义:本体意义说,信息泛指一切事物(物质的、精神的)运动的状态和方式,包括事物内部的状态和方式以及与外部联系的状态和方式。 认识论意义说,信息是关于事物运动状态和运动方式的反映,它可以用来消除人们认识上相应的不确定性。 精品

2、资料2020/12/24 你怎么称呼老师? 如果老师最后没有总结一节课的重点的难点,你是否会认为老师的教学方法需要改进? 你所经历的课堂,是讲座式还是讨论式? 教师的教鞭 “不怕太阳晒,也不怕那风雨狂,只怕先生骂我笨,没有学问无颜见爹娘 ” “太阳当空照,花儿对我笑,小鸟说早早早”2020/12/25第一章 绪论二、信息的特点 1、依附性 2、传递性 3、共享性4、价值不确定性 5、可开发性6、可存储性 7、时效性2020/12/26第一章 绪论三、相关概念1、数据 是未经整理,可判读的描述事物特征的符号序列,记录或载荷信息。 如:图书馆2011年上半年电子期刊利用人数 220 300 456

3、 611 723 831 1月 2月 3月 4月 5月 6月 信息:在特定背景下,经过整理,能够表达一定意义的一组数据。2020/12/27第一章 绪论2、知识 是人们对客观事物存在和运动规律的认识。 如:一个苹果一个苹果二个苹果 一间教室一间教室二间教室 112 知识是信息的一部分,即反映客观世界规律性认识的那部分信息才是知识 2020/12/28第一章 绪论3、情报 辞海辞源:“战时关于敌情之报告” 情情况 报报道、交流、传递 通常的解释:为解决特定问题,传递给特定对象的有用知识,具有知识性、针对性、传递性、及时性。 情报是特定的知识,是知识的一部分。2020/12/29第一章 绪论4、文

4、献 论语“八佾” 古代:文典籍 献贤者 现代:记录有知识的一切载体。具体讲,用文字、图形、符号、声频、视频等手段记录下来的人类知识的一切物质载体。 两个要素: 知识 物质载体2020/12/210第一章 绪论5、资料 广义上,对人有帮助的物质材料。 狭义上,是对生产、科研、教学、管理决策 起参考借鉴作用的文献。 如:写论文查找的相关资料2020/12/211第一章 绪论请思考:信息、数据、知识、情报、文献和资料这六者之间的关系是什么?2020/12/212第一章 绪论第二节第二节 信息源与信息资源信息源与信息资源一 信息源 1、概念 产生信息的事物,信息的生成源。 2020/12/213第一章

5、 绪论2、分类 按照来源形式分: 1) 个人信息源 2) 实物信息源 3) 文献信息源 4) 数据库信息源 5) 组织机构2020/12/214第一章 绪论按照生产过程分 一次信息源 二次信息源 三次信息源2020/12/215第一章 绪论一次信息:一次文献是人们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献,也常被称为原始文献原始文献(或叫一级文献一级文献),其所记载的知识、信息比较新颖、具体、详尽 。2020/12/216第一章 绪论一次文献的特点:一是内容具有独创性。二是内容叙述具体、详尽,有参考学习利用价值。三是一次文献数量庞大、分散在期刊、论文集、图书、会议论文、学文

6、论文等等各种文献中,检索困难。2020/12/217第一章 绪论二次文献:二次文献又称二级次文献,是对一次文献进行加工整理后的产物,即对无序的一次文献的外部特征如题名、作者、出处等进行著录,或将其内容压缩成简介、提要或文摘,并按照一定的学科或专业加以有序化而形成的文献形式,如目录、文摘杂志(包括简介式检索刊物)等 2020/12/218第一章 绪论l二次文献的特点:l1.浓缩性浓缩性,是对原始文献内容的浓缩,是情报工作的重要工具,成为一种信息文体;l2.汇集性汇集性,二次文献经过情报工作者加工,把有关内容汇集在一起,能比较全面地反映某个学科、专业或专题在一定时空范围内的文献线索;l 3.系统性

7、系统性,由于二次文献是经过情报工作者加工,所以它能系统地反映某个学科、专业或专题在一定时空范围内的最新研究成果 2020/12/219第一章 绪论l三次文献:指对有关的一次文献一次文献、二次文二次文献献进行广泛深入的分析研究之后综合概括而成的产物,人们常把这类文献称为“情情报研究报研究”的成果,包括综述、专题述评、学科年度总结、进展报告、数据手册、以及文献指南等。2020/12/220第一章 绪论l注:一次文献和三次文献都融入了作者的智力劳动智力劳动,是信息分析信息分析的过程。而二次文献只是信息有序化有序化的过程,是信息加工信息加工的过程。2020/12/221第一章 绪论二 信息资源的概念

8、狭义:指信息本身。 广义:指信息及其相关因素的集合。 具体讲:即信息及信息的收集、加工、存贮、处理、传输和利用相关的技术、设施、资金和人。 2020/12/222第一章 绪论 三 信息源与信息资源 信息源包括信息资源,信息资源是其中的一种信息源。但是,信息资源是有用的并且经过组织、有序的、可存取的信息的集合,并非所有的信息源都是信息资源。因此,信息资源一定是信息源,信息源不一定是信息资源。2020/12/223第一章 绪论第三节 信息素质一、信息素质概念 这一概念是1974年由美国信息产业协会美国信息产业协会的主席保罗保罗泽考斯基泽考斯基首次提出。“利用大量的信息工具及主要信息源使问题得到解决

9、的技能”2020/12/224第一章 绪论内涵:一是解决问题需要信息。二是具有利用信息的技能。三是利用信息能够解决问题。举例:要买房子的问题?举例:要买房子的问题?2020/12/225第一章 绪论 信息素质不仅蕴含着客观性客观性发掘和利用信息的基本技能,还包括主观性主观性认识和判断信息的基本品质。主要包括信息意识、信息能力和信息道德 2020/12/226第一章 绪论二、信息意识 对信息具有特殊的、敏锐的感受力感受力和长久的注意力注意力,是人对各种信息的自觉心理反应。举例:就业信息-敏锐的感受力 科学研究-长久的注意力2020/12/227第一章 绪论三、信息能力 具体包括信息获取能力、信息

10、评价能力、信息组织能力、信息利用能力和信息交流能力。 信息获取能力:利用现有信息资源和检索工具,查找并获取所需信息的能力。2020/12/228第一章 绪论信息评价能力:对信息进行筛选、判断、甄别和评价的能力。信息组织能力:对无序的信息,根据一定的规则和方法,使其成为有序的信息。信息利用能力:对掌握的信息进行深层次的加工,从中获取所需的特定信息,进而产生新的信息的能力。信息交流能力:交换信息和传递信息的能力。2020/12/229第一章 绪论四、信息道德 人们在信息活动中应遵守的行为规范,如保护知识产权保护知识产权、尊重个人隐私尊重个人隐私、抵制不抵制不良信息良信息等。2020/12/230第

11、一章 绪论1、处理好信息产权和信息共享的关系。2、处理好信息准确性和信息自由的关系。3、抵制信息犯罪,信息窃取和盗用、信息敲诈和勒索、信息攻击和破坏、信息污染和滥用等等。2020/12/231第一章 绪论五、信息素质评价标准:美国:美国高等教育信息素养能力标准英国:“信息素养的7个支柱模型”澳大利亚:澳大利亚信息素养标准2020/12/232第一章 绪论六、信息素质教育 指为启发人的信息意识、提高人的信息能力、提升人的信息道德水平所进行的一系列社会教育和培训活动。 目的不仅是培养人们的信息检索技能和计算机应用技术,更重要的是培养人们对现代信息环境的理解能力、应变能力以及运用信息的自觉性、预见性

12、和独立性,从而提高人们的综合素质。 2020/12/233第一章 绪论1、教学内容基础层次:图书馆入馆教育、计算机网络基本知识等普通层次:信息检索、信息加工等高级层次:信息分析、知识管理等2020/12/234第一章 绪论2、教学模式(1)基于资源的协作式教学模式(2)基于问题的情景教学模式(3)自主学习模式(4)参与式教学模式2020/12/235第一章 绪论 练习:以小组为单位,依据美国高等教育信息素养能力标准的评价指标,设计常州大学大学生信息素质的调查问卷。2020/12/236第二章 信息检索基础原理第一节 信息资源检索概述一 概念与类型1、概念 广义和狭义2020/12/237第二章

13、 信息检索基础原理 从广义上讲,信息资源检索包括两个过程,一是信息资源的存储,既是对有关信息进行选择,并对信息特征进行著录、标引和组织,建立信息数据库的过程。二是信息资源的检索,既是根据提问制定检索策略和表达式,利用数据库查找信息资源的过程。 从狭义上讲,信息资源检索指后部分。2020/12/238第二章 信息检索基础原理2、类型 按检索结果内容划分: 文献信息检索,数据信息检索,事实信息检索。2020/12/239第二章 信息检索基础原理 文献信息检索:以文献原文为检索对象的一种检索。通常通过目录、索引、文摘等二次文献二次文献,以原始文献的出处为检索目的,可以向用户提供原文献的信息。举例:图

14、书馆的书目查询系统2020/12/240第二章 信息检索基础原理 数据检索:以文献中的数据数据为对象的一种检索。这种检索将经过选择、整理、鉴定的数据存入数据库中,根据需要查询处理,以回答某一问题。这些数据包括物理性能常数、国民生产总值统计数据、外汇之处等等。常用的工具书有年鉴、地方志等。举例:1996年广州人口和面积状况2020/12/241第二章 信息检索基础原理事实检索:以文献中的事实为对象,检索某一事件发生的时间、地点或过程。主要使用的工具书有年鉴、大事记、百科全书、史料汇编等。例如:“安史之乱”的相关材料。2020/12/242第二章 信息检索基础原理3、信息检索示意图信息源主题概念数

15、据库检索标识命中文献信息需求主题概念信息检索语言检索提问2020/12/243第二章 信息检索基础原理二、信息检索的发展阶段1、脱机检索阶段(1954-1964)2、联机检索阶段(1965-1991)3、网络化联机检索(1991至今)2020/12/244第二章 信息检索基础原理 1946年世界上第一台计算机问世后,在50年代初就应用在信息检索的领域。脱机检索是用户不与检索系统发生直接联系,只需把检索要求送往检索中心,由检索人员进行文献检索的一种检索方式。2020/12/245第二章 信息检索基础原理 1965年美国系统发展公司美国系统发展公司研制成功联联机情报检索软件机情报检索软件ORBIT

16、,开始了联机检索阶段。与此同时,美国洛克希德公司洛克希德公司研制成功了Dialog检索系统检索系统,至今,任然为世界上最著名的信息检索系统。2020/12/246第二章 信息检索基础原理第二节 信息检索方法和策略一、传统信息检索的一般方法1、常规检索方法 又称直接法,是直接利用检索系统检索文献信息的方法。又分为顺查法顺查法、倒查倒查法法和抽查法抽查法。2020/12/247第二章 信息检索基础原理(1)顺查法 按照时间时间的顺序,由远而近检索文献的方法。这种方法能收集到某一课题的系统系统文献,适用于较大课题的文献检索。 例如:已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最

17、初的年代开始,逐渐向近期查。2020/12/248第二章 信息检索基础原理(2)倒查法由近及远,从新到旧,逆着时间的顺序进行文献检索的方法。此法的重点是放在近期的文献上。2020/12/249第二章 信息检索基础原理(3)抽查法针对项目的特点,选择有关项目的文献信息最可能出现或者最多出现的时间段,进行重点检索的方法。这种方法较少的时间获得最多文献。2020/12/250第二章 信息检索基础原理2、回溯检索法 又称引文法引文法,是利用已有文献末尾所附的参考文献进行追溯查找的方法,是一种跟踪查找的方法。2020/12/251第二章 信息检索基础原理3、循环检索法 又称交替法,是交替使用常规检索方法

18、和追溯检索方法的方法。注意:在实际检索中,要视条件的可能和课题的需要来选择相应的检索方法2020/12/252第二章 信息检索基础原理二、计算机信息检索的策略1、最专指面优先策略 是指检索时首先查找所有概念组面中最专指的一个概念组面,然后依据用户需求及初步检索结果,决定是否需要加入以及怎样加入其他的概念组面。2020/12/253第二章 信息检索基础原理 如果命中文献数量远远大于用户期望值,或者初步检索的范围过于宽泛,则要用AND或NOT加入其他的概念组面,或者条件更加严格。 如果命中文献数量小于用户期望值,或者初步检索的范围过于狭窄,则用OR加入其他的概念组面,或者条件更为宽松。 如果命中文

19、献数量接近用户期望值,且结果也满意,就结束本次检索;倘若结果不理想,要调整检索。2020/12/254第二章 信息检索基础原理2、积木式策略 是指检索时首先逐一查找各个概念组面,然后将各个组面组配起来,得到最终的检索结果。 缺点:检索结果不理想时,不知问题出在哪里。2020/12/255第二章 信息检索基础原理3、引文珠形增长策略 是指首先以一个较为核心的概念组面进行试检验,并仔细浏览初步的检索结果,尤其是特别符合用户需要的文献记录,从中选择更多、更合适的检索词再进行检索,然后再浏览命中文献,从中选择检索词,接着检索,如此反复操作,直至得到理想检索结果。2020/12/256第二章 信息检索基

20、础原理4、连续分割策略 是指检索时首先建立较大的初始文献集,然后利用各种检索的限制,逐步缩小检索范围,直至符合用户需要为止。2020/12/257第二章 信息检索基础原理三、信息检索的操作步骤1、分析检索任务2、选择检索工具3、确定检索途径4、选择检索方法5、制定检索策略6、获取检索结果分析研究课题的主题内容、学科范围,然后分析出所需要信息的主题概念及其特征,提取关键词、涉及语种、分布地域、年代范围、有关著者和机构等作为检索词,再确定课题对查新、查准、查全的指标要求。(1)目录:著录一批相关图书或其他类型的出版物,并按照一定次序编排而成的一种检索工具。(2)索引:记录一批图书、报刊等所载的文章

21、篇名、著者、主题、人名等,并表明出处,按一定次序组织起来的一种检索工具。(3)文摘:以提供文献内容梗概为目的,不加评论和补充解释,简明记述文献内容的短文,并按一定的方法编排的检索工具。(4)百科全书:概述人类一切门类或某一门类知识的完备工具书。(5)年鉴:按年度汇集一定范围的重大事件工具书。(6)手册、名录:手册是汇集专业知识的工具书;名录是提供有关(人名、地名、机构名)等信息的工具书。(7)词典(字典)(8)表谱、图录:表谱是采用图表、谱系形式编写的工具书;图录就是地图目录。(9)类书、政书:类书是一种古典文献工具书,使中国古代特有的工具书;政书是中国古代记述典章制度的图书。确定检索词选用主

22、题词选用专业术语选用同义词或相关词2020/12/258第二章 信息检索基础原理第三节 信息检索效果一、信息检索的评价指标1、查全率2、查准率 查全率和查准率是美国学者佩里和肯特在20世纪50年代最先提出的。是信息检索效果评价的两个指标。2020/12/259第二章 信息检索基础原理相关文献非相关文献检出文献未检出文献abcd2020/12/260第二章 信息检索基础原理查全率=a/a+c*100%查准率=a/a+b*100% 注意:理论上,利用公式对每一次信息检索,都可计算出查全率和查准率,对检索效率做出定量化的评价。但在实际量化的操作中,根本不可能浏览所有的文献信息,未被检出的相关文献数量

23、和文献总量等都很难统计。2020/12/261第二章 信息检索基础原理查全率和查准率的相互关系查全率和查准率的相互关系l一个理想的检索系统,应是、。一个理想的检索系统,应是、。 但实际上是不可能的。但实际上是不可能的。l一般说来,二者之间存在着一般说来,二者之间存在着反变关系反变关系,即:,即: 若要提高查全率,查准率往往就会下降;若要提高查全率,查准率往往就会下降; 若要提高查准率,查全率又就会下降。若要提高查准率,查全率又就会下降。 (二者相互制约)(二者相互制约)2020/12/262第二章 信息检索基础原理与的关系可由下图描述:(称为与的关系可由下图描述:(称为R-P图)图)2020/

24、12/263第二章 信息检索基础原理提高查全率的方法:提高查全率的方法:l扩大检索课题的目标,使用主要概念,排除次要概念l跨库检索l逐步扩大检索途径的检索范围l取消限定条件l降低检索词的专指度,使用上位词或相关词补充到检索式l外文单词使用截词检索,中文使用更简短的检索词2020/12/264第二章 信息检索基础原理提高查准率的方法:提高查准率的方法:l精确确定检索课题的目标,使用专业词汇l选择专业性检索工具l逐步缩小检索途径的检索范围l使用限定条件l提高检索词的专指度2020/12/265第二章 信息检索基础原理同时兼顾查全率和查准率的方法同时兼顾查全率和查准率的方法(1)跨库检索(2)分类途

25、径和主题途径等结合使用(3)尝试多次检索(4)预防操作错误2020/12/266第二章 信息检索基础原理影响查全率的注意事项:影响查全率的注意事项:(1)对课题分析不要望文生义(2)检索工具收录范围有缺漏(3)正确的常规检索方法也有疏漏(4)检索工具选择有误(5)遗漏隐含概念(6)遗漏同义词西部地区社会发展状况 西部地区指哪些地区? 社会发展状况是哪些状况?文化教育、医疗卫生、工业水平、农业水平等 某教授在1994-2002年发表的论文有20篇被印刷型检索工具收录,而CNKI只收录16篇。A 有些数据库没有提炼主题词,功能有缺陷B 有些数据录入错误导致检索失败C 有些作者故意隐藏真实身份D 网

26、络上的垃圾信息、欺骗性网站等利用谷歌检索专利白灵菇多糖(阿魏蘑多糖)检索著名作品飘 乱世佳人,随风而逝, Gone with the wind,gone with the wind2020/12/267第二章 信息检索基础原理影响查准率的注意事项:影响查准率的注意事项:(1)检索词的专指度要高(2)增加限定字段(3)增加检索词(4)检索工具的检索精度差检索关于啤酒及其生产的中文专利 生产的概念表达为“配制”、“生产方法”、“酿造”等关键词 先查“啤酒 酿造”,命中300多条记录,再用关键词缩小检索范围。用搜索引擎检索含有研究生考试的文件的网页首先输入“研究生考试”查到500多万条网页,限制站点

27、,缩小为2800多个网页有人发明了一种可以用在公用浴缸上的一次性薄膜罩,以防交叉感染,需检索相关专利。浴缸or浴盆or澡盆 1659条膜or罩or套 471条一次性 66条权威的专利和期刊数据库的查准率较高,网络搜索引擎、中文图书数据库精度较差2020/12/268第二章 信息检索基础原理3、响应时间 对任何计算机应用系统,响应时间都是一个重对任何计算机应用系统,响应时间都是一个重要指标。要指标。 信息检索的响应时间可分为两种情形:信息检索的响应时间可分为两种情形: (1)委托检索,表示从用户送交提问到收到检)委托检索,表示从用户送交提问到收到检索结果所花的时间;索结果所花的时间; (2)非委

28、托检索,表示用户实际的检索时间。)非委托检索,表示用户实际的检索时间。 计算响应时间一般都是针对某一个提问而言,计算响应时间一般都是针对某一个提问而言,不同的提问对应的响应时间不同。(因提问式不同的提问对应的响应时间不同。(因提问式长短、复杂程度而不同)长短、复杂程度而不同) 2020/12/269第二章 信息检索基础原理 有时给出平均响应有时给出平均响应时间时间T,ti表示对第表示对第i个个提问的响应时间,提问的响应时间,k为提问个数为提问个数kitikT112020/12/270第二章 信息检索基础原理问 题: 检索响应时间与哪些因素有关检索响应时间与哪些因素有关? ?2020/12/27

29、1第二章 信息检索基础原理 通过对检索响应时间的分析,我们可归纳出影通过对检索响应时间的分析,我们可归纳出影响该指标的因素:响该指标的因素: (1)(1)文献库规模文献库规模 规模越大,检索时间越长,响应时间值也就越规模越大,检索时间越长,响应时间值也就越大。大。 (2)(2)机器速度机器速度 主机运行速度越快,响应时间越短。主机运行速度越快,响应时间越短。 (3)(3)检索软件检索软件 检索软件是关键,其性能越好,检索时间就越检索软件是关键,其性能越好,检索时间就越短。短。2020/12/272第二章 信息检索基础原理(4)(4)存储设备类型和数据的存贮结构存储设备类型和数据的存贮结构 存储

30、设备的访问速度越快,数据的存贮存储设备的访问速度越快,数据的存贮结构(外存贮)越合理,检索越容易,响结构(外存贮)越合理,检索越容易,响应时间也就越短。应时间也就越短。(5)(5)提问组配形式提问组配形式 检索式的检索式的构造需要有一定的专业技能和检需要有一定的专业技能和检索经验,是一个不断修改和完善的过程。索经验,是一个不断修改和完善的过程。(6)(6)信息中心与检索者的距离信息中心与检索者的距离 通信传输时间与距离有关。通信传输时间与距离有关。2020/12/273第二章 信息检索基础原理二、网络信息检索效果评价指标体系1、索引数据库的评价指标 (1)索引数据库的规模和内容 (2)标引深度

31、和标引准确率 (3)数据库更新频率思考:人际关系数据库的索引设计。2020/12/274第二章 信息检索基础原理2、检索功能的评价指标 网络检索工具一般都提供布尔检索、截词检索、限制范围检索等基本检索功能。除此之外,有的工具还提供高级检索功能,如多语种检索等。2020/12/275第二章 信息检索基础原理3、相关性排序 相关度的计算是相关性排序优劣的基础,一般是通过计算检索词在每个结果中的出现次数和出现位置来计算相关度的。 一个检索词在网页中出现的次数越多、出现的位置越重要,则网页的相关度越高。2020/12/276第二章 信息检索基础原理典型的相关度排序方法:(1)按频次排序(2)按网页被访

32、问度排序(3)基于超链接的排序按频次排序的思想是:如果一个网页包含了越多的关键词,其搜索目标的相关性越好。这是一种非常合乎常理的方法在这种方法中,搜索引擎会记录所搜索到的网页的被搜索次数,从而判断该页面被访问的频率,被访问较多的网页,应该包含信息较多。网页之间的链接反映了某种引用关系,通过构造网页引用图,综合考虑页面的被引用次数以及所引用页面的相关度来判断本页面的相关度。2020/12/277第二章 信息检索基础原理4、重复链接和死链接率如果在检索结果中同一结果重复出现,特别是那些网页标题或描述不同的重复结果所占比例很大时,尤其是当这种情况出现在最前面的10个结果中是,会浪费用户的时间和精力,

33、甚至影响用户对检索工具的印象。死链接率是检索结果中死链接的结果数占全部检索结果的比例。死链接找不到原始文献,即使命中记录再多也没有用。2020/12/278第二章 信息检索基础原理5、用户满意度主要指标:(1)用户界面的设计(2)具有信息过滤功能(3)具有灵活的输出格式(4)提供灵活的输出格式(5)提供多种内容显示格式2020/12/279第三章 检索语言第一节 检索语言概述一、概念传统意义上的检索语言,是应文献信息的加工、存贮和检索的共同需要而编制的专门语言,它是表达概括文献信息内容的概念及相互关系的一种概念标识系统。广义上的检索语言,指信息检索过程中涉及的人工语言和自然语言。 人工语言是根

34、据一定的规则人为编制而成的检索语言,有严格的使用规则,可用于表述文献主要内容,建立信息检索系统。 自然语言是人类交流时使用的语言,不受任何限制,未经加工和规范。狭义上的检索语言,仅指根据信息检索的需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言。2020/12/280第三章 检索语言 检索语言又称情报语言、情报存储与检索语言、文献语言、索引语言、标引语言、标示系统等。1.从自然语言中精选出来并加以规范化的词汇;2.代表某种分类体系的一套分类号码;3.代表类事物特征的一套代码;2020/12/281第三章 检索语言世界常见的检索语言主要有:l杜威十进制分类法l国际十

35、进制分类法l冒号分类法l中国图书馆分类法l中国人民大学图书馆分类法l汉语主题词表2020/12/282第三章 检索语言 二、检索语言所具备的功能(1) 对文献的信息内容及其外表特征加以规范化的标引;(2) 对内容相同及相关的文献信息加以集中或揭示其相关性;(3) 可使文献信息的存贮集中化、系统化、组织化,便于检索者按一定的排列次序进行有序化检索;(4) 便于将标引用语和检索用语进行相符性比较。2020/12/283第三章 检索语言 三、检索语言的类型按不同的标准,检索语言划分为:u(1)描述文献的特征 u(2)结构或原理u(3)信息标识的组配方式u(4)语言的规范程度2020/12/284第三

36、章 检索语言(1)描述文献的特征)描述文献的特征l描述文献外表特征的检索语言 文献外表特征:文献的篇名、作者姓名、出版者、合同号、报告号、引文等;据此作为文献标识和检索依据而形成的检索语言。l描述文献内容特征的检索语言 是检索语言研究的核心内容是检索语言研究的核心内容主要包括:l分类语言:体系分类语言、组配分类语言l主题语言:标题词语言、关键词语言、单元词语言、叙词语言l代码语言:分子式索引、结构式索引、专利号索引例如:题名索引、著者索引、合同号索引、报告号索引、引文索引等2020/12/285第三章 检索语言(2)结构或原理)结构或原理l分类语言:用分类号表达各种概念,将各种概念按学科性质进

37、行分类和系统编排。l体系分类语言(等级体系分类语言)、组配分类语言(分析-综合分类语言)l主题语言:采用表达某一事物或概念的名词术语,用于标引、存储、检索的一种检索语言。l标题词语言、关键词语言、单元词语言、叙词语言l代码语言:一般只是就事物的某一方面特征,用某种代码系统来加以标引和排列。l分子式索引、结构式索引、专利号索引l引文语言:利用文献之间的相互关系而建立的一种自然语言,其标引词来自于文献的主要著录项目。l特点:选词方便、词汇丰富,往往看作检索语言的一种特殊类型。2020/12/286第三章 检索语言(3)信息标识的组配方式l先组式检索语言: 表述文献主题概念的标识在检索之前就已固定的

38、检索语言。l后组式检索语言: 表述文献主题概念的标识在检索之前未固定组配,而是在检索时根据实际需要按组配规则临时组配的检索语言。l散组式语言: 对于复杂的主题标识,在此表中不组配,而在标引阶段将表达主题概念的若干标识,根据规则组配在一起的检索语言。优点:语言标识明确,系统性较好,适用于传统的文献单元方式的目录索引,是检索用户比较习惯的形式。缺点:表达专指概念和新概念较困难,灵活性较差,检索途径少,词表体积庞大。优点:语言采用概念分析和综合的原理,可实行多途径、多因素检索乃至精确检索,相当灵活,检索效率较高。缺点:标识明确性不强,造成检索用户使用不习惯。2020/12/287第三章 检索语言(4

39、)语言的规范程度l人工语言:主题法(标题词、单元词、叙词、关键词)、分类法(体系分类法、组配分类法)和(语义代码、化学代码)等种类。l自然语言:直接取自文献信息本身,不经过加工或规范的词语或句子。2020/12/288第三章 检索语言第二节 检索语言的理论基础一、概念逻辑 通过明确各种概念及其相互关系而揭示事物的本质属性及事物之间的联系与区别,是一种科学思维方法。概念包含内涵(本质属性)与外延(反映范围)。2020/12/289第三章 检索语言1、概念间的关系l(1)相容关系:同一关系;属种关系;交叉关系;整体与部分关系;全面与某一部分关系、不相排斥的并列关系。l(2)不相容关系:相排斥的并列

40、关系;矛盾关系;对立关系例如:计算机与电脑;酒精与乙醇例如:自然科学是化学的属概念,化学是自然科学的种概念部分外延相重合,如“团员”与“党员”例如:汽车与汽车发动机例如:文学家、书法家、军事家例如:公共图书馆这个属概念下,省图书馆、市图书馆具有不相容的并列关系例如:金属材料和非金属材料例如:17世纪哲学和18世纪哲学,其上位类是“近代哲学”2020/12/290第三章 检索语言2.概念逻辑的关系 (1)概念的划分与概括(分类) 通过概念划分与概括形成概念等级体系。利用划分和概括过程中所产生的概念隶属关系和并列关系,构成检索语言结构体系。 (2)概念的分析与综合(组配) 通过概念分析与综合形成概

41、念组配体系。提供多途径的信息检索功能,可以根据需要扩大、缩小或改变检索的范围。2020/12/291第三章 检索语言二、知识分类l1.知识分类的实质是划分知识单元、组织知识体系l2.知识分类主要包括l学科分类:以信息的学科属性为分类标准,根据各门学科的研究对象的区别和联系对学科进行区分和组织,确定学科在科学整体中的位置,揭示科学的内部结构,建立符合科学发展规律的分类体系。l事物分类:根据事物属性的异同将事物划分成类,构成事物的分类体系。l3.知识分类遵循的原则:客观性和发展性l4.如果说概念逻辑是检索语言的基础,知识分类便是概念逻辑的基础2020/12/292第三章 检索语言三、术语学l术语学

42、:研究概念、概念定义和概念命名规律的学科。l术语是传播知识、技能,进行社会文化、经济交流等的重要工具。l检索语言是概念标识系统组成的,而概念是术语来表达的,因此,术语是分类表、词表的基本组成要素。2020/12/293第三章 检索语言第三节 分类检索语言一、分类检索语言的概念 分类检索语言也称分类法,是将许多类目根据一定的原则组织起来,通过标记符号来代表各级类目和固定其先后次序的分类体系。2020/12/294第三章 检索语言分类检索语言主要包括:1、体系分类法 指将文献信息的类目按等级层层展开并详尽列举的一种分类法。2、组配分类法 根据概念的分析和综合原理编制的文献分类法,它是将主题概念分解

43、为简单概念或概念因素,按照它们所属的方面或范畴,分别编列成表;标引时用两个或多个简单概念的分类号的组合来表达一个复杂的主题概念。中国图书馆分类法杜威十进分类法美国国会图书馆分类法中国人民大学图书馆图书分类法组配法可分为全面分类法和半面分类法两种。全面分类法一般仅仅应用较小学科或专业范围。半面分类法是全面分类法与体系分类法相结合的混合式分类法,如冒号分类法2020/12/295第三章 检索语言二、体系分类法1、体系分类法的结构(1)微观结构 是指分类法中类目的构成结构。 类目体系是分类法的核心。类目体系是分类法的核心。2020/12/296第三章 检索语言A、类目划分 类目划分的过程通常是由大到

44、小、由属到种、由整体到部分、由总论到分论、由全面到各方面。 被分的类目是上位类,分出来的类目是下位类。2020/12/297第三章 检索语言B、引用次序 是在体系分类法中表现为分类标准的使用次序,当某一类事物连续划分需要采用几种分类标准时,分类标准的使用次序是否合理,直接影响分类体系,决定着类目体系展开方式。合理的引用次序应该满足逻辑性原则、符合理的引用次序应该满足逻辑性原则、符合检索需要的原则和表达性原则。合检索需要的原则和表达性原则。2020/12/298第三章 检索语言C、类目的排列 同位类是由一个上位类直接划分出的各个下位类,它们之间不从属,相互排斥,处于同等地位。 同位类的排列主要采

45、用的序列方法,有按照逻辑顺序排列,按照客观事物发展顺序、按照时间发展顺序、按照空间排列顺序。2020/12/299第三章 检索语言D、类名的确定 坚持科学性、确定性、简洁性。坚持科学性、确定性、简洁性。 注意:如有必要,可将同义词、俗称、旧称等用括号加注在类目名称之后,如中国图书馆分类法中的B82伦理学(道德学)2020/12/2100第三章 检索语言E、类目之间的相互关系处理第一从属关系第二并列关系第三交替关系 使用类目和交替类目之间的关系。有的学科或事物分别属于两个门类,编制时确定归入一个门类,同时在另一个门类设交替类目,以适应学科的交叉关系。交替类目不用来类分文献。第四相关关系 有些类目

46、之间密切相关,而这些类目又不属于同一个类系,这种类目之间的关系称为相关关系。例如:【B035】国家理论 宜入D03(“政治理论”下的“国家理论”类)O212 数理统计 参见C8(统计学)2020/12/2101第三章 检索语言(2)宏观结构A、类目体系 大多数体系分类法由主表和复分表组成。 主表主表有基本部类、基本大类、简表、祥表组成。 复分表复分表又称为辅助表或者附表,是将祥表中按相同标准划分某些类所产生的一系列相同子目抽出来,配以特定号码,单独编列,供主表有关类目进一步细分的类目表。可分为通用复分表和专用复分表。2020/12/2102第三章 检索语言B、标记系统 可分为顺序制、层累制、混

47、合制、分面标记制。特殊标记法:第一,八分法第二,双位法第三,借号法 第四,组配法第五,空号法2020/12/2103第三章 检索语言C、说明与注释主要包括编制说明、大类说明和类目注释。类目注释是对类目的性质或类名的补充说明文字。例如:D631.42 户籍管理 流动人口管理入此. 参见C921.32020/12/2104第三章 检索语言D、类目索引 主要作用是帮助不熟悉分类表的使用者从主题名称迅速找到相应类目。注意:类目索引不能用来分类标引,只能是辅助工具。2020/12/2105第三章 检索语言2、体系分类法的特点l(1)提高查全率。以科学分类为基础,以逻辑方式进行划分,体系比较严密,强调知识

48、的系统化组织,便于按学科或专业检索有关文献。l(2)便于浏览领域内的相关信息。采用等级列举式的概念标识系统来揭示概念间的相互关系。l(3)不受语种的限制。采用分类号作为主题的标识,避免了语种的限制。体系分类法的不足:l(1)修订不便。无法及时增加反映新知识主题的类目l(2)采用先组式标识,难以进行组配检索。l(3)缺乏直观性。以分类号作为主题的标识。l(4)学科交叉渗透的困难。2020/12/2106第三章 检索语言三、组配分类法 组配分类表:一般由编制说明、基本类表、分面类表目次和分面公式、索引等组成。世界上最重要的组配分类法词表是阮岗纳赞创立的Colon Classification。组配

49、分类表由两个层面结构组成。第一层是分面结构是对整个知识领域进行分面所形成的基本分面结构;第二层面的分面结构是以第一层次的分面结构为依据,对某一知识领域进一步进行分解形成的分面结构。冒号分类法第一层次的分面是:本体、物质、能量、空间、时间。教育类的第二层次的分面结构:受教育者、课程、教学方法、教师、教育环境、共同操作及施动者、理论观点、地点和时间、通用复分等2020/12/2107第三章 检索语言组配分类法的特点:l(1)类目较少,但标引文献的能力较强;l(2)多种途径检索文献。可以自由地扩大或缩小检索范围,能从多种途径检索文献,还能进行较精确的组配检索和轮排检索,在检索性能、检索效率和检索灵活

50、性方面都优于体系分类法;l(3)分类表增补和修订方便灵活。采用分段标记制度,便于分类表的增补和修订新的主题概念。2020/12/2108第三章 检索语言冒号分类法 冒号分类法冒号分类法 (Colon classification),印度图书馆学家图书馆学家阮冈纳赞阮冈纳赞1933年创制的图书分类法。它是通用而不是专用的分类法,可通过使用“分面”或“冒号”来建立复杂的新范畴。计108个大类(原33类)和10个概括性的类目(大致于人文科学人文科学与自然科学之间分类),其类号由阿拉伯数字、拉丁字母,希腊字母的混合标记所组成。 例如牙医外科牙医外科的编号为L124:4:7,它用字母L代表医学,数码12

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|