信息检索教程课件.ppt

上传人(卖家):ziliao2023 文档编号:5682729 上传时间:2023-05-02 格式:PPT 页数:42 大小:3.38MB
下载 相关 举报
信息检索教程课件.ppt_第1页
第1页 / 共42页
信息检索教程课件.ppt_第2页
第2页 / 共42页
信息检索教程课件.ppt_第3页
第3页 / 共42页
信息检索教程课件.ppt_第4页
第4页 / 共42页
信息检索教程课件.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、0 信信 息息 检检 索索1 2 Give me a fish,Ill eat for a day;teach me to fish and Ill eat for a life time.“授人以鱼,不如授人以渔”3 信息素质信息素质 美国美国20002000年年1 1月月1818日批准的日批准的高等教育信息素养能力标准高等教育信息素养能力标准认为,一个具备信息素养的人应该达到如下目标:认为,一个具备信息素养的人应该达到如下目标:(1 1)确确定所需信息的范围;定所需信息的范围;(2 2)有效地获取所需的信息有效地获取所需的信息;(;(3 3)鉴鉴别信息及其来源别信息及其来源;(4 4)将检

2、索的信息融入自己的知识范围;()将检索的信息融入自己的知识范围;(5 5)有效地利用)有效地利用信息去完成一个具体的任务;(信息去完成一个具体的任务;(6 6)了解信息所涉及的经济、)了解信息所涉及的经济、法律和社会问题,合理合法地检索、搜集和利用信息。法律和社会问题,合理合法地检索、搜集和利用信息。(1 1)至()至(3 3)与本课程有直接的关系,而()与本课程有直接的关系,而(4 4)至()至(5 5)是以)是以(1 1)至()至(3 3)的知识为基础所能够开展的工作,()的知识为基础所能够开展的工作,(6 6)所涉)所涉及的是如何合法使用信息的问题。及的是如何合法使用信息的问题。4 信息

3、检索的意义信息检索的意义 信息素质是人类素质的重要组成部分,信息素质是人类素质的重要组成部分,它大致包括信息意识、信息观念、信息它大致包括信息意识、信息观念、信息心理、信息道德、信息知识、信息政策、心理、信息道德、信息知识、信息政策、信息法律、信息技能等内容。信息法律、信息技能等内容。成为现代成为现代信息人信息人的基本条件是:(的基本条件是:(l l)敏锐的信息意识;(敏锐的信息意识;(2 2)良好的信息技)良好的信息技能;(能;(3 3)合理的知识结构)合理的知识结构 信息检索则是每个大学生和科研人员必信息检索则是每个大学生和科研人员必须具备的一种基本技能须具备的一种基本技能 ,主要有以下主

4、要有以下几点作用几点作用:拓宽知识面,改善知识结构拓宽知识面,改善知识结构启迪创造性思维(创新问题)启迪创造性思维(创新问题)提高自学能力提高自学能力节省时间,加快科研步伐节省时间,加快科研步伐继承前人研究成果,避免重复劳动继承前人研究成果,避免重复劳动科技人员科技人员80%80%的知识在学校毕业的知识在学校毕业后获得后获得科研工作时间分配:科研工作时间分配:计划与思考计划与思考 7.7%7.7%;信息收集信息收集 50.9%50.9%;实验研究;实验研究 32.1%32.1%;数据处理数据处理 9.3%9.3%查找文献资料的能力查找文献资料的能力使用工具书的能力使用工具书的能力科学有效的阅读

5、各种文献的能力科学有效的阅读各种文献的能力5 课程概况课程概况课程目的:课程目的:为了培养大学生的综合能力和综合素质为了培养大学生的综合能力和综合素质而开设的。它以培养大学生的自学能力而开设的。它以培养大学生的自学能力和独立研究能力主要目的,为今后顺利和独立研究能力主要目的,为今后顺利地进行毕业设计或毕业论文写作打好基地进行毕业设计或毕业论文写作打好基础,为毕业后更新知识适应社会需求、础,为毕业后更新知识适应社会需求、从事科学研究以及技术开发打好基础。从事科学研究以及技术开发打好基础。课程性质课程性质:本课程是研究纸质和网络信息的获取本课程是研究纸质和网络信息的获取与利用方面的方法和技能的应用

6、性课与利用方面的方法和技能的应用性课程、是一门技术基础课。程、是一门技术基础课。授课方法:授课方法:本课程采用多媒体授课与上机、手工实习为本课程采用多媒体授课与上机、手工实习为主要教学方法,坚持理论与实践紧密结合,主要教学方法,坚持理论与实践紧密结合,以达到教学目标。以达到教学目标。6 课程考核课程考核出勤出勤有缺勤成绩不通有缺勤成绩不通过!过!认真完成期末认真完成期末 考考 核核课后多实践课后多实践积极参与课积极参与课堂讨论堂讨论认真完成课后认真完成课后 作业作业信息、信息检索与信息素养信息、信息检索与信息素养 8 信息具有差异和传递两要素。信息具有差异和传递两要素。根据发生源不同分为自然信

7、息、生物信息、机器信息和人类信息四大类。根据发生源不同分为自然信息、生物信息、机器信息和人类信息四大类。必须依附一定物质形式,即载体。必须依附一定物质形式,即载体。9 10 11 信息、知识、情报的关系 信息是情报处理的原材料,是一种未予以评估和分析的数据资料信息是情报处理的原材料,是一种未予以评估和分析的数据资料;情报是一种信息,或者说是一种特殊的信息,是由信息转化和加工提炼出情报是一种信息,或者说是一种特殊的信息,是由信息转化和加工提炼出来的来的信息、知识和情报之间的关系:信息信息、知识和情报之间的关系:信息知识知识情报,三者是同心圆的关系。情报,三者是同心圆的关系。12 13 信息检索(

8、Information Retrieval)就是信息用户为处理解决各种问题而查找、识别、获取相关的事实、数据、知识的活动及过程。14 1 1、从通信的角度认识信息检索、从通信的角度认识信息检索基本问题在于,如何把一个可能的用户指引向所存基本问题在于,如何把一个可能的用户指引向所存储的信息。莫尔斯首次提出储的信息。莫尔斯首次提出”信息检索信息检索这一概念这一概念,并并认为认为”信息检索是一种时间性的通信形式信息检索是一种时间性的通信形式“。4 4、全息检索、全息检索王永成:全息检索就是王永成:全息检索就是”可以从任何角度,从可以从任何角度,从“存储的多种形式的信息中高速准确地查找,存储的多种形式

9、的信息中高速准确地查找,并可以任意要求的形式和组织方式输出,也可并可以任意要求的形式和组织方式输出,也可仅输出人门所需要的一切相关信息的电脑活动仅输出人门所需要的一切相关信息的电脑活动”5 5、概念信息检索、概念信息检索基于自然语言处理中对知识在语义层次上的析基于自然语言处理中对知识在语义层次上的析取,并由此形成知识库,再根据对用户提问的取,并由此形成知识库,再根据对用户提问的理解检索其中的相关信息。系统组成部分:记理解检索其中的相关信息。系统组成部分:记忆机制、语义分析机制、知识库、人机接口等。忆机制、语义分析机制、知识库、人机接口等。2 2、从信息处理角度认识信息检索、从信息处理角度认识信

10、息检索基本问题是如何处理信息和信息的结构。偏重于信基本问题是如何处理信息和信息的结构。偏重于信息管理领域,视信息检索为计算机科学的一分支。息管理领域,视信息检索为计算机科学的一分支。有利于信息检索工具的设计和组建。有利于信息检索工具的设计和组建。3 3、从信息检索过程的角度认识信息检索、从信息检索过程的角度认识信息检索信息检索即是查找出含有用户所需信息的文献的过信息检索即是查找出含有用户所需信息的文献的过程。这是一种传统的主流观点。兰卡斯特程。这是一种传统的主流观点。兰卡斯特”信息检索信息检索系统并不检索信息系统并不检索信息“,表明检索对象是文献。,表明检索对象是文献。15 广义信息检索广义信

11、息检索信息检索是指将信息按一定的方式组织和存贮起来,信息检索是指将信息按一定的方式组织和存贮起来,并根据用户的需要找出相关信息的过程。其中包括信并根据用户的需要找出相关信息的过程。其中包括信息存储与信息查找两部分。息存储与信息查找两部分。狭义信息检索狭义信息检索 即信息查找的过程即信息查找的过程16 1 117 18 2 219 3 320 4 421 5 56 67 722 1 12 23 323 信息及信息资源是信息检索的主要对象,本节主要介绍信息资源的定义及其类型,并对当前信息检索的主要检索对象文献信息资源做较为详细的描述。24 1 1体裁信息资源指以人体为载体并能为他人识别的信息资源。

12、按其表述方式分为口语信息资源(谈话、授课、演讲、唱歌等)和体语信息资源(表情、手势、姿态、舞蹈等)。实物裁信息资源指以实物为载体的信息资源。可分为天然实物资源、人工实物资源指以文字、图形、符号、声频等方式记录在各种载体上的知识和信息资源,是目前利用最多的信息资源。指以网络为纽带连接起来的信息资源和以网络为主要交流、传递、存储的手段与形式的信息资源。25 2 2一次信息:指未加工或粗略加工的原始信息资源。如:各种著作、期刊文章、会议记录、研究报告、统计报表、专利等。二次信息:指对大量一次信息资源加工、整理、标引、著录、浓缩,并予以有序化编排而形成的结果,主要指各种目录、题录、索引、文摘等。三次信

13、息资源:指通过二次信息资源提供的线索,对某范围内的一次信息资源进行分析、研究、加工而成的信息资源。3 326 记录有知识的一切载体;指以一定物质形态固定下来,以便记录有知识的一切载体;指以一定物质形态固定下来,以便于保存和传播的知识。于保存和传播的知识。文献是用各种形式的载体记录下来的一切有价值的人类知识,文献是用各种形式的载体记录下来的一切有价值的人类知识,是以文字、图形、符号、声频、视频等手段记录和传播人类最宝是以文字、图形、符号、声频、视频等手段记录和传播人类最宝贵的物质和精神财富的载体。现代文献囊括了各种信息载体,如贵的物质和精神财富的载体。现代文献囊括了各种信息载体,如传统的书刊、文

14、稿,如今的音像制品、机读资料、电子出版物等。传统的书刊、文稿,如今的音像制品、机读资料、电子出版物等。文献信息是从文献实体结构中抽象出来的内容,它借助于文文献信息是从文献实体结构中抽象出来的内容,它借助于文献这种载体显示出知识的信息,通过文献进行存贮和传播,无论献这种载体显示出知识的信息,通过文献进行存贮和传播,无论是自然信息还是社会信息,只要借助于文献来传递内容,都属于是自然信息还是社会信息,只要借助于文献来传递内容,都属于文献信息。文献信息。27 零次文献是指未经过任何加工的原始文献(实验记录、手稿、原始录音)。零次文献是指未经过任何加工的原始文献(实验记录、手稿、原始录音)。一次文献是人

15、们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的一次文献是人们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献,其所记载的知识、信息比较新颖、具体、详尽(期刊论文、专利文献、科文献,其所记载的知识、信息比较新颖、具体、详尽(期刊论文、专利文献、科技报告、会议录、学位论文)技报告、会议录、学位论文)二次文献是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一二次文献是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用(目录、定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用

16、(目录、索引索引)。)。三次文献是选用大量有关的文献,经过综合、分析、研究而编写出来的文献。通常三次文献是选用大量有关的文献,经过综合、分析、研究而编写出来的文献。通常围绕某个专题,利用二次文献检索搜集大量相关文献,对其内容进行深度加工而围绕某个专题,利用二次文献检索搜集大量相关文献,对其内容进行深度加工而成成(综述、评论、评述、进展、动态(综述、评论、评述、进展、动态)28 由零次文献经过写作正式发表变成一次文献,一次由零次文献经过写作正式发表变成一次文献,一次文献再经过有关专业出版机构加工变成有序的二次文献再经过有关专业出版机构加工变成有序的二次文献,大量的二次文献再作了大量工作的基础上可

17、文献,大量的二次文献再作了大量工作的基础上可以变成三次文献。查阅文献则是通过二次文献检索以变成三次文献。查阅文献则是通过二次文献检索到一次文献的过程。所以二次文献是最重要的检索到一次文献的过程。所以二次文献是最重要的检索手段和工具,一次文献是最终的检索对象。手段和工具,一次文献是最终的检索对象。29 1 1)刻)刻写写型文型文献献;(;(2 2)印刷型文)印刷型文献献;(3 3)缩缩微型文微型文献献 ;(;(4 4)电电子型文子型文献献;(;(5 5)视视听型文听型文献献1 1图书图书 、期刊、期刊 、科技、科技报报告告 、会议会议文文献献 、专专利文利文献献 、标标准文准文献献 、政府出版物

18、、政府出版物 、学学位位论论文文 产产品品样样本本 、技、技术档术档案案 印刷型指通过油印、铅印、胶印等各种印刷手段将信息记录在纸张上的文献,印刷型指通过油印、铅印、胶印等各种印刷手段将信息记录在纸张上的文献,这是沿用了近千年的传统载体形式,是各类信息载体的主体。其优点是用途这是沿用了近千年的传统载体形式,是各类信息载体的主体。其优点是用途较广、读取方便、流传不受时空限制等。其缺点是存储密度低、较笨重、占较广、读取方便、流传不受时空限制等。其缺点是存储密度低、较笨重、占据空间大。据空间大。30 2 2电子型文献种类划分标准多样,与印刷型文献比有众多不同之处。电子型文献种类划分标准多样,与印刷型

19、文献比有众多不同之处。电子型又称机读型,指通过计算机存储和阅读的文献类电子型又称机读型,指通过计算机存储和阅读的文献类型。主要包括磁带、磁盘、光盘等。型。主要包括磁带、磁盘、光盘等。优点:存储容量大,存取速度快,优点:存储容量大,存取速度快,原记录可以修改、删除或更新等原记录可以修改、删除或更新等 缺点:设备投资高、价格昂贵缺点:设备投资高、价格昂贵 31 按出版类型划分按出版类型划分十大情报源十大情报源 (人们在进行科研及技术工作时使用频率比较高的十种情报来源的总称)人们在进行科研及技术工作时使用频率比较高的十种情报来源的总称)图书图书期刊期刊专利文献专利文献标准文献标准文献会议文献会议文献

20、学位论文学位论文科技报告科技报告政府出版物政府出版物技术档案技术档案产品样本产品样本32 图书:一种论章成册的出版物,是对已有研究成果、生产技术、实践经图书:一种论章成册的出版物,是对已有研究成果、生产技术、实践经验或某一知识体系的论述或概括。验或某一知识体系的论述或概括。图书的基本素材来自期刊论文、会议论文、研究报告、学位论文等一次图书的基本素材来自期刊论文、会议论文、研究报告、学位论文等一次文献和著者本人的研究和学术成果。文献和著者本人的研究和学术成果。图书的特点:内容系统、全面、成熟、可靠,有一定的新颖性,一般只图书的特点:内容系统、全面、成熟、可靠,有一定的新颖性,一般只反映反映3-5

21、年以前的研究水平;编辑出版时间较长,传递信息的速度太慢。年以前的研究水平;编辑出版时间较长,传递信息的速度太慢。出版收藏情况:目前全世界每年出版图书月出版收藏情况:目前全世界每年出版图书月70万种以上,其中科技图书万种以上,其中科技图书约占约占1/4左右。大型图书馆有广泛的收藏,多数图书较容易获得。左右。大型图书馆有广泛的收藏,多数图书较容易获得。图书的识别方法:著录的特征除了书名、著者外,还有出版图书的识别方法:著录的特征除了书名、著者外,还有出版社、出版地、总页数,有时还有国际标准书号社、出版地、总页数,有时还有国际标准书号:ISBN号。号。ISBN(International Stand

22、ard Book Number)说明:说明:ISBN号是号是国际标准书号的简称,它是国际标准化组织于国际标准书号的简称,它是国际标准化组织于1972年公布的一项国际年公布的一项国际通用的出版物统一编号方法。通用的出版物统一编号方法。2007年启用年启用13位位ISBN号,共分五段:号,共分五段:1、图书商品号:、图书商品号:978。2、组号:代表出版者的国家,地理区域,语、组号:代表出版者的国家,地理区域,语种等。我国的组号为种等。我国的组号为“7”。3、出版者号:代表组内所属的一个具体、出版者号:代表组内所属的一个具体出版者(出版社,出版公司等)。出版者(出版社,出版公司等)。4、书名号:代

23、表某出版社所出版、书名号:代表某出版社所出版的一种具体出版物的书名。的一种具体出版物的书名。5、校验位:是、校验位:是ISBN号的最后一位数字,号的最后一位数字,用以检查用以检查ISBN号转录过程中有无差错。例如:号转录过程中有无差错。例如:Frontpage 98网页设网页设计计一书的一书的ISBN号是:号是:978-7-118-01984-4,所代表的意思是:,所代表的意思是:978,代表图书;代表图书;7,代表中国;,代表中国;118,代表国防工业出版社;,代表国防工业出版社;01984,是书,是书名号;名号;4,是检验码。,是检验码。1 133 期刊又称杂志,是一种有固定名称,有一定的

24、出版规律,每期有多篇论文组成期刊又称杂志,是一种有固定名称,有一定的出版规律,每期有多篇论文组成的连续出版物。的连续出版物。特点(特点(科技期刊科技期刊):出版周期短,报道速度快;数量大,品种多,内容丰富新):出版周期短,报道速度快;数量大,品种多,内容丰富新颖,能及时反映当代社会和科技的发展水平和动向;发行流通面很广;连续性颖,能及时反映当代社会和科技的发展水平和动向;发行流通面很广;连续性强,它所刊载的科学事实、数据、理论、技术、方法、构思和猜想,都是科学强,它所刊载的科学事实、数据、理论、技术、方法、构思和猜想,都是科学研究的重要参考信息。研究的重要参考信息。出版收藏情况:目前全世界出版

25、的期刊约出版收藏情况:目前全世界出版的期刊约10万余种,而且正以每年万余种,而且正以每年1500种的速种的速度递增。国内公共图书馆和省级以上的科技信息情报所都有收藏,期刊原文比度递增。国内公共图书馆和省级以上的科技信息情报所都有收藏,期刊原文比较容易获得。较容易获得。2 234 识别期刊的主要依据有:期刊名称,期刊出版的年、卷、期,识别期刊的主要依据有:期刊名称,期刊出版的年、卷、期,国际标准刊号国际标准刊号(ISSN)(ISSN)等。等。ISSNISSN由由8 8位数字分两段组成,如位数字分两段组成,如1000-01351000-0135,前,前7 7位是期刊代号,末位是校验号。位是期刊代号

26、,末位是校验号。我国正式出版的期刊都有国内统一刊号我国正式出版的期刊都有国内统一刊号(CN)(CN),它由地区号、,它由地区号、报刊登记号和报刊登记号和中图法中图法分类号组成,如分类号组成,如CN11-2257/G3CN11-2257/G3。35 又称又称“重点期刊重点期刊”、“重要期刊重要期刊”、“常用期刊常用期刊”等。一般是指少数刊载某一学科或某一等。一般是指少数刊载某一学科或某一专业大量、高质量的文献的期刊。通常情报密度较大,代表某学科或专业领域的较高的学术专业大量、高质量的文献的期刊。通常情报密度较大,代表某学科或专业领域的较高的学术水平,借阅率和被引用率较高,出版较稳定,所载文献的使

27、用寿命较长的期刊。水平,借阅率和被引用率较高,出版较稳定,所载文献的使用寿命较长的期刊。*又称连续性出版物(又称连续性出版物(serials),是一种定期或不定期连续出版的文献载体,它一般有是一种定期或不定期连续出版的文献载体,它一般有同样的名称,按一定时间编定卷号,每一卷又分若干期。同样的名称,按一定时间编定卷号,每一卷又分若干期。36*主要由专利说明书构成,指专利申请人向专利局递交的有关发明目的、构成和效果的技术主要由专利说明书构成,指专利申请人向专利局递交的有关发明目的、构成和效果的技术文件,因只有符合新颖性、创造性、实用性的发明创造才能获得专利权,所以它是一种切合实文件,因只有符合新颖

28、性、创造性、实用性的发明创造才能获得专利权,所以它是一种切合实际、启迪思维的重要信息源。际、启迪思维的重要信息源。*指标准化工作的文件,是经过公认的权威当局批准的标准化工作成果,主要为有关工业指标准化工作的文件,是经过公认的权威当局批准的标准化工作成果,主要为有关工业产品和工程建设的质量、规格、检验方法的技术规定文件,具有一定的法律约束力,是科研产品和工程建设的质量、规格、检验方法的技术规定文件,具有一定的法律约束力,是科研生产活动的重要依据和信息来源。生产活动的重要依据和信息来源。*指在国际国内重要的学术或专业性会议上宣读发表的论文、报告,学术性强,内容新颖,指在国际国内重要的学术或专业性会

29、议上宣读发表的论文、报告,学术性强,内容新颖,质量较高,可了解国内外科技发展趋势,参考价值较大,是重要的信息源之一。质量较高,可了解国内外科技发展趋势,参考价值较大,是重要的信息源之一。37 指关于某项研究成果的总结报告,或是研究过程中的阶段进展报告,其内容比期指关于某项研究成果的总结报告,或是研究过程中的阶段进展报告,其内容比期刊论文新颖专深、详尽、可靠,出版周期短,报道速度快,反映一个国家或某一学刊论文新颖专深、详尽、可靠,出版周期短,报道速度快,反映一个国家或某一学科领域的科研水平,是不可多得的信息源。科领域的科研水平,是不可多得的信息源。指各国政府部门及其设立的专门机构出版的文献,是了

30、解各国政治、经济、科技情况的指各国政府部门及其设立的专门机构出版的文献,是了解各国政治、经济、科技情况的重要资料,如我国政府发表的重要资料,如我国政府发表的“科学技术白皮书科学技术白皮书”*指高校、科研单位的研究生为申请学位而提交的学术论文,质量参差不齐,对科研有指高校、科研单位的研究生为申请学位而提交的学术论文,质量参差不齐,对科研有一定参考价值,为难得文献。一定参考价值,为难得文献。*38 指厂商产品宣传和使用资料,通常对定型产品的性能、构造、用途、操作规程作具体指厂商产品宣传和使用资料,通常对定型产品的性能、构造、用途、操作规程作具体说明,内容成熟,数据可靠,一般可直接获取。说明,内容成熟,数据可靠,一般可直接获取。指科研生产活动中形成的,有具体事物对象的技术文件、图纸、图表、照片和原始记录指科研生产活动中形成的,有具体事物对象的技术文件、图纸、图表、照片和原始记录的总称,是科研生产工作中用以积累经验、吸取教训的重要文献,一般只内部使用。的总称,是科研生产工作中用以积累经验、吸取教训的重要文献,一般只内部使用。*39 40 信息素养最初由美国信息产业协会主席保罗泽考斯基于1974年提出。41

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(信息检索教程课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|