第七章网络信息检索课件.ppt

上传人(卖家):三亚风情 文档编号:3526536 上传时间:2022-09-11 格式:PPT 页数:119 大小:9.87MB
下载 相关 举报
第七章网络信息检索课件.ppt_第1页
第1页 / 共119页
第七章网络信息检索课件.ppt_第2页
第2页 / 共119页
第七章网络信息检索课件.ppt_第3页
第3页 / 共119页
第七章网络信息检索课件.ppt_第4页
第4页 / 共119页
第七章网络信息检索课件.ppt_第5页
第5页 / 共119页
点击查看更多>>
资源描述

1、第七章第七章 网络信息检索网络信息检索广州中医药大学图书馆网络信息获取与管理课程雷蕾第三节第三节 开放存取开放存取4.第二节第二节 搜索引擎搜索引擎3.第一节第一节 网络信息资源网络信息资源1.主要内容主要内容 什么是网络资源 网络信息资源的类型 网络信息资源的特点第一节第一节 网络信息资源网络信息资源第一节第一节 网络信息资源网络信息资源 什么是网络资源-也称“电子信息资源”、“数字资源”、“因特网信息资源”等。-以电子数据的形式将文字、图像、声音、动画等形式的信息存放在光碟等非印刷纸质的载体中,并通过网络通信,计算机或者终端等方式再现出来的信息资源。网络信息资源的类型-按付费情况分-按所对

2、应的非网络信息资源划分第一节第一节 网络信息资源网络信息资源 网络信息资源的特点-信息量大,信息来源广泛-信息层次众多,品种多样-信息内容广泛,质量不一-信息资源分散无序-资源的时效性强,变化迅速-交互性强-信息检索快捷、方便第一节第一节 网络信息资源网络信息资源第三节第三节 开放存取开放存取4.第二节第二节 搜索引擎搜索引擎3.第一节第一节 网络信息资源网络信息资源1.主要内容主要内容什么是搜索引擎搜索引擎的工作原理搜索引擎的分类通用搜索引擎Google其他医学搜索引擎 第二节第二节 搜索引擎搜索引擎 什么是搜索引擎-定义:搜索引擎是广泛收集网络信息,对采集来的信息进行标引、组织建立索引库,

3、并提供检索的工具。第二节第二节 搜索引擎搜索引擎 搜索引擎的工作原理-从互联网上抓取网页-建立索引数据库-在索引数据库中搜索排序第二节第二节 搜索引擎搜索引擎 搜索引擎分类-全文搜索引擎-目录索引类搜索引擎-元搜索引擎 第二节第二节 搜索引擎搜索引擎12全文搜索引擎是名副其实的搜索引擎,它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。国外具代表性的有Google,国内著名的有百度Baidu。全文搜索引擎全文搜索引擎13目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分

4、类的网站链接列表而已。用户完全可以不用进行关键词查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的是Yahoo,国内的搜狐、新浪、网易搜索也都属于这一类。目录索引类搜索引擎目录索引类搜索引擎14元搜索引擎元搜索引擎亦称为“集成搜索引擎”,在一个网页上链接若干个独立的搜索引擎,检索式需点选或者指定搜索引擎,一次检索输入,多引擎同时搜索,搜索结果由各搜索引擎分别以不同页面提交,其实质是利用网站链接技术形成的搜索引擎的集合,而并非真正意义上的搜索引擎。典型的集成搜索引擎有搜索之家、国际瑞士军刀、生物谷等多引擎搜索系统。15通用搜索引擎通用搜索引擎Google通用中英文搜索引擎Google创

5、建于 1998 年 9 月,创始人为 Larry Page(拉里佩奇)和 Sergey Brin(谢尔盖布林),他们开发的 Google 搜索引擎屡获殊荣,是一个用来在互联网上搜索信息的简单快捷的工具。作为目前互联网上功能最强大的搜索引擎之一,Google 的索引目录中已经储存有近百亿个网页。用户可以使用多种语言文字进行搜索。现在,Google 平均每天接受的搜索次数达2 亿人次,几乎占全球所有搜索量的1/3,而且这一数字还在不断上升。Google18Google的特色的特色最大的搜索引擎(收录的网页最多)可检内容丰富:网页、图像、网上论坛排序技术最好的(按相关度高低排列)支持多语种检索功能强

6、大个性化设置随着节庆更换图标Google检索技巧检索技巧Google一般检索功能一般检索功能23Google 特殊检索功能特殊检索功能检索指定类型的文献(filetype)24Google 特殊检索功能特殊检索功能 检索指定类型的文献(filetype)a)可检索的类型包括:PPT、PDF、DOC、XLS、SWF、RTF、JPG、GIF格式:filetype:文件类型 关键词 或:关键词 filetype:文件类型 c)选择“网页”搜索模式,其中JPG、GIF选择在“图片”搜索模式。例如:搜索关于“肺癌”的PDF文件、关于肺癌的JPG图片 在“网页”搜索模式,搜索框中输入:filetype:p

7、df 肺癌 在“图片”搜索模式,搜索框中输入:filetype:JPG 肺癌Google 特殊检索功能特殊检索功能29Google 特殊检索功能特殊检索功能32网址 关键词邓铁涛会议Google 特殊检索功能特殊检索功能Google 特殊检索功能特殊检索功能Google 检索示例检索示例3839Google 检索示例检索示例41Google高级检索模式高级检索模式42Google 检索示例检索示例43Google 检索示例检索示例44获取获取PDF全文全文45获取获取PDF全文全文46获取获取PDF全文全文推出时间:2004年11月口号:站在巨人的肩膀上Standontheshoulderso

8、f giants服务对象:主要是科学家和各类从事学术研究的人士搜索范围:涵盖几乎所有知识领域的高质量学术研究资料,包括论文、专业书籍以及技术报告等网址:http:/.hk/界面类似于普通搜索引擎,但返还的结果是学术性较强的论文和图书Google scholar 简单检索 高级检索-查找文章-作者-出版物(名称)-(文献出版)日期Google scholar检索方法检索方法简单检索简单检索返回结果的内容包括:题名、作者、发表出返回结果的内容包括:题名、作者、发表出处、提供文献信息的单位、摘要、被引情况、处、提供文献信息的单位、摘要、被引情况、相关文章、所有版本。相关文章、所有版本。2004年,G

9、oogle启动“Google Print”项目。Google这样介绍自己的Print计划:“Google的使命是将世界上所有信息都组织起来,但很多信息并不存在于网络上。Google Print的目标就是将那些存在于书本上的内容,让你以最容易的方式看到也就是出现在Google搜索结果中。”Google Print包含两个子项目:Publisher Program(出版商计划)和Library Project(图书馆计划)将图书分成三类:公共领域的图书(已经无版权限制的书籍)、出版商提供的图书,以及仍在著作权保护期内的图书馆的图书。http:/.hkGoogle PrintGoogle图书图书Go

10、ogle Print 检索方式检索方式 浏览图书 简单检索 高级检索Google Print 检索方式检索方式Google Print 检索方式检索方式第二节第二节 医学搜索引擎医学搜索引擎4 Medical Matrix(http:/www.medmatrix.org/index.asp)4 Medscape(http:/ Medical World Search(http:/ My OptumHealth(http:/ 眼科搜索(http:/)4 搜医医疗信息搜索网(http:/)由美国医学信息学会主办,1994年创建,是目前最重要的医学专业搜索引擎。它是一种由概念驱动和免费全文智能检索工

11、具,包括4600多个医学网址。可免费进入但第一次要注册 特色:收集的内容专业、全面,对每一内容均有简明扼要的评论,并且对链接的网址按一到五个星进行分级。http:/www.medmatrix.org/Index.aspMedical Matrix检索方法:Medical Matrix1)简介:共收藏了近20个临床学科2.5万篇文献,是Web 上最大的免费提供临床医学全文文献和继续医学教育资源的网点2)特点:可检索图像、声频、视频资料。提供MEDLINE免费检索,查阅Merriam-Websters医学词典、查询药物的使用等内容3)需注册一个ID号即可免费使用4)http:/ content,M

12、edline,Drug Info,AIDSL,Whole Web,News,Medical Images,Dictionary等数据库,同时还可浏览每日医学新闻等。(2)其主页界面可以根据访问者的需要进行选择,在more specialty pages选择特殊的主题方式,方便进入用户感兴趣的界面,如设为以“Transplantation”为主题方式即显示与移植相关的界面。(3)可直接进行关键词查询,在关键词查询框内键入关键词。MedScape 目前尚没有较权威的中文医学搜索引擎,要查询医学信息,可通过以下几种方法进行:借助像google、百度等综合性搜索引擎 某些综合性Internet网络信息

13、资源 国内政府医疗机构网站 国内各医科院校网站 国内各医药学会机构网站 某些专业医学网站 一些医学人士的个人网页国内医学信息搜索国内医学信息搜索第三节第三节 开放存取开放存取4.第二节第二节 搜索引擎搜索引擎3.第一节第一节 网络信息资源网络信息资源1.主要内容主要内容 什么是开放存取 开放存取的意义 开放存取资源第三节第三节 开放存取开放存取什么是开放存取什么是开放存取开放存取 开放存取文献是指Internet上公开出版的,允许任何用户对其全文进行阅读、下载、复制、传播、打印、检索或连接,允许爬行器对其编制索引,将其用作软件数据或用于其他任何合法目的,除网络自身的访问限制外不存在任何经济、法

14、律或技术方面的障碍的全文文献。布达佩斯开放存取先导计划BOAI开放存取产生的背景开放存取产生的背景传统出版商对学术期刊出版和控制导致学术危机网络技术使学术期刊的出版和传播成本大大降低大学和科研机构开始谋求新的学术交流机制开放存取的意义开放存取的意义学术信息免费的向公众开放,打破了价格障碍学术信息的可获得性,打破了使用权障碍。开放存取基本特征开放存取基本特征资源使用的无限性-有质量上的控制而无处理上的限制学术交流的高效性-自动化与互动性较强开放存取资源的多样性-常见的图书、期刊、书目、论文、音像及影像制品、电子教学资料、开放百科全书,还有开放源代码等资源-内容格式多样:图、文、影像、Hyperl

15、ink、PDF、XML等。开放存取资源的类型开放存取资源的类型开放存取期刊(Open Access Jourals)开放存取仓储(OA archive or repositories)电子预印本其他特殊资源 开放存取期刊开放存取期刊定义:是一种论文经过同行评审的、网络化的免费期刊,全世界的所有读者从此类期刊上获取学术信息将没有价格及权限的限制,编辑评审、出版及资源维护的费用不是由用户,而是由作者本人或其他机构承担。包括新创办的开放获取期刊,及将原有期刊改造为开放获取的期刊。Directory of Open Access Journalshttp:/www.doaj.org/是由瑞典兰德大学图

16、书馆整理的一份开放期刊目录。该项服务涵盖了免费的、可获取全文的、高质量的科学和学术期刊(This service covers free,full text,quality controlled scientific and scholarly journals)。他们的目标是涵盖所有学科和语言的开放期刊,目前一共有7000余种开放期刊被收录到了该目录中。HighWire Press http:/www.highwire.org/lists/freeart.dtl HighWire Press是全球最大的提供免费全文的学术文献出版商之一,于1995年由美国斯坦福大学图书馆创立。目前已收录的文章

17、总数已达674万多篇,其中超过211万篇文章可免费获得全文;这些数据仍在不断增加。通过该界面还可以检索Medline收录的4500种期刊中的1200多万篇文章,可看到文摘题录。HighWire Press收录的期刊覆盖以下学科:生命科学、医学、物理学、社会科学。部分全文可免费访问,并不是全部。BMC The Open Access Publisherhttp:/ Open Access Publisher(BioMed Central)生物医学中心开放获取期刊 目前BMC已经拥有165种开放存取期刊,收录的期刊范围涵盖了生物学和医学的主要领域,包括麻醉学、生物化学等57个分支学科。部分被MED

18、LINE收录。PMC Open Access Listhttp:/www.pubmedcentral.nih.gov/about/openftlist.html 由美国国家卫生研究院(NIH)下属的美国国立图书馆(NLM)的国家生物技术信息中心(NCBI)于2000年创建的生命科学期刊文献(由NIH收藏)的数字化存档库,与BioMed Central不同,PubMed Central并不是出版商。PMC目前收录有199种期刊,其中有153种是开放存取的。其数据来源:Blackwell Online Open Springer Open Choice PMC Open Access ListPM

19、C Open Access List更多更多Dialog Open Access http:/ Library of Science Journalshttp:/www.plos.org/journals/index.html J-STAGE E-Journal http:/www.jstage.jst.go.jp/browse/-char/en Scientific Electronic Library Online http:/www.scielo.org/index.php?lang=en FreeMedicalJournals http:/ Science Research Netwo

20、rkhttp:/ Date)检索途径有任意字段、作者、题名、关键词、文摘、标识符等。厦门大学学术典藏库(机构仓储)厦门大学学术典藏库(机构仓储)http:/ http:/dspace.mit.edu/澳大利亚国立大学科研成果库 http:/eprints.anu.edu.au/加州工学院的开放数字文档收集项目http:/library.caltech.edu/digital/Digital Library and Archives http:/scholar.lib.vt.edu/电子预印本(电子预印本(e_print)指科研工作者的研究成果还未正式出版发表,而出于和同行交流目的自愿先在学术会

21、议上或通过互联网发布的科研论文、科技报告等文章。e_print是开放获取的另一种方式,对加快科学研究成果的交流与共享,帮助研究者追踪本学科的最新研究进展,避免研究工作的重复等方面都有重要作用,对科学研究者有很高的参考价值。电子预印本特点电子预印本特点p 作者自愿提交作者自愿提交:作者按照一定的格式将论文进行排版后,通过网络、E-mail等方式,按学科类别上传至相应的目录或数据库中。p 文责自负文责自负:送入预印本库中的论文是不经过任何审核的,也没有任何先决条件决定某一论文能否送入库中。只要作者所投论文遵守国家相关法律,有一定学术水平,符合系统的基本投稿要求。涉及到具体期刊的预印本相对严格一些。

22、p 共享性共享性:任何人在尊重作者版权的基础上都可利合理用。p 交互性交互性:有些系统允许对论文进行评论和交流。p 多载体性多载体性:作者可发表到正式的刊物或其它载体形式上。p 交流速度快、利于学术争鸣、可靠性高的特点交流速度快、利于学术争鸣、可靠性高的特点。中国科技论文在线中国科技论文在线http:/ Access)的理念。可使用分类浏览的方法或用关键词查询的方法查找所需资料。中国预印本服务系统中国预印本服务系统http:/ 由中国科学技术信息研究所与国家科技图书文献中心联合建设的以提供预印本文献资源服务为主要目的的实时学术交流系统,是国家科学技术部科技条件基础平台面上项目的研究成果。该系统

23、由国内预印本服务子系统和国外预印本门户(SINDAP)子系统构成。国内预印本服务子系统主要收藏的是国内科技工作者自由提交的预印本文章,可以实现二次文献检索、浏览全文、发表评论等功能。其他资源其他资源-专利专利中国国家知识产权局 http:/ http:/ 可搜索美国专利。其他资源其他资源-电子图书电子图书图书搜索引擎搜索的图书大部分可以浏览其中一定的页数浏览其中一定的页数,通常大约占全书的20%。但是对于公版书(属于公众领域并且已不受版权法保护)确可以阅读全文。谷歌在2007年3月份推出中文图书搜索业务。中文版还加入了国学书籍的搜索,而且国学方面的内容是能够全文预览的,其高级搜索很有特色,可限度搜索“有限预览”、“全书浏览”、“国学图书”、“图书馆目录”。已与20多家出版社达成合作协议。2007年4月,百度推出图书搜索服务,首批10家合作伙伴中,有图书馆(如北大图书馆、中科院图书馆、中山图书馆)、电子书数据库(超星、方正等)和网上书店(如卓越、蔚蓝等)。谷歌图书搜索中文谷歌图书搜索中文 http:/.hk/百度图书搜索百度图书搜索 http:/ http:/ http:/ 关键词)NSTL的开放存取资源

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第七章网络信息检索课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|