信息检索课件研究生课件:第一章-绪论.ppt

上传人(卖家):罗嗣辉 文档编号:2040756 上传时间:2022-01-19 格式:PPT 页数:64 大小:6.65MB
下载 相关 举报
信息检索课件研究生课件:第一章-绪论.ppt_第1页
第1页 / 共64页
信息检索课件研究生课件:第一章-绪论.ppt_第2页
第2页 / 共64页
信息检索课件研究生课件:第一章-绪论.ppt_第3页
第3页 / 共64页
信息检索课件研究生课件:第一章-绪论.ppt_第4页
第4页 / 共64页
信息检索课件研究生课件:第一章-绪论.ppt_第5页
第5页 / 共64页
点击查看更多>>
资源描述

1、信 息 检 索 主讲人:施 亮联系电话:本课程学习的内容 学术信息检索的作用 学术信息的分类 学术信息检索语言 各种学术信息的表现形式 各种学术信息源的检索技巧 结合学术信息检索的论文写作绪 论一、我们日常接触的信息有哪些?一、我们日常接触的信息有哪些? 观观 察察交交 流流检检 索索阅阅 读读生活信息生活信息学术信息学术信息军事信息军事信息经济信息经济信息 生活信息:天气、车票、购物生活信息:天气、车票、购物. .经济信息经济信息: GDPGDP、利率、贸易利率、贸易 学术信息学术信息: :期刊、学位论文、会议投稿期刊、学位论文、会议投稿 军事信息军事信息二、学术信息检索对我们做研究有哪些帮

2、助?二、学术信息检索对我们做研究有哪些帮助?检索是获取学术信息的主要途径三、检索学术信息需要做哪些准备工作?三、检索学术信息需要做哪些准备工作?多渠道地了解学术信息源是是高效检索并获取信息的前提。熟练掌握学术信息的分类与特征是筛选有用信息的必要手段。扎实的专业基础和广泛地阅读是充分利用学术信息的根本保证。 传统检索所用的数据库在资源存储形式、学科范围、检索方式上都有一定的限定。传统检索所用的数据库在资源存储形式、学科范围、检索方式上都有一定的限定。而搜索引擎则是全方位而搜索引擎则是全方位, ,多角度搜索,能搜索各种格式的文件,没有学科的限制,多角度搜索,能搜索各种格式的文件,没有学科的限制,边

3、界很广,这正好弥补了对检全率的需求。对于某些特殊的检索边界很广,这正好弥补了对检全率的需求。对于某些特殊的检索, ,如要求查某种产如要求查某种产品的参数品的参数, ,要求比较产品的外形要求比较产品的外形, , 搜索引擎的图片查询功能就有用武之地了。有些搜索引擎的图片查询功能就有用武之地了。有些搜索引擎不但能搜到图片搜索引擎不但能搜到图片, ,甚至连多媒体、网站链接都可以搜索甚至连多媒体、网站链接都可以搜索, ,这将会对某些特殊这将会对某些特殊的检索起到关键作用。的检索起到关键作用。搜索引擎基于互联网上的免费资源,在检索方法中有效运用搜索引擎,能搜索引擎基于互联网上的免费资源,在检索方法中有效运

4、用搜索引擎,能够大大降低成本,提高效率够大大降低成本,提高效率。 随着新产品、新技术更新速度加快随着新产品、新技术更新速度加快, , 传统数据库更新传统数据库更新速度已显得相对滞后,检索期刊的滞后期少则一个月速度已显得相对滞后,检索期刊的滞后期少则一个月, ,多达多达半年。半年。 搜索引擎以其更新及时的特点正好弥补了传统数据库搜索引擎以其更新及时的特点正好弥补了传统数据库的不足。在检索传统数据库的基础上的不足。在检索传统数据库的基础上, ,利用利用InternetInternet搜索引搜索引擎进行检索擎进行检索, ,可以弥补传统数据库的时差问题,尤其是在新可以弥补传统数据库的时差问题,尤其是在

5、新产品查询时产品查询时, ,更应该进行传统数据库之外的更应该进行传统数据库之外的InternetInternet上的信上的信息查询。息查询。1 1 谷歌谷歌GoogleGoogle典型的网络搜索引擎介绍典型的网络搜索引擎介绍用Google辅助举例 有时项目查新中要对技术指标进行新颖性分析,若仅使用传统的数据库检索方式,往往会出现检索结果为“零”的尴尬结果。从科技发展的继承性上看,任何一项科技活动,都是在前人研究基础上的发展,这个结果是有悖现实的。此时,可另辟蹊径,使用搜索引擎进行检索往往会收到良好的效果。参考:杜津萍,王磊.搜索引擎在科技查新中的应用J.图书馆工作与研究,2007,3项项 目目

6、: BDQ10/24便携式液压多功能钳便携式液压多功能钳客户给出的技术特征客户给出的技术特征:“高强韧性高强韧性”、“高强度高强度”和和“防止剪料崩溅防止剪料崩溅” 由于这些特征均不明显,若按照该技术特征查找文献,符合要求的文献会很多,但真正密切相关的文献却几乎没有。查新员通过客户交流,得到了该多功能钳的具体技术指标,包括工作压力、扩张力、扩张距离和剪切能力等,然而根据这些指标进入各大数据库查询,结果仍不理想。 通过Google搜索引擎,输入检索词检索词“BDQ10/24”及及“多功能钳多功能钳”,搜索到某某他公司主页他公司主页,通过参数比较,对该产品研究水平有了直观了解。进而输入关键词“hy

7、draulic”(液压液压)和和“cutter”(钳钳),找出了相关英文网页相关英文网页,对检索到的相关产品进行对比,发现符合条件的文献还是很多。返回检索页面,仍用这两个检索词,利用Google的图片搜索功能的图片搜索功能,搜索到相关图片两千多张,再根据检索结果调整检索策略和检索词,不断缩小范围,最终找到几个液压多功能钳的专业网站液压多功能钳的专业网站,从而实现了和国外新产品技术指标的对比。利用搜索引擎的特殊的图片搜索功能,解决了传统数据库搜索结果“全”而不“准”的问题。经客户检查,发现Google搜索到的这几个专业网站是他们以前所不知道的。通过搜索引擎的检索,既解决了产品技术参数的分析比较,

8、也拓宽了客户的视野,收到了良好的效果。项目:碎裂玄武岩夹凝灰岩型铁路单线隧道综合技术研究碎裂玄武岩夹凝灰岩型铁路单线隧道综合技术研究关键词: 玄武岩玄武岩; ;夹凝灰岩夹凝灰岩; ;隧道隧道结果:学术谷歌5条;维普1条、CNKI1条这是因为专业数据库的索引库只有:文摘、标题、关键词、著者、机构等文摘型内容,所以会漏检。学术谷歌是扫描全文, 有效地保证了查全率。引自徐勇.学术搜索引擎在科技查新中的应用J.浙江高校图书情报工作.2009,1由由Elsevier ScienceElsevier Science公司公司于于20012001年年4 4月月1 1日推出,是专日推出,是专为搜索高度相关的科学

9、信息为搜索高度相关的科学信息而设计的搜索引擎。而设计的搜索引擎。 ScirusScirus是一位古希腊的先知,是一位古希腊的先知,ElsevierElsevier命以此名喻意命以此名喻意ScirusScirus将会帮助人们成为科将会帮助人们成为科学先知。学先知。 ScirusScirus能够精确地找到普能够精确地找到普通搜索引擎所找不到的免费通搜索引擎所找不到的免费或者访问受限的科学信息资或者访问受限的科学信息资源源ScirusScirus索引每月更新,可以将检索结果按照相关索引每月更新,可以将检索结果按照相关度进行排序,也可按照日期排序。提供的期刊资度进行排序,也可按照日期排序。提供的期刊资

10、源可以免费查看题录和文摘,获取全文需要预先源可以免费查看题录和文摘,获取全文需要预先注册并支付费用。注册并支付费用。运用Scirus辅助举例项目:真空碳热还原氧化镁矿提取金属镁真空碳热还原氧化镁矿提取金属镁据查新点据查新点, ,用用scirusscirus检索到的专利文献如表所示检索到的专利文献如表所示引自徐勇引自徐勇. .学术搜索引擎在科技查新中的应用学术搜索引擎在科技查新中的应用J.J.浙江高校图书情报工作浙江高校图书情报工作.2009,1.2009,1结果:Scirus查找了8条文献,但Dialog无法查到。wiki利用网络搜索引擎的注意事项利用网络搜索引擎的注意事项在运用搜索引擎进行辅

11、助查询时,必须要对检索到的信息进行可信度分析,了解信在运用搜索引擎进行辅助查询时,必须要对检索到的信息进行可信度分析,了解信息发布人、发布时间、发布地点、发布原因等情况,对信息的引证素材、论证方法、息发布人、发布时间、发布地点、发布原因等情况,对信息的引证素材、论证方法、观点结论等进行评价,从信息源、信息传播渠道、信息时效性等方面来检验信息的观点结论等进行评价,从信息源、信息传播渠道、信息时效性等方面来检验信息的可信度。可信度。由于网络搜索引擎涵盖的内容过于宽泛、发布信息的方式过于随意、信息量过于庞由于网络搜索引擎涵盖的内容过于宽泛、发布信息的方式过于随意、信息量过于庞杂,因此,搜索引擎只能作

12、为检索的辅助手段杂,因此,搜索引擎只能作为检索的辅助手段, ,不能替代传统检索方式。只是在某不能替代传统检索方式。只是在某些特殊的查新课题上些特殊的查新课题上, ,可以借助搜索引擎了解与查询课题有关信息可以借助搜索引擎了解与查询课题有关信息, ,增加对课题把握增加对课题把握度度, ,辅助解决辅助解决 “ “查全率查全率”和和“查准率查准率”问题。问题。各种搜索引擎在覆盖范围、排序方法、检索途径等方面各不相同,在使用搜索引各种搜索引擎在覆盖范围、排序方法、检索途径等方面各不相同,在使用搜索引擎进行查询之前,应该对搜索引擎的特点进行了解,把握其优势、劣势,将不同擎进行查询之前,应该对搜索引擎的特点

13、进行了解,把握其优势、劣势,将不同的搜索引擎配合使用,使其的搜索引擎配合使用,使其“扬长避短扬长避短”,优势互补。,优势互补。了解学术信息源 OA资源资源 open access resources付费资源付费资源 许多出版机构都会提供有关信息资源的题录、目次、文摘等著录事项, 一般可以通过题名、作者姓名、作者单位、关键词、语种、文摘等途径进行免费检索,典型的如下:1网络免费期刊文献网络免费期刊文献MEDLINE是美国国家医学图书馆出版的产品,提供全球生物医学文献的题录与摘要以供免费检索;Elsevier Science建立了基于Web的数字化出版平台Science Direct将约2000种

14、期刊全文数字化上网,提供免费的目次、文摘检索,同时提供全文检索,并可联网订购索取全文;类似的出版商还有Springer、John& Wiley、Blackwell、ACS等。MEDLINE2 网络免费专利文献网络免费专利文献 主要存在于专利数据库中,比如中国专利数据库,包括发明、实用 新型和外观设计3种专利的著录项目及摘要,免费检索且数据更新及时;中国知识产权网与中国专利信息网也提供部分专利文献的免费检索服务;欧洲专利局提供的esp cenet提供50多个国家的专利信息,信息量大且免费检索。此外,美国、日本、俄罗斯、加拿大等国的专利管理机构也提供本国专利数据库的网上免费检索服务。3 网络免费会

15、议文献网络免费会议文献 各种大型的学术团体或政府机构通常都会在网上提供文献服务。如 SPIE会议录通过“国际光学工程协会”的网站提供会议文献的免费检索服务;中国国家科技图书文献中心也通过网站提供题名、作者姓名、作者单位、会议录、文集名、关键词、语种、文摘内容等会议文献的免费检索信息;IEEE每年报道300多个生物医学技术和通讯技术、计算机工程、电力、宇航、电子及其他技术领域的会议信息,提供会议日期、关键词、国家、城市、登记号、主办者等项目的免费信息检索。4 网络免费标准文献网络免费标准文献 国际标准化组织通过网站提供ISO标准文献数据库的免费检索。美国国家标准协会也为用户免费提供检索工业标准、

16、国际标准、美国政府标准、美国国家标准以及一些正在拟定的标准。中国标准服务网、日本标准协会等网站也提供标准文献免费检索。 当前,网络上的免费全文信息资源不计其数,但真正符合科技查新要求的,必须是正规出版机构提供的数据库资源,这种资源即为所谓的“开放资源”。开放资源是针对传统的基于订阅的出版模式而言的,是利用网络条件为科研人员提供免费的全文文献,实现科研成果的广泛共享。北京大学信息管理系的李武将开放资源归纳为两种形式:和。 参考:李武.开放存取出版的两种主要实现途径J.大学图书馆学报,2005,4两者的区别:开放期刊一般实施严格的同行评审制度,而开放仓储没有同行评审,所以前者学术权威性更高。,开放

17、期刊比开放仓储的运营成本要高得多。前者主要采用作者付费模式及争取相关机构赞助、经营广告、提供印刷产品的收费服务以及为用户提供收费的增值服务等;后者一般为大学图书馆或研究所创建,不但为用户提供免费访问服务,同时也对作者提供免费存储服务,是更严格意义上的“开放存取”。,相对于开放期刊,开放仓储不仅存放学术论文,还存入其他各种学术研究资料,包括实验数据和技术报告等。,开放期刊更多地诉诸传统的文献索引服务,争取被学科领域的权威文摘索引数据库收录;开放仓储的资源检索主要是通过搜索引擎来实现,尤其是在OAIPMH应用以后。 当前,很多机构将两种形式者结合起来,如加州大学e-Sholarship仓储现在也开

18、始支持同行评审。 中国科技论文在线(中国科技论文在线()是经教育部批准,)是经教育部批准,由教育部科技发展中心主办的科技论文网站。由教育部科技发展中心主办的科技论文网站。依托依托3535位中国科学院和中国工程院院士组成的顾问委员会为位中国科学院和中国工程院院士组成的顾问委员会为网站提供学术指导,是一个完全公益性的科技论文网站。网站提供学术指导,是一个完全公益性的科技论文网站。免费资源之一:中国科技论文在线免费资源之一:中国科技论文在线arXiv.org电子预印本档案是美国能源部资助美国高能物理研究所的一个项目。主要包括物理学,数学,生物工程,能源科学与技术,计算机科学与软件工程,电子信息工程等

19、学科。免费资源之二:免费资源之二:arXiv.orgarXiv.orgarXiv.org免费资源之三:免费资源之三:国家科技图书文献中心国家科技图书文献中心 国家科技图书文献中心(National Science and Technology, 简称NSTL)是经国务院领导批准, 于2000年6月12日成立的一个基于网络环境的科技信息资源服务机构。中心由中国科学院文献情报中心、国家工程技术图书馆(包括中国 科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院和中国化工信息中心)、中国农业科学院农业信息研究所、中国医 学科学院医学信息研究所、中国标准化研究院标准馆和中国计量科学研究院文

20、献馆组成。 DOAJ(Directory of OAJ)是由瑞典的隆德大学图书馆 Lund University Libraries为OA资源做的一个目录系统。它设立于2003年5月,最初仅收录 350 种期刊,截至2006年3月收录的开放存取期刊超过2000种、文章9万多篇。该系统收录的均为学术性、研究性期刊,一般都是经过同行评审,或者有编辑作质量控制的期刊,具有免费、全文、高质量的特点,对学术研究有很高的参考价值。该目录及其收录期刊、论文可自由存取,任何人可以使用,不反对商业用途。该目录的目标是包含各种语言、各个主题的期刊。 学科范围:生命科学、农业、食品、经济、化学、环境科学、历史、艺术

21、、学科范围:生命科学、农业、食品、经济、化学、环境科学、历史、艺术、 法律、工程、社会科学法律、工程、社会科学 www.doaj.org是斯坦福大学图书馆的分支机构,出版777种自然科学方面的网络版期刊,提供2000多种高影响力期刊(包括Journal of BiologicalChemistry、Science、PNAS)的免费访问。免费资源之五:免费资源之五: 免费资源之六:免费资源之六:http:/ AD报告也产生较早,1951年开始出版。现由美国国防技术情报中心(DTIC:Defence Technical Information Center)负责收集整理和出版。报告内容以国防部各个

22、合同户的研究报告为主,其报告号冠以AD,A原先为Armed、D则为Document之意,现在则可理解为入藏报告(Accession Document)。 PB报告产生于二战(WORLD WAR II)结束之后,当时美国政府为了整理和利用从战败国获得的数以千吨计的秘密科技资料,于1945年6月成立了一个专门的出版局,即美国商务部出版局(Publication Board),负责收集、整理、报导利用这些资料。 免费资源之七:免费资源之七:STAR是美国国家航空航天局NASA (National Aeronautics and Space Administration)科技情报处编辑、出版的专业性检

23、索刊物,它是检索航空航天科技报告的重要工具。 Energy Research Abstracts,简称ERA,是美国能源部DOE(Department Of Energy)技术情报中心编辑出版的半月刊。ERA收录能源部部属科研机构和各大学等一切与能源有关的科技文献,但以科技报告为主。 1、NTIS: http:/ www.ntis.gov/ 2、DTIC: http:/www.dtic.mil/3、DOE: http:/www.doe.gov.my/4、NASA: http:/www.nasa.gov/国防技术情报中心(Defence Technical Informa- tion Centr

24、e,DTIC) 美国1945年建立。1979年改现称,是国防部科技和管理情报中心。向承担国防科研任务的单位提供研究报告,开展咨询、检索、定题、专利评审等项服务。收藏文献150余万件,建立数据库4种,出版物有 8种,并管理10个情报分析中心。工作人员约450人。地址:弗吉尼亚州。 NASA National Aeronautics and Space Administration美国国家航空航天局的缩写,NASA全称美国国家航空航天局,是世界上最大的民用航天机构。1958年10月1日NASA正式成立。总部位于华盛顿哥伦比亚特区。 兰利研究中心、刘易斯研究中心、艾姆斯研究中心飞行研究中心(爱德华空

25、军基地实验室)海军研究实验室有关先锋计划的部分 马歇尔航天飞行中心 肯尼迪航天中心、约翰逊航天中心、太空飞行器中心 国家技术情报服务局(National Technical Infor- mation Service,NTIS) 美国1970年建立。负责搜集、加工、印发美国政府研究报告,馆藏资料150余万件,建有NTIS文献库、世界引文索引数据库、正在进行中的联邦研究项目数据库等。开展联机检索服务、出租磁带、提供缩微品、答复咨询等服务活动。工作人员370余人。年度预算约3000万美元。地址:弗吉尼亚州。 思考:利用以上信息源我们可以做什么?例如,进行专利检索1、避免重复开发2、规避设计3、借鉴

26、他人技术再开发4、及时发现竞争对手动向5、完善方案6、停止某些无效项目信息检索的学科属性是什么?发展历程 信息检索的学科基础情报学学科目的: 1、最佳标引 2、最少查找时间克劳德香农(Claude Elwood Shannon,1916-2001)1916年4月30日诞生于美国密西根州的Petoskey。香农理论的重要特征是熵(entropy)的概念,他证明熵与信息内容的不确定程度有等价关系。熵曾经是波尔兹曼在热力学第二定律引入的概念,我们可以把它理解为分子运动的混乱度,信息熵也有类似意义。 在20世纪中叶,人类终于对三个非常重要的概念:质量、能量、信息量都有了定量的计量办法。 H=-pi l

27、og piA Mathematical Theory of Communication 1948布拉德福(18781948)Bradford,Samuel Clement 他在1934年提出了布拉德福定律,指出“若将期刊按其刊载某专业论文数以递减顺序排列,再将期刊划分为载文量相等的三个区域,则可得出期刊数量比约为1:1:2的关系”。 即: 某一学科的大部分论文往往高度集中在少数期刊中,而其少数论文则分散于大量期刊上。1955年,在美国新泽西州一个鸡舍改造的工作间中,尤金加菲尔德(Eugene Garfield)博士首次提出“引文索引”概念,1961年试编成了科学引文索引,1963年,SCI 正式创刊。1925.9.251978年 ISTP (index to science & technical proceedings)科学会议录索引创立标志着国际3大检索体系正式形成。SCI (Science Citation Index )科学引文索引1963,1966,1979EI (The Engineering Index )工程索引1884 科学评论索引(Index to Scientific Reviews 简称ISR),1974社会科学引文索引(Social Science Citation Index,简称SSCI ) 国际三大检索刊物/系统

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(信息检索课件研究生课件:第一章-绪论.ppt)为本站会员(罗嗣辉)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|