1、信 息 检 索 主讲人:施 亮联系电话:本课程学习的内容n学术信息检索的作用n学术信息的分类n学术信息检索语言n各种学术信息的表现形式n各种学术信息源的检索技巧n结合学术信息检索的论文写作绪 论一、我们日常接触的信息有哪些?一、我们日常接触的信息有哪些? 观观 察察交交 流流检检 索索阅阅 读读生活信息生活信息学术信息学术信息军事信息军事信息经济信息经济信息 生活信息:天气、车票、购物生活信息:天气、车票、购物. .经济信息经济信息: GDPGDP、利率、贸易利率、贸易 学术信息学术信息: :期刊、学位论文、会议投稿期刊、学位论文、会议投稿 军事信息军事信息二、学术信息检索对我们做研究有哪些帮
2、助?二、学术信息检索对我们做研究有哪些帮助?检索是获取学术信息的主要途径三、检索学术信息需要做哪些准备工作?三、检索学术信息需要做哪些准备工作?1、多渠道地了解学术信息源是是高效检索并获取信息的前提。2、熟练掌握学术信息的分类与特征是筛选有用信息的必要手段。3、扎实的专业基础和广泛地阅读是充分利用学术信息的根本保证。学术信息源学术信息源搜索引擎搜索引擎专业数据库专业数据库开放式资源开放式资源 传统检索所用的数据库在资源存储形式、学科范围、检索传统检索所用的数据库在资源存储形式、学科范围、检索方式上都有一定的限定。而搜索引擎则是全方位方式上都有一定的限定。而搜索引擎则是全方位, ,多角度搜索,多
3、角度搜索,能搜索各种格式的文件,没有学科的限制,边界很广,这正好能搜索各种格式的文件,没有学科的限制,边界很广,这正好弥补了对检全率的需求。对于某些特殊的检索弥补了对检全率的需求。对于某些特殊的检索, ,如要求查某种如要求查某种产品的参数产品的参数, ,要求比较产品的外形要求比较产品的外形, , 搜索引擎的图片查询功能搜索引擎的图片查询功能就有用武之地了。有些搜索引擎不但能搜到图片就有用武之地了。有些搜索引擎不但能搜到图片, ,甚至连多媒甚至连多媒体、网站链接都可以搜索体、网站链接都可以搜索, ,这将会对某些特殊的检索起到关键这将会对某些特殊的检索起到关键作用。作用。 随着新产品、新技术更新速
4、度加快随着新产品、新技术更新速度加快, , 传统数据库更新传统数据库更新速度已显得相对滞后,检索期刊的滞后期少则一个月速度已显得相对滞后,检索期刊的滞后期少则一个月, ,多达多达半年。半年。 搜索引擎以其更新及时的特点正好弥补了传统数据库搜索引擎以其更新及时的特点正好弥补了传统数据库的不足。在检索传统数据库的基础上的不足。在检索传统数据库的基础上, ,利用利用InternetInternet搜索引搜索引擎进行检索擎进行检索, ,可以弥补传统数据库的时差问题,尤其是在新可以弥补传统数据库的时差问题,尤其是在新产品查询时产品查询时, ,更应该进行传统数据库之外的更应该进行传统数据库之外的Inter
5、netInternet上的信上的信息查询。息查询。 搜索引擎基于互联网上的免费资源,在检索方法中有搜索引擎基于互联网上的免费资源,在检索方法中有效运用搜索引擎,能够大大降低成本,提高效率效运用搜索引擎,能够大大降低成本,提高效率。1 1 谷歌谷歌GoogleGoogle典型的网络搜索引擎介绍典型的网络搜索引擎介绍用Google辅助举例: 有时项目查新要对技术指标进行新颖性分析,若仅使用传统的数据库检索方式,往往会出现检索结果为“零”的尴尬结果。从科技发展的继承性上看,任何一项科技活动,都是在前人研究基础上的发展,这个结果是有悖现实的。此时,可另辟蹊径,使用搜索引擎进行检索往往会收到良好的效果。
6、参考:杜津萍,王磊.搜索引擎在科技查新中的应用J.图书馆工作与研究,2007,3项项 目目: BDQ10/24便携式液压多功能钳便携式液压多功能钳客户给出的技术特征客户给出的技术特征:“高强韧性高强韧性”、“高强度高强度”和和“防止剪料崩溅防止剪料崩溅” 由于这些特征均不明显,若按照该技术特征查找文献,符合要求的文献会很多,但真正密切相关的文献却几乎没有。查新员通过客户交流,得到了该多功能钳的具体技术指标,包括工作压力、扩张力、扩张距离和剪切能力等,然而根据这些指标进入各大数据库查询,结果仍不理想。 通过Google搜索引擎,输入检索词检索词“BDQ10/24”及及“多功能钳多功能钳”,搜索到
7、某某他公司主页他公司主页,通过参数比较,对该产品研究水平有了直观了解。进而输入关键词“hydraulic”(液压液压)和和“cutter”(钳钳),找出了相关英文网页相关英文网页,对检索到的相关产品进行对比,发现符合条件的文献还是很多。返回检索页面,仍用这两个检索词,利用Google的图片搜索功能的图片搜索功能,搜索到相关图片两千多张,再根据检索结果调整检索策略和检索词,不断缩小范围,最终找到几个液压多功能钳的专业网站液压多功能钳的专业网站,从而实现了和国外新产品技术指标的对比。利用搜索引擎的特殊的图片搜索功能,解决了传统数据库搜索结果“全”而不“准”的问题。经客户检查,发现Google搜索到
8、的这几个专业网站是他们以前所不知道的。通过搜索引擎的检索,既解决了产品技术参数的分析比较,也拓宽了客户的视野,收到了良好的效果。运用运用Google Scholar辅助举例辅助举例项目:碎裂玄武岩夹凝灰岩型铁路单线隧道综合技术研究碎裂玄武岩夹凝灰岩型铁路单线隧道综合技术研究关键词: 玄武岩玄武岩; ;夹凝灰岩夹凝灰岩; ;隧道隧道结果:学术谷歌5条;维普1条、CNKI1条这是因为专业数据库的索引库只有:文摘、标题、关键词、著者、机构等文摘型内容,所以会漏检。学术谷歌是扫描全文, 有效地保证了查全率。引自徐勇.学术搜索引擎在科技查新中的应用J.浙江高校图书情报工作.2009,1由由Elsevie
9、r ScienceElsevier Science公司公司于于20012001年年4 4月月1 1日推出,是专日推出,是专为搜索高度相关的科学信息为搜索高度相关的科学信息而设计的搜索引擎。而设计的搜索引擎。 ScirusScirus是一位古希腊的先知,是一位古希腊的先知,ElsevierElsevier命以此名喻意命以此名喻意ScirusScirus将会帮助人们成为科将会帮助人们成为科学先知。学先知。 ScirusScirus能够精确地找到普能够精确地找到普通搜索引擎所找不到的免费通搜索引擎所找不到的免费或者访问受限的科学信息资或者访问受限的科学信息资源源ScirusScirus索引每月更新,
10、可以将检索结果按照相关索引每月更新,可以将检索结果按照相关度进行排序,也可按照日期排序。提供的期刊资度进行排序,也可按照日期排序。提供的期刊资源可以免费查看题录和文摘,获取全文需要预先源可以免费查看题录和文摘,获取全文需要预先注册并支付费用。注册并支付费用。运用Scirus辅助举例项目:真空碳热还原氧化镁矿提取金属镁真空碳热还原氧化镁矿提取金属镁据查新点据查新点, ,用用scirusscirus检索到的专利文献如表所示检索到的专利文献如表所示引自徐勇引自徐勇. .学术搜索引擎在科技查新中的应用学术搜索引擎在科技查新中的应用J.J.浙江高校图书情报工作浙江高校图书情报工作.2009,1.2009
11、,1结果:Scirus查找了8条文献,但Dialog无法查到。wiki利用网络搜索引擎的注意事项利用网络搜索引擎的注意事项 由于网络搜索引擎涵盖的内容过于宽泛、发布信息的由于网络搜索引擎涵盖的内容过于宽泛、发布信息的方式过于随意、信息量过于庞杂,因此,搜索引擎只能方式过于随意、信息量过于庞杂,因此,搜索引擎只能作为检索的辅助手段作为检索的辅助手段, ,不能替代传统检索方式。只是在不能替代传统检索方式。只是在某些特殊的查新课题上某些特殊的查新课题上, ,可以借助搜索引擎了解与查询可以借助搜索引擎了解与查询课题有关信息课题有关信息, ,增加对课题把握度增加对课题把握度, ,辅助解决辅助解决 “ “
12、查全率查全率”和和“查准率查准率”问题。问题。 在运用搜索引擎进行辅助查询时,必须要对检索到的在运用搜索引擎进行辅助查询时,必须要对检索到的信息进行可信度分析,了解信息发布人、发布时间、发布信息进行可信度分析,了解信息发布人、发布时间、发布地点、发布原因等情况,对信息的引证素材、论证方法、地点、发布原因等情况,对信息的引证素材、论证方法、观点结论等进行评价,从信息源、信息传播渠道、信息时观点结论等进行评价,从信息源、信息传播渠道、信息时效性等方面来检验信息的可信度。效性等方面来检验信息的可信度。 各种搜索引擎在覆盖范围、排序方法、检索途径等各种搜索引擎在覆盖范围、排序方法、检索途径等方面各不相
13、同,在使用搜索引擎进行查询之前,应该对方面各不相同,在使用搜索引擎进行查询之前,应该对搜索引擎的特点进行了解,把握其优势、劣势,将不同搜索引擎的特点进行了解,把握其优势、劣势,将不同的搜索引擎配合使用,使其的搜索引擎配合使用,使其“扬长避短扬长避短”,优势互补。,优势互补。 当前,网络上的免费全文信息资源不计其数,但真正符合科技查新要求的,必须是正规出版机构提供的数据库资源,这种资源即为所谓的“开放资源”。开放资源是针对传统的基于订阅的出版模式而言的,是利用网络条件为科研人员提供免费的全文文献,实现科研成果的广泛共享。北京大学信息管理系的李武将开放资源归纳为两种形式:和。 参考:李武.开放存取
14、出版的两种主要实现途径J.大学图书馆学报,2005,4 1网络免费期刊文献网络免费期刊文献MEDLINE是美国国家医学图书馆出版的产品,提供全球生物医学文献的题录与摘要以供免费检索;Elsevier Science建立了基于Web的数字化出版平台Science Direct将约2000种期刊全文数字化上网,提供免费的目次、文摘检索,同时提供全文检索,并可联网订购索取全文;类似的出版商还有Springer、John& Wiley、Blackwell、ACS等。MEDLINE2 网络免费专利文献网络免费专利文献 主要存在于专利数据库中,比如中国专利数据库,包括发明、实用新型和外观设计3种专利的著录
15、项目及摘要,免费检索且数据更新及时;中国知识产权网与中国专利信息网也提供部分专利文献的免费检索服务;欧洲专利局提供的esp cenet提供50多个国家的专利信息,信息量大且免费检索。此外,美国、日本、俄罗斯、加拿大等国的专利管理机构也提供本国专利数据库的网上免费检索服务。3 网络免费会议文献网络免费会议文献 各种大型的学术团体或政府机构通常都会在网上提供文献服务。如 SPIE会议录通过“国际光学工程协会”的网站提供会议文献的免费检索服务;中国国家科技图书文献中心也通过网站提供题名、作者姓名、作者单位、会议录、文集名、关键词、语种、文摘内容等会议文献的免费检索信息;IEEE每年报道300多个生物
16、医学技术和通讯技术、计算机工程、电力、宇航、电子及其他技术领域的会议信息,提供会议日期、关键词、国家、城市、登记号、主办者等项目的免费信息检索。4 网络免费标准文献网络免费标准文献 国际标准化组织通过网站提供ISO标准文献数据库的免费检索。美国国家标准协会也为用户免费提供检索工业标准、国际标准、美国政府标准、美国国家标准以及一些正在拟定的标准。中国标准服务网、日本标准协会等网站也提供标准文献免费检索。 中国科技论文在线(中国科技论文在线()是经教育部批准,)是经教育部批准,由教育部科技发展中心主办的科技论文网站。由教育部科技发展中心主办的科技论文网站。依托依托3535位中国科学院和中国工程院院
17、士组成的顾问委员会为位中国科学院和中国工程院院士组成的顾问委员会为网站提供学术指导,是一个完全公益性的科技论文网站。网站提供学术指导,是一个完全公益性的科技论文网站。免费资源之一:中国科技论文在线免费资源之一:中国科技论文在线arXiv.org电子预印本档案是美国能源部资助美国高能物理研究所的一个项目。主要包括物理学,数学,生物工程,能源科学与技术,计算机科学与软件工程,电子信息工程等学科。免费资源之二:免费资源之二:arXiv.orgarXiv.orgarXiv.org免费资源之三:免费资源之三:国家科技图书文献中心国家科技图书文献中心 国家科技图书文献中心(National Science
18、 and Technology, 简称NSTL)是经国务院领导批准, 于2000年6月12日成立的一个基于网络环境的科技信息资源服务机构。中心由中国科学院文献情报中心、国家工程技术图书馆(包括中国 科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院和中国化工信息中心)、中国农业科学院农业信息研究所、中国医 学科学院医学信息研究所、中国标准化研究院标准馆和中国计量科学研究院文献馆组成。 DOAJ(Directory of OAJ)是由瑞典的隆德大学图书馆 Lund University Libraries为OA资源做的一个目录系统。它设立于2003年5月,最初仅收录 350 种期刊,
19、截至2006年3月收录的开放存取期刊超过2000种、文章9万多篇。该系统收录的均为学术性、研究性期刊,一般都是经过同行评审,或者有编辑作质量控制的期刊,具有免费、全文、高质量的特点,对学术研究有很高的参考价值。该目录及其收录期刊、论文可自由存取,任何人可以使用,不反对商业用途。该目录的目标是包含各种语言、各个主题的期刊。 学科范围:生命科学、农业、食品、经济、化学、环境科学、历史、艺术、学科范围:生命科学、农业、食品、经济、化学、环境科学、历史、艺术、 法律、工程、社会科学法律、工程、社会科学 www.doaj.org是斯坦福大学图书馆的分支机构,出版777种自然科学方面的网络版期刊,提供20
20、00多种高影响力期刊(包括Journal of BiologicalChemistry、Science、PNAS)的免费访问。免费资源之五:免费资源之五: 免费资源之六:免费资源之六:http:/ AD报告也产生较早,1951年开始出版。现由美国国防技术情报中心(DTIC:Defence Technical Information Center)负责收集整理和出版。报告内容以国防部各个合同户的研究报告为主,其报告号冠以AD,A原先为Armed、D则为Document之意,现在则可理解为入藏报告(Accession Document)。 PB报告产生于二战(WORLD WAR II)结束之后,当
21、时美国政府为了整理和利用从战败国获得的数以千吨计的秘密科技资料,于1945年6月成立了一个专门的出版局,即美国商务部出版局(Publication Board),负责收集、整理、报导利用这些资料。 免费资源之七:免费资源之七:STAR是美国国家航空航天局NASA (National Aeronautics and Space Administration)科技情报处编辑、出版的专业性检索刊物,它是检索航空航天科技报告的重要工具。 Energy Research Abstracts,简称ERA,是美国能源部DOE(Department Of Energy)技术情报中心编辑出版的半月刊。ERA收录
22、能源部部属科研机构和各大学等一切与能源有关的科技文献,但以科技报告为主。 1、NTIS: http:/ www.ntis.gov/ 2、DTIC: http:/www.dtic.mil/3、DOE: http:/www.doe.gov.my/4、NASA: http:/www.nasa.gov/国防技术情报中心(Defence Technical Informa- tion Centre,DTIC) 美国1945年建立。1979年改现称,是国防部科技和管理情报中心。向承担国防科研任务的单位提供研究报告,开展咨询、检索、定题、专利评审等项服务。收藏文献150余万件,建立数据库4种,出版物有 8种
23、,并管理10个情报分析中心。工作人员约450人。地址:弗吉尼亚州。 NASA National Aeronautics and Space Administration美国国家航空航天局的缩写,NASA全称美国国家航空航天局,是世界上最大的民用航天机构。1958年10月1日NASA正式成立。总部位于华盛顿哥伦比亚特区。 兰利研究中心、刘易斯研究中心、艾姆斯研究中心飞行研究中心(爱德华空军基地实验室)海军研究实验室有关先锋计划的部分 马歇尔航天飞行中心 肯尼迪航天中心、约翰逊航天中心、太空飞行器中心 国家技术情报服务局(National Technical Infor- mation Servi
24、ce,NTIS) 美国1970年建立。负责搜集、加工、印发美国政府研究报告,馆藏资料150余万件,建有NTIS文献库、世界引文索引数据库、正在进行中的联邦研究项目数据库等。开展联机检索服务、出租磁带、提供缩微品、答复咨询等服务活动。工作人员370余人。年度预算约3000万美元。地址:弗吉尼亚州。 利用以上信息源我们可以做什么?例如,进行专利检索1、避免重复开发2、规避设计3、借鉴他人技术再开发4、及时发现竞争对手动向5、完善方案6、停止某些无效项目信息检索的学科属性是什么?发展历程 信息检索的学科基础情报学学科目的: 1、最佳标引 2、最少查找时间克劳德香农(Claude Elwood Sha
25、nnon,1916-2001)1916年4月30日诞生于美国密西根州的Petoskey。香农理论的重要特征是熵(entropy)的概念,他证明熵与信息内容的不确定程度有等价关系。熵曾经是波尔兹曼在热力学第二定律引入的概念,我们可以把它理解为分子运动的混乱度,信息熵也有类似意义。 在20世纪中叶,人类终于对三个非常重要的概念:质量、能量、信息量都有了定量的计量办法。 H=-pi log piA Mathematical Theory of Communication 1948布拉德福(18781948)Bradford,Samuel Clement 他在1934年提出了布拉德福定律,指出“若将期刊按其刊载某专业论文数以递减顺序排列,再将期刊划分为载文量相等的三个区域,则可得出期刊数量比约为1:1:2的关系”。 即: 某一学科的大部分论文往往高度集中在少数期刊中,而其少数论文则分散于大量期刊上。1955年,在美国新泽西州一个鸡舍改造的工作间中,尤金加菲尔德(Eugene Garfield)博士首次提出“引文索引”概念,1961年试编成了科学引文索引,1963年,SCI 正式创刊。1925.9.25