1、1中山大学文献检索与利用 本本ppt课件仅供学习使用课件仅供学习使用 本本ppt课件仅供学习使用课件仅供学习使用 本本ppt课件仅供学习使用课件仅供学习使用 学习完毕请自行删除学习完毕请自行删除教学经历资讯管理学院 副教授,管理学博士,硕士研究生导师学术、专业,美国雪城大学信息学院访问学者学术专长:信息检索、信息效劳、管理咨询研究方向:网络信息资源管理、数字信息效劳、数据科学管理主持教学教改工程:中山大学本科教改工程:基于Blackboard平台?信息组织?课程建立美国岭南基金会 中山大学博雅教育方案精品课程建立工程:网络信息检索与利用双语中山大学研究生教育教学改革研究工程:学术信息检索与学科
2、前沿跟踪中山大学本科双语教学课程建立工程:信息检索2关于该课程 文献检索是干什么的?我需要这样一门课吗?它能给我的益处与收获?我们都会使用百度google,还有什么是搜索引擎不能做的吗?你能为我的研究带来高效率、高水准?。为什么?3 上小学时知道了太阳系有九大行星。当时人们还没有找到太阳系之外的任何行星。现在,天文学家已经找到超过800颗围绕其它恒星公转的行星此外可能是行星的“候选天体数量更是上千,而同时冥王星却已被降级为一颗“矮行星。即使粗略检视其他领域你也会发现类似的情况。4知识半衰期 哈佛大学数学家萨缪尔阿布斯曼Samuel Arbesman给这种现象取名叫“知识的半衰期,并写了一本以此
3、为题的书。在书中他解释说知识的新旧交替如同放射性衰变,你无法预知某项特定知识是否会受这种衰变效果影响而被淘汰,但你能够找出某一领域的知识在多久之后会有一半被淘汰。真理的衰变:事实也有半衰期,世界科学,2021115 例如,在研究肝炎和肝硬化的医学方面,研究者对过多久这些领域内的一半知识会被推翻进展了研究。他们将50年前的一批论文交给一个专家评审团,判断其中哪些的结果如今已被推翻,或是已经不再重要。他们将结果绘成一副图表,并在图中看到非常清楚平滑的衰变曲线。你可以用该图预测每过45年,该领域的知识都会有一半变得过时。6 哪些科学领域的“衰变最慢?哪些最快?它们之间为什么会有这样的差异?这是没有标
4、准答案的,因为衰变率本身会随时间推移而改变。例如,当医学最早从一门艺术变成一门科学时,其半衰期比现在要迅速多了。尽管如此,医学仍然是半衰期非常短的一门科学,实际上它是知识变化最快的领域之一。知识变化最慢的领域之一是数学,因为在数学里一旦证明某一定理很多时候结果就等于是敲定了,除非有人发现你证明过程中的错误其一般不会被推翻。7 我们观察到的一个现象就是社会科学的衰变率比自然科学要快得多,因为社会科学在实验水平上存在的“噪音要大得多。例如,在物理学里,如果你想要研究抛物线轨迹,你可以发射大炮100次,看看炮弹会落在哪里。你会发现炮弹大多非常漂亮地集中在某个点周围。但是如果你测量的对象是人,那问题就
5、多了,因为人对大量不同的外界事物会有反响,换句话说,效应大小会小得多。8 我希望让人们看见知识是如何改变的。但是同时我也想指出一旦你知道知识是会改变的,你必须要常常警醒,这样才不会在你的孩子放学回家告诉你恐龙有羽毛时大吃一惊。你必须经常查阅资料,意识到自己年轻时学到的很多知识并不是最先进的。例如,医学在鼓励从业者时时保持学习最新知识这一点上做得很好。很多医学院学生会被告知他们所学的一切在毕业后不久就会过时。甚至有一个名叫“最新信息的网站在不停地更新医学教科书。在一定程度上各个领域都可以学习医学,我们必须不停地努力来重新探索世界,就算这仅仅表达在更频繁地查维基百科也好。而且我所讲的不仅只是关于恐
6、龙和外太空。你在营养和育儿这些和我们生活息息相关的领域也会看到同样的知识更新现象。9 知识半衰期正在日益缩短,由最早的100年逐渐缩短至当前的3年左右。美国福特汽车公司的首席技术专家路易斯罗斯说的:“对你的职业生涯而言,知识就像鲜奶,纸盒右边就印着有效日期。工程技术的有效期大约是三年,如果时间到了你还不更新所有的知识,你的职业生涯也就到头了。国外有研究说明:在农业经济时代,人们只要在714岁承受教育,就足以应付往后40 年工作生活之所需;在工业经济时代,人们求学的时间延伸为522岁;而在知识经济时代,学习将成为人们的终身需要。10终身学习“终身学习概念是20世纪60年代中期在兴旺国家提出的,一
7、经提出便得到了国际社会的热烈响应,演变为国际潮流。20世纪70年代,联合国教科文组织提出:人类要向着学习型社会开展。十年寒窗并不能终身受用,不断学习就需要不断获取所需要的信息,信息素养核心内容中正包含着信息获取与利用。11信息素质与创新能力有关吗 好比作家需要融合许多同类人物身上的特点,才能创造出典型的新人物形象;机械设计师通常需要某些原型的启发,才能设计出新机器。科学巨匠中有哪一个不是知识广博、经历丰富的呢?创新的本质实际上是知识的重组、信息的延伸。从创造学所研究的各种创造方法归纳,创造能力的本质都离不开人类的“联想思维能力,而“联想和“想象与印象和记忆有关,没有印象和记忆,联想或想象都是无
8、源之水、无根之木。印象和记忆即个人掌握的信息量,换句话说,只有拥有丰富的各种知识和信息才具备创新的根底。12信息素养 信息素养Information Literacy是指个人有能力觉察何时需要信息,且能有效的查询、评估、组织与利用信息。One of the most widely used definitions originates with the American Library Association“信息素养者是指受过训练能利用资源至工作中的人,他们学习使用信息工具与信息源的技术与技能,构建以信息解决问题的能力。13信息素养是一种根本能力 信息素养是一种对信息社会的适应能力。美国教育
9、技术CEO论坛2001年第4季度报告提出21世纪的能力素质,包括根本学习技能(指读、写、算)、信息素养、创新思维能力、人际交往与合作精神、实践能力。信息素养是其中一个方面,它涉及信息的意识、信息的能力和信息的应用。能够判断什么时候需要信息,并且懂得如何去获取信息,如何去评价和有效利用所需的信息。14信息素养是一种综合能力 信息素养涉及各方面的知识,是一个特殊的、涵盖面很宽的能力,它包含人文的、技术的、经济的、法律的诸多因素,和许多学科有着严密的联系。信息技术支持信息素养,通晓信息技术强调对技术的理解、认识和使用技能。而信息素养的重点是内容、传播、分析,包括信息检索以及评价,涉及更宽的方面。它是
10、一种了解、搜集、评估和利用信息的知识构造,既需要通过熟练的信息技术,也需要通过完善的调查方法、通过鉴别和推理来完成。信息素养是一种信息能力,信息技术是它的一种工具158个方面的能力 运用信息工具 能熟练使用各种信息工具,特别是网络传播工具。获取信息 能根据自己的学习目标有效地收集各种学习资料与信息,能熟练地运用阅读、访问、讨论、参观、实验、检索等获取信息的方法。处理信息 能对收集的信息进展归纳、分类、存储记忆、鉴别、遴选、分析综合、抽象概括和表达等。16 生成信息 在信息收集的根底上,能准确地概述、综合、履行和表达所需要的信息,使之简洁明了,通俗流畅并且富有个性特色。创造信息 在多种收集信息的
11、交互作用的根底上,迸发创造思维的火花,产生新信息的生长点,从而创造新信息,到达收集信息的终极目的。发挥信息的效益 善于运用承受的信息解决问题,让信息发挥最大的社会和经济效益。17 信息协作 使信息和信息工具作为跨越时空的、“零距离的交往和合作中介,使之成为延伸自己的高效手段,同外界建立多种和谐的合作关系。信息免疫 浩瀚的信息资源往往良莠不齐,需要有正确的人生观、价值观、甄别能力以及自控、自律和自我调节能力,能自觉抵御和消除垃圾信息及有害信息的干扰和侵蚀,并且完善符合时代的信息伦理素养。1819主要内容 2.常用的信息工具:通用、学术搜索引擎 3.综合大型学术数据库:CNKI、VIP、WOS、G
12、S、Scopus、ABI、EBSCO、EMERALD。5.案例分析,学术信息综合利用、文献管理软件20 采用课题检索报告的方式进展课程学习考核。考试占60%,平时上机作业占30%,讨论、出勤占10%。21 对于学术问题而言,通常我们根据需求知识的特点将需求类型分为以下两种。1、特征型知识需求:特征型知识一般有比较确定的解,可以通过事实型、数值型数据库和搜索引擎、百科类网站获得。例如查找某概念确实切含义:“查找什么是blog?或者查找某概念的背景知识:“谁最先发现青霉素?或者查找某些事物的数值及量化指标:“如金刚石的物理与化学特性等。22 2、关联型知识需求:而在学习研究中更大量是没有确定的解的
13、知识,需要通过查找某些相关的知识,进展分析归纳与综合才能满足我们的需求,这些内容的知识称为关联型知识,其查找一般需要通过相关的文献数据库。例如查找某一学科的一般知识“关于分子生物学有哪些专著;查找学科专业领域的新进展:“有关纳米技术的研究综述;以及最常见的查找课题相关的专业文献等。23242022-8-325Outline Introduction to Information Retrieval Web Search(search engine)Scholar search tools Scopus、Google Scholar etc.Large integrating Databases
14、 CNKI、VIP etc.WOK、EBSCO etc.Economic information retrieval ABI、Emerald etc.26Information literacy is a set of abilities requiring individuals to recognize when information is needed and have the ability to locate,evaluate,and use effectively the needed information.-American Library Association Infor
15、mation literacy also is increasingly important in the contemporary environment of rapid technological change and proliferating information resources.Because of the escalating complexity of this environment,individuals are faced with diverse,abundant information choices-in their academic studies,in t
16、he workplace,and in their personal lives.Information Literacy27literacy/Information Literacy Tutorial 28Evaluating Information Found on the InternetThe Sheridan Libraries of the Johns Hopkins University.TILTThe University of Texas System.Winner of the 1998 ACRL/Instruction Section Innovation in Inst
17、ruction Award.RIO:Research Instruction OnlineThe University of Arizona.Winner of the 1999 Innovation in Instruction award from the Association of College and Research Libraries,Instruction Section.TutorialsPenn State University Libraries http:/www.libraries.psu.edu/psul/tutorials.html Online Library
18、 Learning CenterUniversity of Georgia System.The Virtual Librarian Monash University,Melbourne,Australia Information Literacy Tutorial 29Information Literacy Tutorial Minneapolis Community&Technical Collegehttp:/www.mctc.mnscu.edu/Library/tutorials/infolit/index.html http:/tutorial.lib.umn.edu/The U
19、niversity of Minnesota.http:/tutorial.lib.umn.edu/CSU Information Competence Project This site has been constructed to provide a focal point for the Information Competence initiatives within the California State University system.The site is currently maintained by the Kennedy Library at Cal Poly,Sa
20、n Luis Obispo.http:/www.lib.calpoly.edu/infocomp/Mission Critical San Jose State Universitys Critical Thinking Web Page.http:/www.sjsu.edu:80/depts/itl/RDN Virtual Training SuiteILRT at The University of Bristol,UK.http:/www.vts.rdn.ac.uk/InfoTrekkCurtin University of Technology,Australia http:/lisw
21、eb.curtin.edu.au/finding/infotrekk/index.html InfoTrekk PlusCurtin University of Technology,Australia http:/lisweb.curtin.edu.au/finding/infotrekkplus/index.html Information Literacy Tutorial Five Colleges of Ohiohttp:/www.denison.edu/ohio5/infolit/Core:Comprehensive Online Research EducationPurdue
22、University.http:/core.lib.purdue.edu/30312022-8-3322022-8-3332022-8-3342022-8-335Introduction to Information Retrieval Information Information Retrieval Web SearchInformation Retrieval Information What is“information?Retrieval What do we mean by“retrieval?What are different types information needs?W
23、hat is Information?What do you think?There is no“correct definition Cookie Monsters definition:“news or facts about something Different approaches:Philosophy Psychology Linguistics Electrical engineering Physics Computer science Information scienceDictionary says Oxford English Dictionary informatio
24、n:informing,telling;thing told,knowledge,items of knowledge,news knowledge:knowing familiarity gained by experience;persons range of information;a theoretical or practical understanding of;the sum of what is known Random House Dictionary information:knowledge communicated or received concerning a pa
25、rticular fact or circumstance;newsThree Views of Information Information as process Information as communication Information as message transmission and receptionOne View Information=characteristics of the output of a process Tells us something about the process and the input Information-generating
26、process do not occur in isolationIbid.ProcessInputInputInputOutputOutputOutputProcess1Process2InputOutputWheres the human?If a tree falls in the forest,and no one is around to hear it,is information transmitted?In the“information as process:Yes,but thats not very interesting to us Were concerned abo
27、ut information for human consumption Transmission of information from one person to another Recording of information Reconstruction of stored informationAnother View Information science is characterized by“the deliberate(purposeful)structure of the message by the sender in order to affect the image
28、structure of the recipient This implies that the sender has knowledge of the recipients structure Text=“a collection of signs purposefully structured by a sender with the intention of changing image-structure of a recipient Information=“the structure of any text which is capable of changing the imag
29、e-structure of a recipientNicholas J.Belkin and Stephen E.Robertson.(1976)Information Science and the Phenomenon of Information.Journal of the American Society for Information Science,27(4),197-204.Information HierarchyDataInformationKnowledgeWisdomMore refined and abstractInformation Hierarchy Data
30、 The raw material of information Information Data organized and presented in a particular manner Knowledge“Justified true belief Information that can be acted upon Wisdom Distilled and integrated knowledge Demonstrative of high-level“understandingA(Facetious)Example Data F,99.5 F,100.3 F,101 F,Infor
31、mation Hourly body temperature:98.6 F,99.5 F,100.3 F,101 F,Knowledge If you have a temperature above 100 F,you most likely have a fever Wisdom If you dont feel well,go see a doctor“Retrieval?“Fetch something thats been stored Recover a stored state of knowledge Search through stored messages to find
32、 some messages relevant to the task at handSenderRecipientEncodingDecodingstoragemessagemessagenoiseindexing/writingRetrieval/readingWhat is IR?Information retrieval is a problem-oriented discipline,concerned with the problem of the effective and efficient transfer of desired information between hum
33、an generator and human user.Anomalous States of Knowledge as a Basis for Information Retrieval.(1980)Nicholas J.Belkin.Canadian Journal of Information Science,5,133-143.Modern History The“information overload problem is much older than you may think Origins in period immediately after World War II T
34、remendous scientific progress during the war Rapid growth in amount of scientific publications available The“Memex Machine Conceived by Vannevar Bush,President Roosevelts science advisor Outlined in 1945 Atlantic Monthly article titled“As We May Think Foreshadows the development of hypertext(the Web
35、)and information retrieval systemThe Memex MachineBush的Memex是现代个人电脑的雏型,也是首次为协助人类思考和管理资讯而设计的理想机器。1939年在“Mechanization and the Record中,Bush详述Memex的功能,此理念于六年后才撰写成“As We May Think,该文综论Memex具有增强人类控制资讯环境,增加自行控制处理资讯能力,增进人类福祉与支援以及加强人类思想处理能力等四方面影响.当时Memex被Bush视为个人档案和私人图书馆,强调其独特性质,为一类似人脑的机器,其功能远超越当时以开展之数字电脑(d
36、igital computer)。1945年的Memex是为伸展人类体能而设计,并无法加强智慧能力,后世研究者将Memex参加索引及连接等功能,以扩增其为人类提供资讯相关效劳之能力。Types of Information Needs Retrospective“Searching the past Different queries posed against a static collection Time invariant Prospective“Searching the future Static query posed against a dynamic collection T
37、ime dependentRetrospective Searches(I)Ad hoc retrieval:find documents“about thisKnown item searchDirected explorationIdentify positive accomplishments of the Hubble telescope since it was launched in 1991.Compile a list of mammals that are considered to be endangered,identify their habitat and,if po
38、ssible,specify what threatens them.Find Jimmy Lins homepage.Whats the ISBN number of“Modern Information Retrieval?Who makes the best chocolates?What video conferencing systems exist for digital reference desk services?Retrospective Searches(II)Question answeringWho discovered Oxygen?When did Hawaii
39、become a state?Where is Ayers Rock located?What team won the World Series in 1992?“Factoid”What countries export oil?Name U.S.cities that have a“Shubert”theater.“List”Who is Aaron Copland?What is a quasar?“Definition”Prospective“Searches Filtering Make a binary decision about each incoming document
40、Routing Sort incoming documents into different bins?Spam or not spam?Categorize news headlines:World?Nation?Metro?Sports?What about databases?What are examples of databases?Banks storing account information Retailers storing inventories Universities storing student grades What exactly is a(relationa
41、l)database?Think of them as a collection of tables They model some aspect of“the worldA(Simple)Database ExampleStudent TableDepartment TableCourse TableEnrollment TableDatabase Queries What would you want to know from a database?What classes is John Arrow enrolled in?Who has the highest grade in IR2
42、06?Whos in the history department?Of all the non-sysu students taking IR206 with a last name shorter than six characters and were born on a Monday,who has the longest email address?Databases vs.IROther issuesInteraction with systemResults we getQueries were posingWhat were retrievingIRDatabasesIssue
43、s downplayed.Concurrency,recovery,atomicity are all critical.Interaction is important.One-shot queries.Sometimes relevant,often not.Exact.Always correct in a formal sense.Vague,imprecise information needs(often expressed in natural language).Formally(mathematically)defined queries.Unambiguous.Mostly
44、 unstructured.Free text with some metadata.Structured data.Clear semantics based on a formal model.The Big Picture The four components of the information retrieval environment:User Process System CollectionWhat computer geeks care about!What we care about!The Information Retrieval CycleSourceSelecti
45、onSearchQuerySelectionRanked ListExaminationDocumentsDeliveryDocumentsQueryFormulationResourcequery reformulation,vocabulary learning,relevance feedbacksource reselectionSupporting the Search ProcessSourceSelectionSearchQuerySelectionRanked ListExaminationDocumentsDeliveryDocumentsQueryFormulationRe
46、sourceIndexingIndexAcquisitionCollectionSimplification?SourceSelectionSearchQuerySelectionRanked ListExaminationDocumentsDeliveryDocumentsQueryFormulationResourcequery reformulation,vocabulary learning,relevance feedbacksource reselectionIs this itself a vast simplification?The IR Black BoxDocuments
47、QueryHitsInside The IR Black BoxDocumentsQueryHitsRepresentationFunctionRepresentationFunctionQuery RepresentationDocument RepresentationComparisonFunctionIndex2022-8-365 第一章 文献信息源第一节 文献第二节 图书馆第三节 Internet习题第二章 电子书第一节 概述第二节 电子书数据库第三节 网上书店习题2022-8-366 第三章 电子期刊第一节 概述第二节?中国期刊全文数据库?第三节 Science Online第四节
48、 Elsevier ScienceDirect全文数据库-第五节 电子期刊的访问第六节 常见的英文期刊全文数据库一览表习题2022-8-367 第四章 计算机文献检索第一节 计算机文献检索原理及方法第二节 检索步骤第三节 衡量检索效果的两个常用指标第四节 获取原文习题2022-8-368 第五章 文摘数据库第一节 概述第二节 Ei Compendex数据库第三节 引文索引ISI Web of Science数据库第四节 引文索引的评价功能及其衍生品第五节 其他常见的科技类英文文摘数据库一览表2022-8-369 第六章 参考工具书第一节 概述第二节 百科全书及年鉴第三节 手册与名录第四节 事实
49、与数据检索实例2022-8-370 第七章 利用文献资料做研究第一节 概述第二节 选择研究课题第三节 资料收集第四节 资料鉴别第五节 资料阅读第六节 资料分析与综合第七节 研究实例作业?文献检索与利用?课程报告2022-8-371 第八章 论文写作与发表第一节 论文写作第二节 标注参考文献第三节 论文投稿与发表2022-8-372 第九章 资料积累与管理第一节 概述第二节 个人资料管理软件第三节 建立与利用个人资料库第十章 版权法与学术标准第一节 版权常识第二节 以案说法第三节 学术标准2022-8-373著名大学商学院的馆藏资源和学科导航1、University of Pittsburgh
50、Cardiff University:Cooperative Library Instruction ProjectWayne State University 必看视频 下周讨论 精准获取信息的根本功训练 20210321-硕博士如何利用SCI选题与开题 借助SSCIAHCI进展人文社会科学研究选题 科研工作者的信息修炼 罗绍峰 http:/ 15分钟汤森路透:汤森路透视频演讲集(6)诺贝尔奖离我们有多远10分钟20210326 SSCI A&HCI与科研实践:一个旅游学者的个人经历80分钟你的收获?你的问题?你动手了吗?发现什么有趣的事情,欢送分享!算作课堂讨论计分,如果是视频请告诉我们是