1、第四章计算机信息检索的基本技术与方法一、计算机信息检索的基本技术:一、计算机信息检索的基本技术: 布尔逻辑、截词检索、加权检索,位置算符布尔逻辑、截词检索、加权检索,位置算符等等。在进行计算机检索时,有时有一些比较复杂在进行计算机检索时,有时有一些比较复杂的课题,如:的课题,如:“GPSGPS在建筑中的应用在建筑中的应用”,既涉,既涉及及GPSGPS,又涉及建筑,还有又涉及建筑,还有“应用应用”,这时候,这时候就要编制出满足要求的计算机检索式,它是机检就要编制出满足要求的计算机检索式,它是机检的基础。的基础。1 1布尔逻辑检索布尔逻辑检索(Boolean Logic Boolean Logic
2、 RetrievalRetrieval) 逻辑检索的基础是逻辑运算,逻辑运算逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(中最常用的是布尔逻辑运算符(Boolean Boolean Logic OperatorsLogic Operators), ,即与、或、非三种运即与、或、非三种运算符号,算符号,用它们可以表示概念之间的逻辑用它们可以表示概念之间的逻辑关系。关系。检 索 要求逻辑检索 课题 表达式 检 索 结果概念相交、限定 AND与* 计算机用于制图 A BA AND BA * B 缩小检索范围提高查准率 概念平行、并列 OR或+ 土地管理与土地利用 A B A OR B
3、 A+B扩大检索范围提高查全率 某一主题去掉一部分相关主题 NOT非- 除光电测距以外的 A 电磁波测距 BB NOT AB-A提高查准率 2 位置算符位置算符(Proximity Operators) 位置算符是表示检索词之间位置关系的一种运位置算符是表示检索词之间位置关系的一种运算符。由于英文对一句话有多种表达方法,写法可算符。由于英文对一句话有多种表达方法,写法可能不同。如:能不同。如:“GPS在铁路桥研究中的应用在铁路桥研究中的应用”这个这个课题,用英文表达可能是课题,用英文表达可能是“Using of GPS in Railway Bridge”, 也可能是也可能是“Using of
4、 GPS in Bridge of Railway”,因而可能编制出这样的检索因而可能编制出这样的检索式,式,GPS AND (Railway (2N)Bridge)我们可以通过位置检索提高检索的准确率(1) (W)算符与算符与(nW)算符算符 W 是是word与与 with的缩写。的缩写。 特点:特点:W词序不变,中间不可插词,但两词序不变,中间不可插词,但两词间可有一个标点,连字符或空格。词间可有一个标点,连字符或空格。 nW词序不变,中间可插入词序不变,中间可插入N 个词。个词。 如:如:potential (w) energy可能检出可能检出potential energy and f
5、unction 又如:又如:gone (2w)wind 可能检出可能检出gone with the wind (2) (N)与与(nN)算符算符 N是是near的缩写的缩写 特点:特点:N词序不限,中间不可插词,但两词序不限,中间不可插词,但两词间可有一个标点,连字符或空格。词间可有一个标点,连字符或空格。 nN词序不限,中间可插入词序不限,中间可插入N 个词。个词。 如:如:econom? (2N)recovery可能检出可能检出economic recovery,recovery of the economy,(3)同字段检索)同字段检索A(F)B,F是是field的缩写。的缩写。 特点:
6、特点:A、B两词必须出现在同一字段中,两词必须出现在同一字段中,词序与词量不限。词序与词量不限。 如:如:environment (F)impact/DE,表示两个表示两个词必须同时出现在叙词字段内。词必须同时出现在叙词字段内。(4) 同句检索同句检索A(S)B,S是是sentence的缩写的缩写。 特点:特点:A、B出现在同一自然句中(子字段),出现在同一自然句中(子字段),其词序与词量不受限制。其词序与词量不受限制。 如:如:electric (S)plant可检出可检出electric power plants如:如:EI中的中的NEAR;PQDD中的中的W/n (两词间距小两词间距小于
7、于n个单词,且前后位置任意个单词,且前后位置任意),Pre/n (两词间距两词间距小于小于n个单词,且前后位置一定个单词,且前后位置一定)3 3截词算符截词算符( (Truncating operators)Truncating operators) 在英语词汇中,一个词可能有多种在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一索时间和费用,采用截词法可解决这一问题。问题。 所
8、谓截词检索,是指在检索标识中保留相所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用标识的记录全部检索出来。常用“?”、“*”符号表示。符号表示。(1)有限截词)有限截词。即在检索词后后截几个有限。即在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。的字母,如名词的单复数,动词的词尾变化等。如输入如输入computer?表示有表示有0-1个字母变化,可个字母变化,可检出检出computer和和computers. 输入输入s
9、tud?表示截断处有表示截断处有0-3个字母变化,个字母变化,可检出可检出study,studies,studied,studing.(2)无限截断)无限截断:在检索词后加一个:在检索词后加一个“?“,表示该词后可加任意个字符。使用无限截表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多词,所截词根不能太短,否则会输出许多无关文献,造成误检。无关文献,造成误检。 如:如:computer?可检出可检出computers,computering,computered,computerization. (3)中间截断中间截断:在检索词中间加一个或:在检索词中间加一个或几个?号
10、,主要解决一些英美拼写不同,几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化单复数形式的不同的词的输入,可简化输入。输入。 如:输入如:输入wom?n可检出可检出 woman,women各种算符在数据库中的实际应用各种算符在数据库中的实际应用位置算符位置算符1)EI NEAR Bridge NEAR Piling*表示这两个词要彼此接近,前后顺序不限。W/n Pig*W/2pine*表示两个词的距离不能超过n个单词Adj Channel adj tunnel表示含有这两个词,两个词相邻,位置一定2)ISI Proceedings 用同句算符(SAME):如如Channel
11、 same Channel same tunneltunnel,表示表示channel channel 和和tunnel tunnel 出现在同一句子中才出现在同一句子中才符合检索条件。符合检索条件。3)CSA:within X“ 表示两词之间不得多于x个词,前后位置任意 如“women within 8 movement” (顺序不定)4)Elsevier: ADJ表示两词相邻,前后顺序固定,与词检索的结果相同;NEAR或NEAR(N),表示两词相邻,中间可插入少于或等于n个单词,前后顺序可以发生变化,如果不使用(N),系统默认值为10 5)PQDD W/n (两词间距小于两词间距小于n个单
12、词,且前后位置个单词,且前后位置任意任意),Pre/n (两词间距小于两词间距小于n个单词,且前个单词,且前后位置一定后位置一定)6)ProQuest W/n(表示连接两个词之间可以表示连接两个词之间可以插入插入n个词个词 ,前后位置可颠倒),前后位置可颠倒) 如:如:Education w/5 intenet 表示表示education和和internet之间可以插入之间可以插入5个词个词 ,并且前后位置可以颠倒。,并且前后位置可以颠倒。Pre/n(表示前后两词之间最多插入表示前后两词之间最多插入n个词,前后位置一定个词,前后位置一定 ) 如:如:U.S pre/n economic pol
13、icy可可检出检出U.S aideconomic policy,or U.S wartime economic policy 。截词符或通配符如:如:CSAISI ProceedingsISI ProceedingsProQuestProQuestCACA用用通配符通配符“?”和截词符和截词符“* * ” ” 输入输入 “ “patentpatent* *”,可以检索到可以检索到 patentpatent、patents、 patentedpatented等,(无限截断)等,(无限截断) 输入输入 womwom?n?n,可以检索到可以检索到womanwoman和和womenwomen。 输入输
14、入“fib?”fib?”,可检索到可检索到fiberfiber和和 fibrefibre。(。(有限有限截断)截断) EIEI用用“* * ” ” 和和“$”(“$”(词根算符词根算符) ) 如:OpticOptic* *检索结果中包括以检索结果中包括以optic optic 开头后面加开头后面加任意任意多个字母的词例如多个字母的词例如optic, optics,optical optic, optics,optical 等等 $ $managermanager(强调语义)检索出与该词根具强调语义)检索出与该词根具有同样语意的词如有同样语意的词如 $ $manage manage 将检出将检出
15、managers, managerialmanagers, managerial 和和management management 等词等词 通配符不能用在检索词的最前面通配符不能用在检索词的最前面4 4括号检索(括号检索(ParenthesesParentheses)用于改变运算的先后次序,括号内的内容做优用于改变运算的先后次序,括号内的内容做优先运算。先运算。用用“()”可以表示优先级。如比较可以表示优先级。如比较 (GPSORGIS)ANDChina GPSORGIS ANDChinaEI 中的表示方法:中的表示方法:Relevance AND( Aalbersberg within AU
16、)OR (cool within AU)5 5、字段限制检索字段限制检索 组成数据库的最小单位是记录,一条完整记录中的组成数据库的最小单位是记录,一条完整记录中的每一个著录事项为字段。献书目型数据库的记录基本每一个著录事项为字段。献书目型数据库的记录基本包括下列字段:包括下列字段:(1) 存取号字段(存取号字段(AN, Access NumberAN, Access Number)这是计算这是计算机检索系统为每个数据库的每篇记录规定的能被计算机检索系统为每个数据库的每篇记录规定的能被计算机识别的特定号码。在同一数据库中,每篇文献记录机识别的特定号码。在同一数据库中,每篇文献记录只有一个存取号;
17、只有一个存取号;(2) 篇(题)名字段(篇(题)名字段(Title Field, /TITitle Field, /TI)(3) 文摘字段(文摘字段(Abstract Field, /AB)Abstract Field, /AB)(4) 叙词字段或受控词字段(叙词字段或受控词字段(DestriptorDestriptor Field, Field, /DE; /DE; 或或 Controlled term Field-SU) Controlled term Field-SU) 这一字段是标这一字段是标引人员给文献标引的反映其主题概念的词,这些引人员给文献标引的反映其主题概念的词,这些词来自规范
18、化的词表。也称主题词。词来自规范化的词表。也称主题词。 (5)自由词字段或非受控词字段(自由词字段或非受控词字段(Identified Field, /ID; Keyword Field , /KY ;Uncontrolled term Field) 这一字段也是标引人员给文献标引这一字段也是标引人员给文献标引反映其主题概念的词,但这些词不是规范化词表反映其主题概念的词,但这些词不是规范化词表中的词。中的词。(6) 著者机构子段(著者机构子段(corporate source,CS或或AF)(7) 刊名字段(刊名字段(journal,JN或或ST)(8) 出版年子段(出版年子段(publica
19、tion,year,PY)(9) 文献类型子段(文献类型子段(ducument type,DT或或TY)(10) 语种子段(语种子段(language,LA)(11) 分类号子段(分类号子段(classification,CC)注意事项注意事项:作者检索的缩写形式作者检索的缩写形式:在在SCI中中, 姓姓 (全称)空格(全称)空格 名(首字母名(首字母并且连写)如:并且连写)如:LI DR;GONG JY在在EI中中, 姓姓 名,全称名,全称(中文中文); 姓(全称)姓(全称)名(缩写)名(缩写)机构检索中机构检索中 SCI中有多个作者单位中有多个作者单位, 在同一字段中在同一字段中 EI 只
20、收入第一作者的单位只收入第一作者的单位多字段检索时要选所有字段多字段检索时要选所有字段(all field) 基本索引子段和辅助索引子段基本索引子段和辅助索引子段一篇记录中主要用来表达文献内容的一篇记录中主要用来表达文献内容的子段称为基本索引子段(子段称为基本索引子段(basic index fields),如篇名子段、文摘子如篇名子段、文摘子段、叙词子段、自由词子段。段、叙词子段、自由词子段。 表达文献外部特征的子段称表达文献外部特征的子段称为辅助索引子段(为辅助索引子段(additional index fields),包括著者子段、著包括著者子段、著者机构子段、文献类型子段、语者机构子段
21、、文献类型子段、语种子段等。种子段等。6短语检索(短语检索(phrase search)即精确检索即精确检索短语用短语用“”“”表示,检索出与表示,检索出与“”“”内形式完全内形式完全相同的的短语,以提高检索的精确度和准确相同的的短语,以提高检索的精确度和准确度度7自然语言检索(自然语言检索(natural language search)直接采用自然语言中的字、词、句进行提问直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样。这种基于自然语式检索,同一般口语一样。这种基于自然语言的检索方式又被称为言的检索方式又被称为“智能检索智能检索”,适合,适合不太熟悉网络信息技术的人员使用。支
22、持自不太熟悉网络信息技术的人员使用。支持自然语言检索的有中文的悠游,英文的然语言检索的有中文的悠游,英文的AltaVista, Excite,Infoseek,HotBot,AskJeeves等等8多种语言检索多种语言检索multilingual search)提供多种语言的检索环境供用户选择,提供多种语言的检索环境供用户选择,系统按用户选定的语种进行检索并反系统按用户选定的语种进行检索并反馈结果,支持多语种检索的馈结果,支持多语种检索的 如:中文如:中文天网,英文天网,英文AltaVista,Google等。等。9模糊检索(模糊检索(fuzzy search)又称概念检索。当我们输入一个检索
23、词时,搜称概念检索。当我们输入一个检索词时,搜索引擎不仅反馈包括了该关键词的网址,同时索引擎不仅反馈包括了该关键词的网址,同时也发来与关键词意义相近的内容。比如:我们也发来与关键词意义相近的内容。比如:我们查找查找“查询查询”一词时,模糊检索会反馈来包含一词时,模糊检索会反馈来包含了了“查询查询”、“查找查找”“”“查一查查一查”、“寻找寻找”、“搜索搜索”等内容的网址。反馈网址的排列,一等内容的网址。反馈网址的排列,一般是完全符合关键词的在最前边,其次是相近般是完全符合关键词的在最前边,其次是相近的。现在大多数搜索引擎都有这种功能,只是的。现在大多数搜索引擎都有这种功能,只是模糊的程度不同。
24、模糊的程度不同。10 字母大小写检索字母大小写检索如果用户的检索式用小写字母表示,搜索工具如果用户的检索式用小写字母表示,搜索工具既匹配大写又匹配小写,如:既匹配大写又匹配小写,如:china(瓷器),瓷器),china(中国);如果用大写字母表示,搜索工中国);如果用大写字母表示,搜索工具认为用户指定了只要大写,就只会查找那些具认为用户指定了只要大写,就只会查找那些与用户键入的输入形式完全相同的结果,如:与用户键入的输入形式完全相同的结果,如:china,只检索出只检索出china。Alta Vista等搜索引擎等搜索引擎支持区分大小写的检索支持区分大小写的检索 注意注意自然语言检索、模糊检
25、索、多种自然语言检索、模糊检索、多种语言检索和区分大小写的检索是语言检索和区分大小写的检索是网络检索所特有的网络检索所特有的在在实际检索中,往往将多种检索技术混合使实际检索中,往往将多种检索技术混合使用。如:查找标题中含有用。如:查找标题中含有“网络营销网络营销”的的资料,它的计算机检索提问式(表达式)资料,它的计算机检索提问式(表达式)可以是:可以是:TI(Web OR WWW) AND market*又如:又如:ISTP中的综合表示方法中的综合表示方法TS=(nanotub* SAME carbon) NOT AU=Smalley RE二、数据库的检索方法二、数据库的检索方法 检索界面浏览
26、方式( Browse )检索方式 ( Search ) 浏览方式浏览方式 ( Browse ) 一般包括作者、作者单位、出版物名称一般包括作者、作者单位、出版物名称及出版社索引或者按学科划分的分类索引及出版社索引或者按学科划分的分类索引 如:如:EI Elsevier CSA PROQUEST IEEEIEE 重庆维普以及中国期刊网等等都重庆维普以及中国期刊网等等都提供了各种不同的浏览方式提供了各种不同的浏览方式检索方式检索方式 ( Search ) 基本检索基本检索 (basicquicksimpleeasy) 属于一般性的检索,它是根据自己的检索需属于一般性的检索,它是根据自己的检索需要,
27、输入字、词或简单的检索式(不能使用要,输入字、词或简单的检索式(不能使用位置检索)来完成检索的,是一种初级性的位置检索)来完成检索的,是一种初级性的检索方式。检索方式。 高级检索高级检索 (advanceexpendfullexpert) 属于专家性的检索,可以根据自己属于专家性的检索,可以根据自己的检索需要,构件比较复杂的检索式的检索需要,构件比较复杂的检索式(可以使用逻辑、括号、截词以及位(可以使用逻辑、括号、截词以及位置算符)来完成高层次、高质量的检置算符)来完成高层次、高质量的检索,检索结果快速、准确。索,检索结果快速、准确。高级检索菜单式检索和命令式检索菜单命令三、三、 检索效果的评
28、价检索效果的评价v查全率与查准率是检索质量的两个重要的评查全率与查准率是检索质量的两个重要的评价指标。价指标。v查全率查全率(recall ratio)=检出的相关文献量检出的相关文献量/检索检索系统中相关文献总量系统中相关文献总量即检出文献中合乎需要的文献数量占数据库即检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。查中存在的合乎该需要的所有文献的比例。查全率高说明有用的东西都被你检中了,但对全率高说明有用的东西都被你检中了,但对于数量巨大的数据库而言,要达到于数量巨大的数据库而言,要达到100%的查的查全率是不可能的,在网络条件下尤其如此。全率是不可能的,在网络条件
29、下尤其如此。v查准率查准率(precision ratio)=检出的相关文献量检出的相关文献量/检出的检出的文献总量。指检出文献中合乎需要的文献数量占检文献总量。指检出文献中合乎需要的文献数量占检出文献全部数量的比例。出文献全部数量的比例。 准确率高说明你检出的东西都是有用的东西。一般准确率高说明你检出的东西都是有用的东西。一般地说,很少能达到地说,很少能达到100%的查准率。的查准率。v在查全与查准两个方面一般难以两全,为了获得很在查全与查准两个方面一般难以两全,为了获得很多有用的东西(达到高的查全率),需要较少的限多有用的东西(达到高的查全率),需要较少的限制检索条件,但这样检出的无用的东
30、西就会很多制检索条件,但这样检出的无用的东西就会很多(查准率不高),反之亦然。(查准率不高),反之亦然。 四、四、 检索策略的实施技巧检索策略的实施技巧 检索策略:为实现检索目标而实施的方法。检索策略:为实现检索目标而实施的方法。 检索策略制定的原则检索策略制定的原则: 第一第一 快,即从检索请求的提出到检索结果的提快,即从检索请求的提出到检索结果的提交要快速:交要快速: 第二第二 准,即检索结果要准确,避免检索出过多准,即检索结果要准确,避免检索出过多无关内容;无关内容; 第三第三 全,检索结果全面,满足用户的需求;全,检索结果全面,满足用户的需求; 第四第四 效益原则,即以最低的费用获取所
31、效益原则,即以最低的费用获取所佳佳的信的信息。息。 归纳起来包括:归纳起来包括: (1)认真进行课题分析,确定正确的主题词及学科认真进行课题分析,确定正确的主题词及学科分类情况分类情况(分析主题内容、学科范畴、查找时间与分析主题内容、学科范畴、查找时间与方法以及分析现有的资料等)方法以及分析现有的资料等) (2)正确选择各种算符,如逻辑算符,位置算符,正确选择各种算符,如逻辑算符,位置算符,截词符。截词符。(3)编制合理的计算机检索式。编制合理的计算机检索式。 (4)随时调整检索策略,减少漏检和误检,提高查随时调整检索策略,减少漏检和误检,提高查全率和查准率。全率和查准率。v首先,扩大命中文献
32、数量以提高查全率:选首先,扩大命中文献数量以提高查全率:选用文摘字段检索;使用上用文摘字段检索;使用上位位词或近义词、同词或近义词、同义词用逻辑或义词用逻辑或(OR)连接;利用截词检索。连接;利用截词检索。v其次,缩小检索范围以提高查准率。检索词其次,缩小检索范围以提高查准率。检索词限定在篇名和叙词字段;限定在篇名和叙词字段;使用下位词,使用下位词,利用利用逻辑非去掉无关信息;利用逻辑逻辑非去掉无关信息;利用逻辑积积限定相关限定相关主题。主题。五、五、 计算机信息检索的具体步骤计算机信息检索的具体步骤 1 分析检索课题分析检索课题,制定切实可行的检索策略,制定切实可行的检索策略 ( (这是检索
33、的出发点,依据这是检索的出发点,依据) )2 2 利用检索系统特定的指令正确实施检索利用检索系统特定的指令正确实施检索3 3 通过人通过人- -机对话的方式不断调整、修改、机对话的方式不断调整、修改、检索策略检索策略4 4 根据查找的文献线索获取原始文献根据查找的文献线索获取原始文献(1)分析检索课题,明确检索要求)分析检索课题,明确检索要求 分析检索课题的中心内容和所属学科分析检索课题的中心内容和所属学科范围,以便准确选择反映文献内容特征的范围,以便准确选择反映文献内容特征的主题词、关键词,确定出所属学科的学科主题词、关键词,确定出所属学科的学科性质性质 明确检索需求,即弄清检索目的及要解明
34、确检索需求,即弄清检索目的及要解决的问题。用户的检索目的和要求是多种多决的问题。用户的检索目的和要求是多种多样的,是撰写学位论文,还是申报科研课题,样的,是撰写学位论文,还是申报科研课题,是技术革新还是成果鉴定,目的不同,检索是技术革新还是成果鉴定,目的不同,检索的策略和范围也不同。检索需求主要反映在的策略和范围也不同。检索需求主要反映在用户对命中文献的类型、语种及所需文献的用户对命中文献的类型、语种及所需文献的年代等不同年代等不同(2 2)确定检索项与检索途径确定检索项与检索途径 检索项主要指文献记录中的文献特征标检索项主要指文献记录中的文献特征标识。反映文献内容特征的检索词如:标题识。反映
35、文献内容特征的检索词如:标题词、叙词、和关键词;反映文献外表特征词、叙词、和关键词;反映文献外表特征的如:作者、语种、文献类型等。的如:作者、语种、文献类型等。 检索途径指主题检索、分类检索、作者检索途径指主题检索、分类检索、作者检索途径(作者单位)和其他检索途径。检索途径(作者单位)和其他检索途径。(3 3)编制计算机检索式编制计算机检索式(举例)(举例)第一部分第一部分 课题分析课题分析课题课题GIS技术的可视化研究技术的可视化研究v课题分析:课题分析: 二十一世纪是一个信息大爆炸的时代,随二十一世纪是一个信息大爆炸的时代,随着着“信息论信息论”,“控制论控制论”及及“认知论认知论”等理论
36、等理论的产生,作为一门古老的学科的地图学也在这些的产生,作为一门古老的学科的地图学也在这些新兴理论的指导下,在这个信息时代产生了新的新兴理论的指导下,在这个信息时代产生了新的发展点,发展点,“数字地球数字地球”的提出为地图科学提出了的提出为地图科学提出了更新更高的要求,更新更高的要求,GIS作为处理地理信息的一种作为处理地理信息的一种技术,应运而生。技术,应运而生。 GIS是一种采集,加工,分析,访问是一种采集,加工,分析,访问及表达空间数据的信息系统。作为数据本及表达空间数据的信息系统。作为数据本身是抽象的,不易直观接受的信息,因此身是抽象的,不易直观接受的信息,因此研究如何对数据进行加工和
37、研究如何对数据进行加工和可视化可视化表达,表达,对于用户来说是十分必要的。对于用户来说是十分必要的。目前的目前的GIS可视化的研究正方兴未艾,对可视化的研究正方兴未艾,对DEM,DTM和和DLG等数据模型特别是等数据模型特别是DEM的研究进展的研究进展飞速,而飞速,而三维三维可视化的表达方式又成为其中最可视化的表达方式又成为其中最热门的方向,通过热门的方向,通过DEM生成的等高线,地貌晕生成的等高线,地貌晕渲土,三维透视景象,三维地形漫游及交互式渲土,三维透视景象,三维地形漫游及交互式三维可视系统在地图学界开始发挥其强大的效三维可视系统在地图学界开始发挥其强大的效用,并将在用,并将在GIS技术
38、中占有三分天。技术中占有三分天。 数字高程模型数字高程模型(DEM)作为数字地形模作为数字地形模拟的重要成果已经成为国家空间数据基础拟的重要成果已经成为国家空间数据基础设施设施(NSDI)的基本内容之一,其相关学科的基本内容之一,其相关学科有数据库,软件工程,遥感与航测等。在有数据库,软件工程,遥感与航测等。在不久的将来,随着不久的将来,随着虚拟现实虚拟现实技术与技术与GIS的的融合,必然为地理信息学科带来翻天覆地融合,必然为地理信息学科带来翻天覆地的变化。的变化。检索关键词与表达式中文主题词:地理信息系统或GIS(上位)数字高程模型,可视化,三维,虚拟现实(下位)基本表达式:关键词=(地理信
39、息系统OR GIS)AND (可视化)AND (三维 OR 虚拟现实)英文Topic Words:GIS or Geography Information System3D,DEM,VR,visualizationBoolean Expression:kw= GIS AND visualization AND (3D OR DEM)(4 4)选择检索系统和数据库选择检索系统和数据库 在分析检索课题,明确检索要求在分析检索课题,明确检索要求的基础上,必须综合考虑检索系统的基础上,必须综合考虑检索系统的特点、收录的学科范围、各数据的特点、收录的学科范围、各数据库的专业范围、主题内容、数据来库的专业
40、范围、主题内容、数据来源与文献类型、技术含量、数据的源与文献类型、技术含量、数据的存贮年限、更新频率、检索费用以存贮年限、更新频率、检索费用以及使用方法。及使用方法。(5 5)选择检索方法(常用法、追溯法和循环选择检索方法(常用法、追溯法和循环法)法) 常用法:顺查、倒查和抽查常用法:顺查、倒查和抽查 追溯法:参考文献法和追溯法:参考文献法和科学引文法科学引文法被引用作者查被引用作者查 如:如:ARIKAWA KARIKAWA K 80 NATURE 268 700 80 NATURE 268 700 KATAGIRI N J ELEC MICR 39 363 90 KATAGIRI N J
41、ELEC MICR 39 363 90 87 J COMP PHYSL A 161 1161 87 J COMP PHYSL A 161 1161 STOWE S CELL TIS RE 262 483 90 STOWE S CELL TIS RE 262 483 90 87 NATURWISSENSCHAFTEN 74 297 87 NATURWISSENSCHAFTEN 74 297 SHIMOHIG M CELL TIS RE 263 46 91 SHIMOHIG M CELL TIS RE 263 46 91 循环法:常用法和追溯法的结合循环法:常用法和追溯法的结合 计算机检索逻辑表达
42、式举例计算机检索逻辑表达式举例:例例1:GPS在建筑事业中的应用在建筑事业中的应用 主题词主题词:A:全球定位系统;全球定位系统;B:建筑测量;组配词:建筑测量;组配词: C:应用应用 表达式表达式:A AND B AND C例例2:加拿大遥感活动展望:加拿大遥感活动展望 主题词主题词:A:遥感;遥感;B:测绘科技活动;组配词:测绘科技活动;组配词:C:加拿大;加拿大;D:展望展望 表达式:表达式:(A OR B)AND C AND D例例3:Peter教授在测量平差理论方面的研究教授在测量平差理论方面的研究 主题词主题词:A:测量平差;组配词:测量平差;组配词:B:理论;理论;C:研究;研究
43、;D:Peter表达式表达式:A AND B AND C AND D 例例4:Batson关于土地规划与地籍测量方面的论述关于土地规划与地籍测量方面的论述 主题词主题词:A:土地规划;土地规划;B:地籍测量;组配词:地籍测量;组配词:C:评论;评论;D:Batson; 表达式表达式:(A OR B)AND C AND D 例例5:专题测图用于土地利用制图和植被:专题测图用于土地利用制图和植被制图制图主题词主题词:A:专题测量仪;专题测量仪;B:土地利用土地利用制图;制图;C:植被制图植被制图; D:测绘仪器;测绘仪器;E:地图制图;地图制图;F:专题制图专题制图表达式表达式:(A OR D )
44、AND (B OR C OR E OR F )例例6:新型的自动化数字制图软件的开发与利:新型的自动化数字制图软件的开发与利用用主题词主题词:A:机助制图系统;机助制图系统;B:系统软件;系统软件; C:软件技术;软件技术;D:自动化测图自动化测图组配词组配词:E:开发;开发;F:应用应用表达式表达式:(A OR D)AND (B OR C )AND (E OR F )例例7:利用人造卫星数据及地理信息分析森林:利用人造卫星数据及地理信息分析森林 用途用途主题词主题词:A;卫星影象;卫星影象;B;卫星遥感;卫星遥感;C;地理信地理信息系统;息系统;D:森林遥感森林遥感;E;森林判读;森林判读;
45、F;森林调森林调查;查;G;森林监测;森林监测;H;数据处理数据处理表达式表达式:(A OR B)AND C AND(D OR E OR F OR G)AND H注意注意 在检索过程中,由于可以随时修改在检索过程中,由于可以随时修改检索策略,因此一方面要以制定的检索检索策略,因此一方面要以制定的检索式为基础,要服从检索式,但不要过多式为基础,要服从检索式,但不要过多地受构造检索式的限制,要把条件适当地受构造检索式的限制,要把条件适当放宽一些,逐步缩小检索范围,多次试放宽一些,逐步缩小检索范围,多次试验,以找到最佳检索式验,以找到最佳检索式 4 4 根据查找的文献线索获取原始文献根据查找的文献线
46、索获取原始文献 如果是题录文摘型的数据库,可以通过文如果是题录文摘型的数据库,可以通过文献出处进一步索取原文献出处进一步索取原文 1)查找馆藏的纸本刊物)查找馆藏的纸本刊物 2)如无馆藏可通过原文传递方式获取原文)如无馆藏可通过原文传递方式获取原文 (下一章节会做详细介绍)(下一章节会做详细介绍)结束思考题思考题v请举出三种以上常用中请举出三种以上常用中(外外)文数据库的检索文数据库的检索字段字段v说说题名字段、关键词字段和主题詞字段的说说题名字段、关键词字段和主题詞字段的区别。区别。v请列举出数据库检索中常用的算符(三个以请列举出数据库检索中常用的算符(三个以上)上)v完成课堂练习的第二部分(构建计算机检索完成课堂练习的第二部分(构建计算机检索表达式表达式