1、网络信息资源的检索网络信息资源的检索定义定义u是指通过是指通过网络存储网络存储的数字化图、文、的数字化图、文、声、像等多媒体信息的声、像等多媒体信息的集合集合。u与传统信息资源相比较,其主要特征与传统信息资源相比较,其主要特征是是数字化和网络数字化和网络存取。存取。百度百度QQ网络信息资源的特点网络信息资源的特点u信息量大,传播广泛信息量大,传播广泛u信息层次多,品种多样信息层次多,品种多样u自由发布,交流直接自由发布,交流直接u信息传播速度快,变化频繁信息传播速度快,变化频繁u分散无序,缺乏管理分散无序,缺乏管理u检索方便检索方便u内容质量不一内容质量不一网络信息资源网络信息资源文本文本图像
2、图像图形图形表格表格超文本超文本网络信息检索方法网络信息检索方法u直接如:u网络资源指南u搜索引擎网络信息检索工具网络信息检索工具定义:是指在因特网上提供信息检索服定义:是指在因特网上提供信息检索服务的计算机系统。务的计算机系统。原理:原理:网络资源网络资源搜集资源搜集资源提供资源提供资源搜索引擎搜索引擎u定义:定义:搜索引擎是指根据一定的策略、运用特搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上定的计算机程序从互联网上搜集信息搜集信息,在,在对信息进行对信息进行组织和处理组织和处理后,为用户后,为用户提供检提供检索服务索服务的系统。的系统。搜索引擎搜索引擎u原理原理搜索程序搜索程
3、序 处理程序(索引)处理程序(索引)检索程序检索程序蜘蛛蜘蛛或或机器人机器人搜索引擎分类搜索引擎分类u按按工作方式工作方式划分:划分:全文搜索引擎全文搜索引擎目录索引类搜索引擎目录索引类搜索引擎元搜索引擎元搜索引擎搜索引擎分类搜索引擎分类全文搜索引擎全文搜索引擎通过从互联网上提取的各个网站的信息通过从互联网上提取的各个网站的信息(以网以网页文字为主页文字为主)而建立的数据库中,检索与用户查而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,是名副其实的搜索引擎。将结果返回给用户,是名副其实的搜索引擎。在国外具有代表
4、性的搜索引擎有在国外具有代表性的搜索引擎有Google等,国等,国内著名的有百度等。内著名的有百度等。内容全,更新快,功能强,命中率低,结构不清晰内容全,更新快,功能强,命中率低,结构不清晰搜索引擎分类搜索引擎分类目录索引类搜索引擎目录索引类搜索引擎虽然有搜索功能,但在严格意义上算不上是真虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的查询,仅靠分类目录也可找到需要的信息。信息。在国外代表在国外代表D
5、MOZ-the Open Directory Project等等结构清晰,内容少,更新慢,结构清晰,内容少,更新慢,搜索引擎分类搜索引擎分类元搜索引擎元搜索引擎在接受用户查询请求时,同时在其他多个引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。上进行搜索,并将结果返回给用户。著名的元搜索引擎有著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有等,中文元搜索引擎中具代表性的有360搜索。搜索。搜索引擎分类搜索引擎分类元搜索引擎元搜索引擎搜索引擎搜索引擎一般一般查询规则查询规则u连接符连接符逻辑逻辑“与与”一般用一般用
6、“and”表示,提高查准率表示,提高查准率逻辑逻辑“或或”一般用一般用“or”表示,提高查全率表示,提高查全率逻辑逻辑“非非”一般用一般用“not”表示,缩小范围表示,缩小范围搜索引擎搜索引擎一般一般查询规则查询规则u截词符截词符一般按截断的位置可以分为前方截词,中间截一般按截断的位置可以分为前方截词,中间截词,后方截词。词,后方截词。一般用一般用“?”和和“*”等表示截词符。等表示截词符。前方截词(后方一致):前方截词(后方一致):“?ology”可检出可检出:methodology,biology,radiology中间截词:中间截词:“wom?n”,woman和和women后方截词(前方
7、一致):后方截词(前方一致):“comput?”可检索可检索出出compute、computer、computing等等搜索引擎搜索引擎一般一般查询规则查询规则u空格、逗号、括号和引号空格、逗号、括号和引号空格空格的作用与逻辑的作用与逻辑“与与”和和“and”是相同的是相同的如如 计算机计算机 维护维护逗号逗号相当于逻辑相当于逻辑“或或”和和“or”括号括号用于改变复杂检索式中逻辑运算符的优先顺用于改变复杂检索式中逻辑运算符的优先顺序,在括号中的优先执行。序,在括号中的优先执行。如:多媒体如:多媒体 and (计算机(计算机 or 网络)网络)引号括引号括中其中的多个词被当作一个短语。中其中的
8、多个词被当作一个短语。如:如:“electronic magazine”electronic magazine搜索引擎搜索引擎一般一般查询规则查询规则u限定字段检索限定字段检索限定在标题,正文,网址等。限定在标题,正文,网址等。中国搜索分布情况中国搜索分布情况数据来源:数据来源:http:/ 例如,找云南省风景相关信息,就可以这样查例如,找云南省风景相关信息,就可以这样查询:风景询:风景 intitle:云南云南 注意,注意,intitle:和后面的关键词之间,不要有空格和后面的关键词之间,不要有空格。国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎百度(百度()高级搜索
9、:高级搜索:把搜索范围限定在特定站点中把搜索范围限定在特定站点中site 例如,天空网下载软件不错,就可以这样查询:例如,天空网下载软件不错,就可以这样查询:msn site: 注意,注意,“site:”后面跟的站点域名,不要带后面跟的站点域名,不要带“http:/”;另外,;另外,site:和站点名之间,不要带空格。和站点名之间,不要带空格。国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎百度(百度()高级搜索:高级搜索:把搜索范围限定在把搜索范围限定在url链接中链接中inurl 例如,找关于例如,找关于photoshop的使用技巧,可以这样查询的使用技巧,可以这样查
10、询:photoshop inurl:jiqiao。上面这个查询串中的上面这个查询串中的“photoshop”,是可以出现在网,是可以出现在网页的任何位置,而页的任何位置,而“jiqiao”则必须出现在网页则必须出现在网页url中。中。注意注意,inurl:语法和后面所跟的关键词,不要有空格语法和后面所跟的关键词,不要有空格。国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎百度(百度()高级搜索:高级搜索:精确匹配精确匹配双引号和书名号双引号和书名号如果输入的查询词很长,百度在经过分析后,给出的如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。
11、如果您对这种情搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。上双引号,就可以达到这种效果。例如,搜索例如,搜索 上海科技大学上海科技大学,如果不加双引号,搜索,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,结果被拆分,效果不是很好,但加上双引号后,“上海上海科技大学科技大学”,获得的结果就全是符合要求的了。,获得的结果就全是符合要求的了。国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎百度(百度()高级搜索:高级搜索:精确匹配精确
12、匹配双引号和书名号双引号和书名号 书名号是百度独有的一个特殊查询语法。加上书名书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。索结果中;二是被书名号扩起来的内容,不会被拆分。书名号在某些情况下特别有效果,例如,查名字很书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影通俗和常用的那些电影或者小说。比如,查电影“手机手机”。国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎百度(百度()高级搜索:高级搜
13、索:要求搜索结果中不含特定查询词要求搜索结果中不含特定查询词 例如,搜例如,搜 神雕侠侣神雕侠侣,希望是关于武侠小说方面的,希望是关于武侠小说方面的内容,却发现很多关于电视剧方面的网页。那么就可内容,却发现很多关于电视剧方面的网页。那么就可以这样查询:以这样查询:神雕侠侣神雕侠侣-电视剧电视剧。注意,注意,前一个关键词,和减号之间必须有空格前一个关键词,和减号之间必须有空格,否,否则,减号会被当成连字符处理,而失去减号语法功能则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。减号和后一个关键词之间,有无空格均可。国内外著名搜索引擎国内外著名搜索引擎u主要国内
14、搜索引擎主要国内搜索引擎百度(百度()高级搜索:高级搜索:特定文件搜索(特定文件搜索(filetype)其搜索语法为:查询词其搜索语法为:查询词+空格空格+Filetype:格式,格式可格式,格式可以是以是DOC、PDF、PPT、XLS、RTF、ALL(全部文档)。(全部文档)。例如:例如:市场分析市场分析 filetype:doc,其中的冒号是中英文符,其中的冒号是中英文符号皆可,并且不区分大小写。号皆可,并且不区分大小写。国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎百度(百度()高级搜索:高级搜索:记不住?记不住?http:/ 国内外著名搜索引擎国内外著名搜索引擎
15、u主要国内搜索引擎主要国内搜索引擎百度(百度()更多技巧更多技巧http:/ 国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎Google(http:/ 被公认为被公认为全球最大全球最大的搜索引擎,也是的搜索引擎,也是互联网上互联网上5大最受欢迎的网站之一,在全球范围大最受欢迎的网站之一,在全球范围内拥有无数的用户。内拥有无数的用户。Google允许以多种语言进允许以多种语言进行搜索,在操作界面中提供多达行搜索,在操作界面中提供多达30余种语言选余种语言选择。择。访问不顺畅访问不顺畅 国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎Google 翻译
16、翻译 将文本、网页和文件在将文本、网页和文件在 50 多种语言之间进行多种语言之间进行即时互译。即时互译。学术搜索学术搜索搜索学术论文搜索学术论文国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎360搜索(搜索(http:/ 国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎新浪搜索新浪搜索(http:/ 使用带使用带related:前缀的页面前缀的页面url地址搜索地址搜索某个页面的类似页面。如输入某个页面的类似页面。如输入【related:】,】,可以查看到和网可以查看到和网易新闻频道类似的其他网页。易新闻频道类似的其他网页。国内外著名搜索引擎国内
17、外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎搜狗搜狗(http:/ 职业大百科职业大百科- 职业方面垂直职业方面垂直搜索引擎搜索引擎国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎中搜论坛中搜论坛论坛方面垂直论坛方面垂直搜索引擎搜索引擎国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎http:/电子书搜索引擎,中国最大的电子图书搜索电子书搜索引擎,中国最大的电子图书搜索引擎。引擎。电子书方面垂电子书方面垂直搜索引擎直搜索引擎国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎搜索软件吧,中国首家专业软件搜索引擎。搜索软件吧,中国
18、首家专业软件搜索引擎。软件方面垂直软件方面垂直搜索引擎搜索引擎国内外著名搜索引擎国内外著名搜索引擎u主要国内搜索引擎主要国内搜索引擎淘宝淘宝天猫天猫京东京东苏宁易购苏宁易购中关村在线中关村在线 太平洋电脑网等等太平洋电脑网等等购物垂直搜索购物垂直搜索引擎引擎国内外著名搜索引擎国内外著名搜索引擎u主要国外搜索引擎主要国外搜索引擎Google(http:/ 被公认为全球最大的搜索引擎,也是被公认为全球最大的搜索引擎,也是互联网上互联网上5大最受欢迎的网站之一,在全球范围大最受欢迎的网站之一,在全球范围内拥有无数的用户。内拥有无数的用户。Google允许以多种语言进允许以多种语言进行搜索,在操作界面
19、中提供多达行搜索,在操作界面中提供多达30余种语言选余种语言选择。择。国内外著名搜索引擎国内外著名搜索引擎u主要国外搜索引擎主要国外搜索引擎雅虎雅虎(http:/ Jeeves(http:/ Jeeves的知名度并没有的知名度并没有google和微软和微软搜索引擎搜索引擎bing大。在诞生大。在诞生10周年(周年(2010年)之年)之际,际,Ask Jeeves依据过去依据过去10年时间里网民提出的年时间里网民提出的逾逾10亿条问题,来选出过去亿条问题,来选出过去10年年10大无法回答大无法回答问题。问题。垂直搜索引擎垂直搜索引擎国内外著名搜索引擎国内外著名搜索引擎u主要国外搜索引擎主要国外搜
20、索引擎HotBot(http:/ 是美国一个非常优秀的搜索引擎,它是美国一个非常优秀的搜索引擎,它获得了许多杂志及媒体的奖项。获得了许多杂志及媒体的奖项。HotBot 最大的最大的特点在于它的界面组织和丰富的检索功能。特点在于它的界面组织和丰富的检索功能。该引擎已被该引擎已被Lycos收购收购国内外著名搜索引擎国内外著名搜索引擎u主要国外搜索引擎主要国外搜索引擎Lycos(http:/ 放宽检索范围:学科领域、时间、文章类型放宽检索范围:学科领域、时间、文章类型,关键词出现的字段等,关键词出现的字段等;将描述检索主题的词想全,包括同义词、近将描述检索主题的词想全,包括同义词、近义词、缩写形式;
21、义词、缩写形式;减少用减少用“AND”AND”或或“NOT”NOT”算符联结,增加用算符联结,增加用“OR”OR”联结检索词;联结检索词;采用截词检索法采用截词检索法网络信息资源检索技巧网络信息资源检索技巧u及时调整检索策略及时调整检索策略检索结果过多检索结果过多 严格限定检索范围:学科领域、时间、文章类严格限定检索范围:学科领域、时间、文章类型,关键词出现的字段等;型,关键词出现的字段等;选择与检索主题密切相关的词和专业术语选择与检索主题密切相关的词和专业术语 避免使用过于宽泛的词汇避免使用过于宽泛的词汇;使用词组检索或位置检索使用词组检索或位置检索 在检索结果的基础上进行二次检索在检索结果的基础上进行二次检索 增加用增加用“AND”或或“NOT”算符联算符联网络信息资源检索技巧网络信息资源检索技巧u加快检索速度,节约时间和费用加快检索速度,节约时间和费用建立收藏夹建立收藏夹只用文本方式传输只用文本方式传输使用镜像资源(本地资源)使用镜像资源(本地资源)选择合适时间选择合适时间