搜索引擎优化第2章搜索引擎的工作原理课件.pptx

上传人(卖家):三亚风情 文档编号:3325182 上传时间:2022-08-20 格式:PPTX 页数:53 大小:2.43MB
下载 相关 举报
搜索引擎优化第2章搜索引擎的工作原理课件.pptx_第1页
第1页 / 共53页
搜索引擎优化第2章搜索引擎的工作原理课件.pptx_第2页
第2页 / 共53页
搜索引擎优化第2章搜索引擎的工作原理课件.pptx_第3页
第3页 / 共53页
搜索引擎优化第2章搜索引擎的工作原理课件.pptx_第4页
第4页 / 共53页
搜索引擎优化第2章搜索引擎的工作原理课件.pptx_第5页
第5页 / 共53页
点击查看更多>>
资源描述

1、SEARCH ENGINE OPTIMIZATION PPT搜索引擎优化目 录2.1 收录2.2 分析2.3 排序2.4 查询本章目标 熟悉搜索引擎的基本原理熟悉搜索引擎的基本原理搜索引擎有专门的数据收录程序用来搜集、保存、更新互联网上的信息。如果把互联网比作蜘蛛网,这个程序就像蜘蛛一样在网络间遍历爬行(见图2-1),通常称为蜘蛛程序(Spider)。图2-1蜘蛛爬行简图蜘蛛网由众多两个节点间的蛛丝组成,蜘蛛从一个位置开始顺着蛛丝爬行可以到达蛛网的任何一个位置。类似地,互联网上的信息由众多页面组成,蜘蛛程序从一个网址链接开始,通过页面上的超级链接可以发现新的页面。如此不断重复,以抓取互联网上更

2、多的有价值页面。蜘蛛程序抓取回这些页面后,系统会对页面进行解析、存储,等待下一步处理。此外,互联网上的页面处于不断地增加、更新内容、删除等动态变化中,蜘蛛程序要顺应这种变化,不断地重新爬行抓取,保持页面更新。搜索引擎收录页面的大体流程如图2-2所示。图2-2搜索引擎收录页面大体流程链接地址是蜘蛛程序抓取页面的入口,总链接库是搜索引擎储存链接地址的数据库,也是搜索引擎判断某页面是否抓取过的重要依据。页面解析是搜索引擎系统对蜘蛛程序抓回页面的初步判断与处理,有价值的新链接进入总链接库,有价值的页面进入总页面库,无价值的页面直接舍弃。总页面库是储存蜘蛛程序抓回有价值页面的数据库,等待系统对页面进行分

3、析。实际上,搜索引擎页面收录系统的组成和运行比上面的流程要复杂得多,而且互联网上页面的复杂性难以想象。像如何选取有价值的链接,如何判断页面的质量、不在垃圾页面上耗费时间,如何更及时抓取那些价值高的页面等等。为了提高搜索引擎工作的效率和效果,搜索引擎收录系统抓取页面应该遵循一定的策略。图2-2搜索引擎收录页面大体流程2.1.22.1.2抓取页面的策略抓取页面的策略下面主要从六个方面分别介绍搜索引擎抓取页面应该遵循的策略。1友好性2页面代码3ABC4避免重复抓取5提供多种收录方式6反作弊对网站而言,蜘蛛程序访问网站抓取页面时会占用一定的带宽资源,可能会影响到用户正常访问网站。因此蜘蛛程序要确保对网

4、站的友好性,既能更多地抓取有价值的信息,又不影响用户使用网站的体验。如根据网站的实际情况,制定合适的抓取频率,合理制定蜘蛛光顾的时间等。网站管理者制作网站页面需要遵循一套通用的代码规则。比如404代码的页面,表示失效不存在了,403代码的页面表示目前禁止访问等。蜘蛛程序抓取页面时,要针对不同的返回码提示,制定不同的抓取策略。如对于404代码的页面,第一次抓取后,就没必要再重复抓取了。1友好性友好性2页面代码页面代码针对不同的网站和相同网站的不同页面,蜘蛛程序要注意识别重要和次要的页面,将更多的资源用在那些具有重要的、有价值的、更新频率高等特点的网站和页面上。搜索引擎要制定多个指标综合判断,形成

5、合理的判定页面ABC类型的方法,并做到动态调整。蜘蛛程序在抓取页面时需要判断出是否已经抓取过,只有没有抓取过的页面才放入总页面数据库中,重复抓取相同的页面没有实际意义。因此蜘蛛程序需要快速判断页面地址(URL)是否已经存在于总链接的数据库中,或者该新URL指向的页面实际已经收录,只不过新URL包含了很多无效的参数。3ABC4避免重复抓取避免重复抓取受网络环境、网站建设等因素影响,蜘蛛程序并不能抓取到互联网上的所有信息,或者有些信息需要等待更长的时间才有可能被蜘蛛发现。因此,网站管理人员需要通过其他方式使搜索引擎尽快收录自己的网站。目前,搜索引擎主要采用开放平台,接受用户数据提交的方式,弥补蜘蛛

6、程序的不足。互联网上的信息鱼龙混杂,很多非法的、低质量的页面充斥其中,蜘蛛程序抓取这些页面浪费了资源,还容易引起用户的反感。因此,搜索引擎需要针对垃圾页面,描述出主要特征,将这些数据系统化,形成反作弊系统,使蜘蛛程序能够智能地避开这些页面。当然,搜索引擎抓取页面的策略不止这六个方面,但它们具有一定的代表性。进一步地,为了更直观理解蜘蛛程序抓取页面的工作,我们通过搜索引擎抓取内容模拟器来模拟蜘蛛程序的抓取。5提供多种收录方式提供多种收录方式 6反作弊反作弊 2.1.32.1.3模拟抓取页面模拟抓取页面互联网上提供了多个模拟搜索引擎抓取内容的模拟器,在此我们选取了某款模拟器用来抓取360搜索主页(

7、)的信息,抓取结果如图2-3所示。2.1.32.1.3模拟抓取页面模拟抓取页面 由图2-3的抓取结果可知:蜘蛛程序抓取的页面信息与用户浏览页面时看到的信息存在较大差别。页面上显示的一些内容或链接可能并不能被蜘蛛程序识别,像显示为图像的内容、基于Flash的内容等。蜘蛛程序抓取的内容是它能够读懂识别的信息。同样蜘蛛程序识别的信息,可能用户看不到,像蜘蛛抓取的超链接对用户不可见。可见,网站要展示的内容并不是简单的对用户可见或者蜘蛛程序能读懂那么简单。蜘蛛程序抓取的页面信息只是抓取回来,还没有实际的应用价值,必须经过分析才能提供搜索服务。2.2.12.2.1分析和处理页面的原理分析和处理页面的原理

8、搜索引擎分析和处理页面大体需要经过以下几个过程:建立页面索引,提取正文信息,切词、建立关键字索引,重组关键字、建立关键字与页面间的对应关系。1建立页面索引2提取正文信息3切词、建立关键字索引4关键字重组用户使用搜索引擎查询信息通常需要输入词或短语,搜索引擎必须把抓回的页面进行分析和处理,才能满足用户的查询需求。2.2.12.2.1分析和处理页面的原理分析和处理页面的原理搜索引擎需要对抓回的有价值页面建立索引,以便能够快速定位到某页面。用户通过URL进入页面,而页面对应的URL是唯一的,因此通过对URL建立索引,建立URL与页面间的对应关系,就能实现快速定位。搜索引擎抓回的页面并不是所有页面上的

9、信息都有用,一个页面的核心信息就是正文内容。搜索引擎的特定程序需要提取出正文信息,过滤掉页面中的各种标签信息,例如HTML标签、PHP标签等。1建立页面索引建立页面索引2提取正文信息提取正文信息2.2.12.2.1分析和处理页面的原理分析和处理页面的原理切词是指搜索引擎对页面的正文内容按词进行切分,形成与用户查询习惯相匹配的关键字列表。搜索引擎对关键字建立索引,就可以实现某个关键字快速定位到某个页面。搜索引擎切词的准确率、效果、与用户搜索习惯的匹配程度与各搜索引擎的算法有关,是否具备良好的切词能力可以直接影响到用户的搜索体验。另外,页面中关键字出现的位置、次数、字体、是否加粗等都会影响页面在搜

10、索结果中的展现。3切词、建立关键字索引切词、建立关键字索引关键字重组就是搜索引擎把收录的所有页面中的关键字组成一个不重复的数据集合。该集合中的每一个关键字都是唯一的,建立索引后形成与页面一对多的关系。当用户搜索某个关键字时,搜索引擎就会展现包含该关键字的多个结果页面。4关键字重组关键字重组2.2.22.2.2关键字匹配的原理关键字匹配的原理百度官方通过一个实例简单给出了用户使用关键字搜索页面,搜索引擎的关键字匹配的原理。在此,我们引用该实例来说明关键字匹配的原理。以用户搜索关键字“10号线地铁故障”为例,搜索引擎可能对该关键字短语做如下分词:10、号、线、地铁、故障。假设分词后的每一个词分别对

11、应一个编码,如下所示:10 0 x123abc号 0 x13445d线 0 x234d地铁 0 x145cf故障 0 x354df以分词结果中的10为例,它可能出现在搜索引擎数据库中的多个页面中,但10对应的编码0 x123abc不会变。如果数据库中的每个页面对应一个阿拉伯数字的编号,那么关键字的每一个编码会对应若干个阿拉伯数字编号的页面。假设对应关系如下:0 x123abc 1 2 3 4 7 9.0 x13445d 2 5 8 9 10 112.3.22.3.2排序的原则排序的原则 用户使用搜索引擎查询信息,输入关键字后可以快速得到结果(通常以毫秒计),反应慢了,会影响到用户体验。为了实现

12、搜索的高效率,通常搜索引擎除了采用较好的服务器,还对页面进行提前排序,也就是将排序工作前置。用户没有搜索前,搜索引擎就已经根据某些关键字,将页面按照一定的算法规则做好了排序并存储,用户输入某些关键字时,搜索引擎立即提取已经排好的结果提供给用户。为了提高搜索引擎工作的效率和效果,搜索引擎系统将页面排序应该遵循一定的原则。搜索引擎快速提供给用户的搜索结果是经过预排序处理的,排序靠前的页面更容易被用户点击,排序太靠后被用户发现的可能性很小,如用户一般很少点击搜索引擎结果页中第100页的内容。2.3.22.3.2排序的原则排序的原则1权威性2专业性3相关性4新鲜性5有用性6友好性7特殊性2.3.22.

13、3.2排序的原则排序的原则 那些公认的权威性高的网站,提供的内容具有更高的权威性,能够给用户更大的价值,在排序算法中应该将这一原则占有一定的计算比例。如中国高等教育学生信息网(学信网)的信息具有绝对的权威性,用户查询学历时,搜索引擎应该将学信网优先排序。那些专注于某个专业领域的网站,提供的内容更专业,对问题的理解更深刻,围绕问题本身能提供更多的参考资料,能够给用户更大的价值,在排序算法中应该将这一原则占有一定的计算比例。如某网站专注于在线英语口语培训,学生搜索英语口语培训时,该网站应该优先排序。1 1权威性权威性2 2专业性专业性2.3.22.3.2排序的原则排序的原则用户搜索的关键字要与页面

14、包含的关键字及内容具有更强的相关性。相关性越强,越是用户关心的信息,越能解决用户的问题,在排序算法中应该将这一原则占有一定的计算比例。页面中关键字出现的个数、出现的位置、外部页面指向该页面所用的锚文本等都是评价相关性采用的参考数据。但关键字并不是衡量页面内容相关性的唯一指标。页面内容中出现关键字,甚至出现多个关键字,并不能说明页面内容一定与围绕关键字所表达的意思相关性强。如用户搜索关键字短语“删除word中的空白页”,A页面只在标题中包含此关键字短语“如何删除word中的空白页”,然后直接给出了6种操作方法;B页面在标题、文章首段、中部、结尾处都出现了关键字短语,但只给出了2种操作方法,很多内

15、容都是与主题关联性不强的描述。显然,A页面内容与搜索关键字短语的相关性更强。因此,搜索引擎需要能够通过分析用户输入搜索的关键字,判断其真实想法;能够通过读取网页页面信息,确定页面内容表达的核心思想,两者匹配起来才能够更好地提升用户体验。这也对搜索引擎的算法要求较高。3 3相关性相关性2.3.22.3.2排序的原则排序的原则从两个方面理解新鲜性的原则:一是指页面更新的时间新,二是页面内容新。解决同样的问题,用户可能更感兴趣离搜索日期近的页面,特别是那些受时间、条件影响的问题。同样的问题,解决方案有创新性,同样的内容,表达形式比较新颖等都容易引起用户的兴趣。搜索引擎会把新鲜性原则作为页面排序的重要

16、条件。有用性是指页面内容是否对用户有用,是否被用户喜欢。搜索引擎有自己的方式来判断页面受用户喜欢的程度。如用户在页面停留的时间、页面被收藏的情况、页面内容被复制的情况、页面被转发的情况等。通过一系列的指标判定多数用户喜欢的页面说明是有用的、重要的,应该靠前排列。(事实上,搜索引擎通过分析这些页面,也有助于提升其算法的水平)。4 4新鲜性新鲜性5 5有用性有用性2.3.22.3.2排序的原则排序的原则友好性是指网站、页面对搜索引擎和用户是友好的,搜索引擎容易收录和分析,用户浏览页面的体验好。如页面的内容虽然重要,也能解决用户的问题,表达方式新颖,但是页面的很多地方充斥着广告信息。这样的页面往往给

17、用户“可惜”的感觉,搜索引擎也反感太多的广告行为。如果页面内容重点突出,层次分明,详略得当,用户很容易抓住要点,并且页面结构也合理,说明页面对用户是友好的,也容易引起搜索引擎的好感等等类似这样的页面应该靠前排列。6 6友好性友好性2.3.22.3.2排序的原则排序的原则特殊性是指某些比较特殊的因素影响到了页面排名,并且这些因素占有很大的比重。特殊性因素可能产生于多方面,可能具有临时性,并不是一种常规化的存在。如某网站向搜索引擎支付了一定的费用,在约定期间内,用户搜索某些关键字,该网站的页面就会优先显示,可能这些页面的实际价值一般。以上仅是列出了影响搜索引擎展现结果页面排序的几个因素,事实上,搜

18、索引擎参照的评价因素更多,设立了众多指标,最终综合评价确定排序结果。正如我们不知道具体的评价标准一样,各评价因素间的占比,也不为外界所知。7 7特殊性特殊性2.4.12.4.1查询的原则查询的原则主要从用户查询的习惯和体验好的角度出发,搜索引擎需要注意关键字的引导性和关键字描述结构性的原则。1引导性2结构性 搜索引擎向用户提供信息查询界面,用户在搜索框中输入相应的关键字,点击查询按钮或无需点击,就可以启动搜索服务。搜索引擎接受用户查询需要遵循一定的原则,用户在查询信息时需要掌握一定的技巧,还可以应用一些搜索指令。2.4.12.4.1查询的原则查询的原则搜索引擎可以通过搜索下拉框推荐关键字等方式

19、引导用户查询。搜索引擎能够根据用户输入的关键字智能推荐用户可能需要查询内容的关键字。这需要搜索引擎的算法不断完善,能够判断出用户的真实想法。以用户在360搜索引擎搜索“海外代购”为例,引导性的关键字如图2-4所示。图2-4 360搜索引擎的引导性关键字界面1引导性引导性2.4.12.4.1查询的原则查询的原则图2-4中下拉框推荐的关键字是用户在输入关键字过程中搜索引擎自动提示的引导性关键字,用户可以根据需要选择。图中“为您推荐”后的关键字是在用户搜索的结果页上部再次给用户提示的引导性关键字,可以帮助用户更好地进行搜索。另外,用户在输入关键字时难免有出现失误的情况,此时搜索引擎能够智能地判断出用

20、户可能的真实意思,自动纠错显示正确的结果,而不是就错论错,不显示或者显示明显错误的内容。如用户在360搜索引擎中搜索关键字“搜索引擎的工作原理”,将关键字误写为“搜素引擎的工作机理”,搜索结果如图2-5所示。图2-5搜索引擎自动纠正的搜索结果部分界面2.4.12.4.1查询的原则查询的原则图2-5中显示了搜索引擎判断用户可能的真实意思的页面。如果搜索引擎错误地判断了用户的查询需求,在结果页其还提供了“仍然搜索:”的用户所输入关键字的链接,用户可以点击链接进入相关页面。图2-5搜索引擎自动纠正的搜索结果部分界面2.4.12.4.1查询的原则查询的原则结构性是指关键字的描述具有一定的格式,形成结构

21、模板类的标准性描述,如“如何”“怎么样”“怎么办”“是什么意思”等语句。结构性主要体现在两个方面:一是搜索引擎提供的引导性关键字具备一定的结构性特点,二是搜索引擎能够把用户输入的关键字变成一些结构性的词语。很多用户输入搜索框的关键字具有一定的口语性,或者描述比较啰嗦,主旨不突出;或者有些用户输入的词语过于简单,搜索引擎不能判断其真实意思;还有些用户不能够正确表达自己的意思,输入的关键字含糊、语序颠倒等情况。搜索引擎会提供一些结构性的描述,能够有效引导用户的搜索需求。另外,搜索引擎在理解用户搜索的真实意义后,将接受的关键字变成易于搜索引擎理解的结构性语言,能够更好地展现搜索结果。假设用户在百度搜

22、索“冰箱不制冷怎么办”,搜索结果如图2-6所示。2结构性结构性2.4.12.4.1查询的原则查询的原则图2-6结构性语言搜索结果的部分界面 从搜索结果来看,虽然结果中有些关键字与用户搜索的不同,但提供的内容基本可以解决用户的问题,即“问题”和“方法”可以解决“怎么办”的问题。2.4.22.4.2查询技巧查询技巧用户在使用搜索引擎查询信息时,如果掌握一定的技巧能够快速、准确地找到自己需求的信息。1利用下拉框2快速显示结果3合理组织关键字2.4.22.4.2查询技巧查询技巧用户输入关键字时,搜索下拉框会根据输入的关键字自动提示相关关键字。这些关键字中如果有符合用户需求的可以直接选择。通常搜索引擎提

23、示的关键字是由众多用户的搜索习惯总结得出的,能给用户提供搜索便利,缩短输入时间,引导用户进一步明确自己的需求。同时,使用搜索引擎提示的关键字搜索能够得到比较满意的答案,这些答案是搜索引擎根据众多用户的选择,进行算法优化的结果,质量更高。假设用户使用百度搜索引擎查询关键字“EXCEL排序”,随着用户输入关键字,搜索下拉框会自动给出的关键字提示,如图2-7所示。图2-7下拉框的关键字提示1 1利用下拉框利用下拉框2.4.22.4.2查询技巧查询技巧图2-7中,上半部分的截图是用户输入“excel”后,搜索下拉框提供的引导性关键字,如果有满足用户需求的,可以直接点击下拉框关键字进入搜索结果页。图中的

24、下半部分是下拉框提供的与“excel排序”相关的关键字,如果有能精确表达用户需求意思的,可以直接点击进入搜索结果页。图2-7下拉框的关键字提示2.4.22.4.2查询技巧查询技巧为了提高搜索效率,用户在输入关键字的过程中,即使没有点击搜索按钮,搜索引擎还是会根据关键字,立即显示相关搜索结果。如果用户感觉信息能够满足其要求,就会停止输入关键字,直接点击显示的搜索结果。如果搜索引擎随着关键字的输入给出的搜索结果,以及给出的提示关键字都不是用户想要的,用户可以输入自己组织的关键字,然后点击搜索按钮,查看查询结果。2 2快速显示结果快速显示结果2.4.22.4.2查询技巧查询技巧用户把自己想要查询的内

25、容组织成输入的关键字,对用户和搜索引擎都是至关重要的。相同的意思,由于组织的关键字不同,可能得到相差较大的结果。例如,用户想搜索的内容是:夏天到济南游玩有什么好的地方推荐,用户可能组织的关键字是“夏天到济南游玩有什么好的地方推荐”,也可能组织的关键字是“济南夏天景点”,两者的搜索结果不同。读者可以试着搜索一下以上两个不同的关键字词语,对比一下搜索结果。通常用户把自己想搜索的内容使用简短、清晰的关键字表达出来,能够取得较好的搜索效果,关键字的字数越多,表达地越不清晰,越能给搜索引擎的关键字匹配带来困难。但是众多用户,并不会完全按照搜索引擎的要求去做,这也给搜索引擎的算法提出了挑战。搜索引擎除了提

26、供普通的搜索服务,还能够接受一些搜索指令,提供高级服务。对于普通用户来讲,一般不用高级指令搜索,但对于SEO人员来说,了解这些指令能得到很多有用的信息。3 3合理组织关键字合理组织关键字2.4.32.4.3查询指令查询指令1双引号指令2减号指令3Inurl指令4Intitle指令5高级搜索2.4.32.4.3查询指令查询指令很多时候用户输入的搜索词由多个词组成,搜索词加上双引号,表示将该搜索词作为一个词看待,搜索引擎施行完全匹配搜索。搜索词不带双引号,搜索引擎会显示包含搜索词中多个词的结果。在百度、360搜索等主流搜索引擎下,搜索词加上英文或中文状态下的双引号,对搜索结果没有明显影响。以在百度

27、搜索“seo推广优化”为例,带双引号和不带双引号的结果展示如图2-8所示。图2-8双引号指令的应用实例1 1双引号指令双引号指令2.4.32.4.3查询指令查询指令 图2-8中的上半部分是关键词不带双引号的搜索结果,下半部分是关键词带双引号的搜索结果。从搜索结果中可以看出,实际上所谓的完全匹配也并非完全,只是完全匹配的结果占有更大的比例。图2-8双引号指令的应用实例2.4.32.4.3查询指令查询指令 用户搜索关键字会得到很多结果,有些结果并不是自己需要的,此时可使用减号指令进行过滤。减号指令的使用方法是:关键字后加一个空格,然后是减号再加上过滤信息的关键字。如用户搜索“长城”,但不想显示百度

28、百科对长城的介绍,此时可以输入关键字“长城 百度百科”进行搜索。使用指令前后的搜索结果差别很大如图2-9所示。图2.9减号指令的应用实例2 2减号指令减号指令 2.4.32.4.3查询指令查询指令 顾名思义,inurl指令就是在URL链接地址中搜索,也就是搜索的关键字包含在页面的链接地址内。该指令的使用方法是:inurl指令后加一个冒号(中英文状态下都可以),然后输入关键字。SEO人员使用该指令能够找到比较好的友情链接,更准确地发现竞争对手。假设用户搜索“旅游”,只想显示URL链接地址中包含该关键字的页面,此时可以输入“inurl:旅游”进行搜索。使用指令前后的搜索结果差别较大如图2-10所示

29、。图2-10 inurl指令的应用实例3 3InurlInurl指令指令2.4.32.4.3查询指令查询指令顾名思义,intitle指令就是在页面的标题中搜索,也就是搜索的关键字包含在页面的标题中。该指令的使用方法是:intitle指令后加一个冒号(中英文状态下都可以),然后输入关键字。SEO人员使用该指令能够找到比较好的友情链接,更准确地发现竞争对手。如用户搜索“爬山”,只想显示链接页面标题中包含该关键字的页面,此时可以输入“intitle:爬山”进行搜索。使用指令前后的搜索结果差别较大如图2-11所示。图2-11 intitle指令的应用实例4 4IntitleIntitle指令指令2.4

30、.32.4.3查询指令查询指令 另外还有常用的site指令、Filetype指令、书名号等。下面将各指令的主要内容介绍如表2-1所示。这些指令的实际操作请读者自己练习指令名称功能使用方法举例备注site查询某个域名下的页面被搜索引擎收录的情况。在指定站点内进行搜索Site后加冒号(中英文状态下都可以),加关键字。关键字加空格,然后site后加冒号(中英文状态下都可以),再加站点地址Site:360杀毒 site:不同搜索引擎效果不同filetype查询包含关键字的某种特定类型的文件filetype后加冒号(中英文状态下都可以),加文件格式,后加空格加关键字Filetype:PPT 旅游注意文件

31、格式和关键字之间要加空格书名号与双引号类似关键字加书名号seo推广优化不同搜索引擎效果不同表2-1几种常见的查询指令搜索引擎还提供了“高级搜索”功能,用户可以在高级搜索页面根据界面提示,按照需求输入相关内容。以百度的高级搜索功能为例,用户可以进入高级搜索的页面(页面地址为:https:/ 5高级搜索高级搜索 搜索引擎接受用户的查询,经过系统的关键字匹配和页面排序后,最终将页面展现给用户。搜索引擎的运算都在后台运行,不管多复杂,对用户都不可见,也不是用户关心的,他们关心的是搜索服务的体验。搜索引擎的展现结果中,影响体验的主要因素有速度和显示结果的质量。搜索结果的显示速度与搜索引擎的算法及页面预处

32、理、服务器的性质、区域分布等因素相关。此处,重点介绍搜索显示结果的质量问题。2.5.12.5.1展现分析展现分析下面我们通过一个实例来分析搜索结果的展现问题。假设用户使用百度搜索引擎搜索关键字“美食攻略”。用户在搜索“美食攻略”时,通常可能想得到的信息是:所居城市或搜索具体地点的周边有哪些美食,人们对美食的评价如何,通过搜索结果展示的概要信息基本能确定是否点击进入页面。用户可能不想看到的信息是:广告。用户对这类关键词搜索结果地域性的要求较高,像成都的用户搜索“美食攻略”,得到的却是北京的美食信息,对用户没有帮助。搜索结果如图2-13所示。2.5.12.5.1展现分析展现分析图2-13搜索“美食

33、攻略”的结果页部分界面2.5.12.5.1展现分析展现分析根据图2-13展现的信息,我们分析图中的搜索结果:页面左侧排名第一位的是广告信息,排名第二位是百度旅游提供的美食旅游,排名第三位的是某网站成都美食攻略的页面,排名第四位的是某网站首尔美食攻略,排名第五位的是某网站上里美食攻略的页面,排名第六位的是对一部名为美食攻略游戏的介绍。页面右侧是几个网站的链接等信息。对于身在成都的用户而言,其就想查查晚上去公司附近的什么饭店吃饭比较合适。显然,搜索结果对用户没有任何用处。或许是用户输入的关键字选择不当,但从用户体验的角度考虑,搜索引擎展现的结果至少要遵循一些原则。2.5.22.5.2展现的原则展现

34、的原则智能性是指搜索引擎能够根据用户搜索情况展示给其可能最想得到的结果。实际这是在展现角度对搜索引擎排序提出的要求。根据上面的例子,搜索引擎能够判断用户是成都的,他输入“美食攻略”的真实意思是寻找搜索地周边的特色美食,有针对性地展现结果。甚至搜索引擎能够根据用户日常的搜索习惯能判断出他喜欢什么类型的食物,将包含那些食物的饭店优先展现。自然性主要是针对广告信息而言。搜索引擎展现的信息中广告占太大的篇幅容易引起用户反感,即使广告信息对用户是有用的,很多人也不会主动点击。很多用户都喜欢自然排名的结果,搜索结果中有“百度快照”标记的网站就是自然排名的网站。另外,搜索引擎本身可能开发了很多产品,其会优先

35、展示这些产品中包含的关键字页面,但要保证提供的信息是有价值的。1 1智能性智能性 2 2自然性自然性2.5.22.5.2展现的原则展现的原则 搜索引擎展现的结果不仅显示相关关键字页面的链接和网站名称,还要显示链接页面的主要信息,包括文字信息、图片信息等,以帮助用户判断是否有必要打开链接进一步了解页面内容。像图2-13搜索结果中展示的图片,就能调动起人们的食欲,想打开页面了解详细信息。关于这种展现方式,百度称之为结构化展现。结构化展现能够向用户明确传递信息,直击用户需求痛点,以获得更好的点击。图2-13中搜索结果中的右侧信息,作为一种展现形式,跟用户的搜索关键字具有一定的相关性,可能会引起用户的

36、兴趣。虽然我们不知道这种相关性的算法,但用户对其广告成分的感觉可能相对于左侧明显的广告信息要弱一些。3 3引导性引导性2.5.22.5.2展现的原则展现的原则补充知识点:百度的结构化数据 百度搜索引擎展现的自然结果中,主要分为两类:一是结构化展现,形式多样,目前覆盖80%的搜索要求;二是一段摘要式展现,比较原始,一般包括一个标题、两行摘要和部分连接。以搜索关键字“PDF阅读器下载”为例,搜索结果展现较好,如图2-14所示。图2-14百度结构化展现的部分形式2.5.22.5.2展现的原则展现的原则目前百度搜索引擎主要有下面几个结构化展现的样式:1 1通用回答通用回答搜索引擎直接就问题给出答案,方

37、便用户参考。以搜索关键字“如何在Excel中画斜线”为例,搜索结果展现较好,如图2-15所示。2.5.22.5.2展现的原则展现的原则搜索引擎直接给出下载地址、文件大小、文件更新时间、文件简介等信息(见图2-14)。对于时效性较强的资讯,搜索引擎将时间提取出来,标明网站来源,吸引用户点击。以搜索关键字“2017高考填报志愿”为例,展现效果较好,如图2-16所示。图2-16时间戳应用实例2 2下载下载 3 3时间戳时间戳2.5.22.5.2展现的原则展现的原则对于搜索引擎数据库中已经存在的含关键字的文档,搜索结果中会出现文档格式的示意图,有些还带有文档的页数以及评分等内容。以搜索关键字“搜索引擎

38、工作原理”为例,展现效果较好,如图2-17所示。图2-17在线文档应用实例4 4在线文档在线文档5 5配图配图搜索结果页中,带有与搜索内容关联性强的图片的链接更容易吸引用户点击,可以直观地让用户了解相关内容(见图2-15)。1、请读者从网上搜索某个搜索引擎内容抓取模拟器,使用模拟器抓取新浪网首页的内容。2、使用百度搜索引擎搜索关键字“冬天新疆旅游攻略”,体会搜索下拉框的引导性关键字,并熟悉不同引导性关键字的搜索结果页内容。3、请读者拟定关键字,分别使用本章中介绍的查询指令查询信息,体会不同指令下搜索结果的异同。4、请读者拟定关键字,根据百度结构化数据的内容,体会使用百度结构化数据查询关键字的结果。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(搜索引擎优化第2章搜索引擎的工作原理课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|