1、第二单元新媒体的类型和形态新媒体的类型和形态Web2.0与Web1.0 的区别在于,Web1.0是由网站主导生成内容,而Web2.0是由用户主导而生成内容的互联网产品模式。Web1.0采用的是技术创新主导模式,信息技术的变革和使用对于网站的新生与发展起到了关键性的作用。Web1.0的盈利都基于一个共通点,即巨大的点击流量。搜索引擎搜索引擎门户网站门户网站垂直网站垂直网站电子商务电子商务第一节 搜索引擎 搜索引擎(搜索引擎(Search EngineSearch Engine)是指在互联网环境中的信息检索系统。随着网络技术的飞速发展,互联网上的信息资源量越来越庞大,用户越来越难以准确快捷地获取所
2、需信息,从而产生了所谓的信息焦虑。互联网搜索引擎以其基于关键词匹配的信息检索机制为用户在瞬间搜寻出所需的相关信息,成为缓解人们信息焦虑最为有效的工具。1 1、搜索引擎的原理 搜索引擎并不真正搜索互联网,它搜索的实际上搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。是预先整理好的网页索引数据库。搜索引擎的目的是帮助人们寻找信息资源。在互联网环境下,其典型实现是基于关键词匹配的信息检索机制。搜索引擎主要由四部分组成:搜索器、索引器、检索器和用户接口。搜索器搜索器的功能是在互联网中发现和搜索信息,它要尽可能快、尽可能多地搜集各种类型的信息,同时还要定期更新已有信息,避免死链接
3、和无效链接。索引器索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表,建立起自己的索引数据库。搜索引擎的组成部分检索器检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口用户接口的作用是输入用户查询、显示查询结果、提供相关性反馈给用户。搜索引擎的组成部分1 1、搜索引擎的原理 搜索引擎的原理,可以看作三步:从互联网上抓搜索引擎的原理,可以看作三步:从互联网上抓取网页取网页建立索引数据库建立索引数据库在索引数据库中搜索在索引数据库中搜索排序。排序。2 2、搜索引擎的
4、类型 2.1 2.1 按查询类型划分按查询类型划分 如同传统检索系统可划分为分类检索分类检索和主题检主题检索索一样,搜索引擎也可按查询类型分为分类型搜索引擎(即范畴层次搜索引擎)和词语型搜索引擎两大类。但是,分类型搜索引擎通常带有关键词索引,词语型搜索引擎通常带有范畴层次索引,以弥补分类法和主题法各自的不足。2 2、搜索引擎的类型 2.2 2.2 按覆盖范围划分按覆盖范围划分 1.通用搜索引擎 2.专业搜索引擎2 2、搜索引擎的类型 2.3 2.3 按引擎功能划分按引擎功能划分 搜索引擎按引擎功能可分为常规搜索引擎常规搜索引擎和多多元搜索引擎元搜索引擎(Meta Search Engine)两
5、大类。常规搜索引擎是单一引擎;多元搜索引擎是多个单一引擎的组合,对同一个查询可同时在多个搜索引擎上进行,或组合指定的搜索引擎查询,或在单一搜索引擎上查询,可综合输出查询结果,也可分别输出每个搜索引擎的查询结果。3 3、搜索引擎尚待解决的问题 l缺乏检索词汇控制l自动标引有局限性l缺乏检索专业信息的能力l“把关人”缺失4 4、互联网信息检索策略 4.1 4.1 基本检索策略:布尔逻辑检索基本检索策略:布尔逻辑检索 布尔运算符包括AND、NOT、OR。比如,检索式:engine AND(car OR truck)。l用“A AND B”进行查询的结果是既包含查询词A又包含查询词B的文章。l用“A
6、OR B”进行查询的结果是至少包含A和B中一个查询词的文章。l用“A NOT B”进行查询的结果是包含查询词A而不包含查询词B的文章。4 4、互联网信息检索策略 4.2 4.2 范围限定范围限定 l二次检索:二次检索:对于再次检索,可以重新开始,在整个索引中检索,也可限定在前次检索结果内,优化检索。l时间范围(时间限制):时间范围(时间限制):雅虎系统设定检索时间范围为最近3年,用户也可在一天到三年的时间范围内进行选择。l语言限制:语言限制:AltaVista可以查询基于25种语言的信息,其中包括英语、日语、汉语、德语等。4 4、互联网信息检索策略 4.3 4.3 智能检索智能检索/概念检索概
7、念检索 Excite使用“智能概念检索”(Intelligent Concept Extraction)技术,通过发现词与概念间存在的关系,会自动加入一些检索词。如我们输入“elderly people financial concerns”,Excite除找出精确匹配这些词的文献外,还会找出有关“economic status of retired people”,“the financial concerns of senior citizens”等节点。4 4、互联网信息检索策略 4.4 4.4 字段限定字段限定 字段限定指限定词语在文献中出现的部位。大部分系统都可进行字段限定,但是字段
8、的数目和表示方法稍有不同。4 4、互联网信息检索策略 4.5 4.5 词语检索词语检索 在一串词的前后加双引号(“”)或用连字符连接,可限定检索结果中的词语必须以同样的顺序出现且相邻,如“China economic development”。4 4、互联网信息检索策略 4.6 4.6 其他检索策略其他检索策略 字母大小写:字母大小写:有些系统区分字母大小写,如AltaVista,Infoseek;有些系统不区分大小写,如雅虎。名词检索:名词检索:有些系统对名词检索有特殊规定,Infoseek要求人名或地名的首字母大写,如查找电影明星Rock Hudson,假如不大写首字母,则检索系统还会找出
9、rock climbing、rock music、Hudson River等资料。5 5、检索结果输出 l相关度:相关度:找到所有匹配结果以后,大部分系统都按相关性程度降序输出,首先显示相关度高的结果。有些系统还显示相关度大小(百分比)。l大多数检索遵循以下结果显示原则:大多数检索遵循以下结果显示原则:(1)匹配的词语数目。匹配的词语越多,相关性越高。(2)文献部位。标题中的词比文本和URL中的词权值高。(3)类目综合度。在雅虎类目等级结构中,综合类比专门类权值高。(4)检索词权值。在数据库中检索词出现的频率越低权值越高。5 5、检索结果输出 l显示格式:显示格式:大多数系统都可改变显示格式。
10、简短的可只包含标题,详细的可包括标题、摘要、地址、相关度、文件大小等信息。相应地,每页显示的结果数目也会发生改变。Google的基本搜索简洁方便,在输入查询内容后敲一下回车键,或单击“Google 搜索”按钮即可得到相关资料。Google只会返回那些符合用户全部查询条件的网页,不需要在关键词之间加上“and”或“+”。Google不仅能搜索出包含所有关键词的结果,并且还对网页关键词的接近度进行分析,按照关键词的接近度确定搜索结果的先后次序,优先考虑关键词较为接近的结果。Google储存网页的快照,当存有网页的服务器暂时出现故障时,用户仍可浏览该网页的内容。如果找不到服务器,Google储存的网
11、页快照也可救急。可利用Google目录根据主题来缩小搜索范围。例如,在Google目录的ScienceAstronomy类别中搜索“Saturn”,可以找到只与Saturn(土星)有关的信息。而不会找到“Saturn”牌汽车、“Saturn”游戏系统,或“Saturn”的其他含义。Google能够提供与原搜索相关的搜索词。这些相关的搜索词是根据过去Google所有用户的搜索习惯和 Google 提供的计算两个搜索词之间相关度的独家技术而产生的。通过包含特殊操作符“define:”,并使该操作符与需要其定义的字词之间不留空格,还可获得定义的列表。例如,搜索“define:HTML”将显示从各种在
12、线来源收集到的“HTML”定义的列表。第二节 门户网站门户(Portal),原意是指正门、入口,现多用于互联网的门户网站和企业应用系统的门户系统。门户网站是指通向某类综合性互联网信息资源并提供有关信息服务的应用系统。1 1、门户网站与新闻网站 简单回顾门户网站的起源和历史,可以让我们清楚地看到,无论是搜索还是新闻,都只是门户网站发展的一个阶段,门户网站可以从搜索服务演进到新闻服务,未必就不能从新闻服务演进到别的什么服务。新闻网站指以经营新闻业务为主要生存手段的网站,包括国家大型新闻门户网站(如新华网等)、商业门户网站(如网易等)、地方新闻门户网站(如长江网等),还有各种行业门户网站(如湖北美食
13、网、)。2 2、典型门户网站 1)雅虎 2)新浪 3)腾讯 4)网易 5)搜狐第三节 垂直网站垂直网站垂直网站是指将注意力集中于某些特定的领域或某种特定的需求,提供有关这个领域或需求的全部深度信息和相关服务的网站。和第一代大而全的水平网站(又称综合性网站)不同,垂直网站的注意力集中于某些特定的领域或某种特定的需求,提供有关这个领域或需求的全部深度信息和相关服务。作为互联网的新亮点,垂直网站正引起越来越多人的关注。垂直搜索 垂直网站的基础是垂直搜索。垂直网站的基础是垂直搜索。垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,它对网页库中的某类专门的信息进行一次整合,定向分字段抽取出
14、需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的网页搜索引擎的最大区别是,它对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据。趋势一:单一向多元的扩张。趋势二:门户与搜索的融合。各大门户网站不断升级和改进搜索服务,以百度和谷歌为代表的搜索引擎已经成为新型门户网站。趋势三:大众向分众的渗透。趋势四:Web1.0向Web2.0的推进。第一,IT类垂直网站近几年持续快速成长。中国IT类垂直网站数量规模总体呈上升趋势,总体收入将进一步增长,增幅在10%左右,处于一个成熟期。第二,房产类垂直网站如搜房网、搜狐焦点等的媒体优势明显。搜房网、搜狐焦点的覆盖
15、人数比较多,但是月度有效浏览时间少,黏性较低。不过也有例外,如深圳房地产信息网比较本地化,所以覆盖人数比较少,但由于本地化服务更有针对性,所以用户黏性比较高,因此本地化的垂直网站也有自己的优势。第三,中国财经类垂直网站处于快速成长期。第四,在线视频类网站为当前最具人气的垂直网站。目前,无论是从覆盖面还是从媒体黏性角度来考虑,优酷土豆的优势比较大,另外还有我乐网等。第五,分类信息网站是很多业内人士比较看好的垂直网站。分类信息网站为用户提供最直接的信息服务模式,很有发展前途。第四节 电子商务网站电子商务电子商务电子商务网站的主要类型电子商务网站的主要类型案例:淘宝网案例:淘宝网1 1、电子商务 1
16、.1 1.1 电子商务的含义电子商务的含义 电子商务是以商务活动为主体、以计算机网络为基础、以电子化方式为手段,在法律许可范围内所进行的商务活动过程。电子商务利用计算机技术、网络技术和远程通信技术,实现整个商务(买卖)过程中的电子化、数字化和网络化。1 1、电子商务 1.2 1.2 电子商务的基本特征电子商务的基本特征 l普遍性l方便性l整体性l安全性l协调性1 1、电子商务 1.3 1.3 电子商务的分类电子商务的分类 l按照商业活动的运行方式分:完全电子商务和非完全电子商务。l按照开展电子交易的范围分:区域化电子商务、远程国内电子商务、全球电子商务。l按照使用网络的类型分:基于专门增值网络
17、的电子商务、基于互联网的电子商务、基于Intranet的电子商务。1 1、电子商务 1.3 1.3 电子商务的分类电子商务的分类 l按照交易对象分:企业对企业的电子商务(Business to Business,B2B),企业对消费者的电子商务(Business to Consumer,B2C),企业对政府的电子商务(Business to Government,B2G),消费者对政府的电子商务(Consumer to Government,C2G),消费者对消费者的电子商务(Consumer to Consumer,C2C),企业、消费者、代理商三者相互转化的电子商务(ABC)。2 2、电子
18、商务网站的主要类型 l网上综合商城l垂直商店l服务型网店l导购引擎l团购模式 淘宝网由阿里巴巴集团在2003年5月10日投资创立,目前是亚太地区最大的网络零售商。淘宝网现在的业务跨越C2C、B2C两大部分。淘宝网统计显示,2012年上半年,淘宝网注册用户数达到4.7亿。1.1.网站设计网站设计l客服中心:淘宝网的客服中心是其加强与用户互动的有力平台。一旦用户有什么不明白的问题,就可以到客服中心的页面下寻求帮助。淘宝网利用客服中心引导用户,赢得了用户的积极响应。l虚拟社区:淘宝网的虚拟社区是淘宝网与用户之间,以及用户与用户之间进行交流的好工具。虚拟社区下设多个版块,方便用户相互交流。2.2.信用
19、体系信用体系l淘宝网的实名认证:“免费个人认证”和“免费商家认证”。l淘宝网的信用评价系统的基本原则是:成功进行一笔交易,双方对对方做一次信用评价,评价分为“好评”、“中评”、“差评”三类,“好评”加一分,“中评”不加分,“差评”扣一分。3.3.交易平台交易平台l为了解决C2C网站支付的难题,淘宝网打造了支付宝认证服务技术平台。它是由浙江支付宝网络科技有限公司与公安部门联合推出的。l支付宝的推出,解决了买家对于先付钱而得不到所购买的产品,或得到的是与卖家在网上的声明不一致的劣质产品的担忧,同时也解决了卖家对于先发货而得不到钱的担忧。本章主要阐释了Web1.0时代新媒体的主要形态,包括搜索引擎、门户网站、垂直网站、电子商务网站,重点讲授了搜索引擎的原理与检索技巧。