1、电子商务概论 第五章 网络商务信息的收集与整理第五章 网络商务信息的收集与整理5.1 网络商务信息基础5.2 网络商务信息的检索5.3 利用网络收集市场信息5.4 利用网络收集新产品开发信息5.5 统计信息的收集5.96 网络商务信息的整理5.1 网络商务信息基础5.1.1 网络商务信息的概念和特点信息,广义地讲,是物质和能量在时间、空间上,定性或定量的模型或其符号的集合。在商务活动中,信息通常指的是商业消息、情报、数据、密码、知识等。网络商务信息限定了商务信息传递的媒体和途径。只有通过计算机网络传递的商务信 息,包括文字、数据、表格、图形、影像、声音以及内容能够被人或计算机察知的符号系统,才
2、属于网络商务信息的范畴。信息在网络空间的传递称为网络通信,在网络上停留时称为存储。相对于传统商务信息,网络商务信息具有以下显著的特点:(1) 时效性。传统的商务信息,由于传递速度慢、传递渠道不畅,因而经常导致“信息获得了但也失效了”的局面。由于网络信息更新及时,传递速度快,只要信息收集者及时发现信息,就可以保证信息的时效性。(2) 相对性。网络信息的收集过程中,减少了信息传递的中间环节,从而减少了信息的误传和更改,有效地保证了信息的准确性。但由于网络商务信息的内容时时在更新,因而其价值具有相对性。网络商务信息的收集和加工应该与网络信息的变化保持同步性。(3) 便于存储。网络商务信息可以方便地从
3、因特网下载到自己的计算机上,通过计算机进行信息的管理。而且,在原有的各个网站上,也有相应的信息存储系 统。自己的信息资料遗失后,还可以到原有的信息源中再次查找。(4) 检索难度大。在浩瀚的网络信息资源中,迅速地找到自己所需要的信息, 经过加工、筛选和整理,把反映商务活动本质的、有用的、适合本企业情况的信息提炼出来,需要相当一段时间的培训和经验。网络商务信息,不仅是企业进行网络营销决策和计划的基础,而且对于企业的战略管理、市场研究以及新产品开发都有着极为重要的作用。5.1.2 网络商务信息的分级不同的网络商务信息对不同用户的使用价值(效用)不同,根据网络商务信息本身所具有的总体价格水平,可以将它
4、粗略地分为四个等级。第一级是免费商务信息。这些信息主要是社会公益性的信息,是对社会和人们具有普遍服务意义的信息,大约只占信息库数据量的 5%左右。这类信息主要是一些信息服务商为了扩大本身的影响,从产生的社会效益上得到回报,推出的一些方便用户的信息,如在线免费软件、实时股市信息等。第二级是收取较低费用的信息。这些信息是一般性的普通类信息。这类信息的采集、加工、整理、更新比较容易,花费也较少,是较为大众化的信息。这类信息约占信息库数据量的 1020%,只收取基本的服务费用,不追求利润,如一般性文章的全文检索信息。信息服务商推出这类信息一方面是为了体现为社会服务的意义,另一方面是为了提高市场的竞争力
5、和占有率。第三级是收取标准信息费的信息。这些信息属于知识、经济类信息,收费采用成本加利润的资费标准。这类信息的采集、加工、整理、更新等比较复杂,要花费一定的费用。同时信息的使用价值较高,提供的服务层次较深。这类信息约占信息库数据量的 60%左右,是信息服务商的主要服务范围。网络商务信息大部分属于这一范畴。第四级是优质优价的信息。这类信息是有极高使用价值的专用信息,如重要的市场走向分析、网络畅销商品的情况调查、新产品新技术信息、专利技术以及其它独特的专门性信息等,是信息库中成本费用最高的一类信息,可为用户提供更深层次的服务。一条高价值的信息一旦被用户采用,将会给企业带来较高的利润,给用户带来较大
6、的收益。5.2 网络商务信息的检索5.2.1 网络商务信息检索的基本要求网络商务信息检索是指在网络上对商务信息的寻找和调取工作。这是一种有目的、有步骤地从各个网络站点查找和获取信息的行为。一个完整的企业网络商务信息收集系统包括先进的网络检索设备、科学的信息收集方法和业务精通的网络信息检索员。网络营销离不开信息。有效的网络商务信息必须能够保证源源不断地提供适合于网络营销决策的信息。网络商务信息收集的要求是:及时、准确、适度和经济。(1) 及时。所谓及时,就是迅速、灵敏地反映销售市场发展各方面的最新动态。由于信息的识别、记录、传递、反馈都要花费一定的时间,因此,信息流与物流之间一般会存在一个时滞。
7、尽可能地减少信息流滞后于物流的时间,提高时效性,是网络商务信息收集的主要目标之一。(2) 准确。所谓准确,是指信息应真实地反映客观现实,失真度小。在网络营销中,由于买卖双方不直接见面,因而准确的信息就显得尤为重要。准确的信息才可能导致正确的市场决策。信息失真,轻则会贻误商机,重则会造成重大的损失。(3) 适度。适度是指提供信息要有针对性和目的性,不要无的放矢。没有信 息,企业的营销活动就会完全处于一种盲目的状态。信息过多、过滥,也会使得营销人员无所适从。网络商务信息的检索必须目标明确,方法恰当,信息收集的范围和数量要适度。(4) 经济。追求经济效益是一切经济活动的中心,也是网络商务信息检索的原
8、则。信息的及时性、准确性和适度性都要求建立在经济性基础之上。此外,提高经济性,还要注意使所获得的信息发挥最大的效用。5.2.2 网络商务信息检索的困难因特网所涵盖的信息远远大于任何传统媒体所涵盖的信息。人们在因特网上遇到的最大的困难是如何快速、准确地从浩如烟海的信息资源中找到自己最需要的信息,这已成为困扰全球网络用户的最主要的问题。美国 Lycos 公司的调查显示, 80%被调查者认为互联网络非常有用,但为了查找所需要的信息他们必须花费大量 时间和金钱。对于我国用户来说,面临的问题比国外用户还要严重。我们除了和国外用户面临同样的问题之外,还有信道拥挤、检索费用高、远程检索国外信息系统反应速度慢
9、、语言和文化障碍及大多数用户没有受过网络检索专业培训等多种困难。在因特网上检索信息困难与下列 3 个因素有关:(1) 因特网信息多而分散。因特网是一个全球性分布式网络结构,大量信息分别存储在世界各国的服务器和主机上。很多商业信息中还包含一些与信息含量无关的多余信息,这些信息多是重复无用的信息,给信息的甄选与鉴别带来很大困难。(2) 网络信息检索工具能力有限。与网络飞速发展形成鲜明对照的是至今还找不到一种方法对网络资源进行有效的管理。目前,对的网页和网址的管理主要依靠两个方面的力量:一是图书馆和信息专业人员通过对因特网的信息进行筛选、组织和评论;二是计算机人员设计开发巡视软件和检索软件,对网页进
10、行自动搜集、加工和标引。(3) 网络信息鱼目混珠。因特网上的信息质量参差不齐,良莠不一。网民无法判断信息的真假。在西方国家,特别是美国,任何人都可以在网上不受限制地自由出版、发布自己的网页。5.2.3 网络信息检索困难的解决办法1. 明确检索目标要完成一个有效检索,首先应当确定检索的目标。检索目标是指要检索的主要内容以及对检索深度和广度的要求。例如,安徽特酒集团是我国特级酒精行业的龙头企业,伏特加酒是其主打产 品。1998 年该集团试图通过 Internet 进行伏特加酒类市场信息的检索,开辟欧美市场。为此,集团确定了信息收集的三个目标:价格信息,关税、贸易政策及国际贸易数据,贸易对象信息。由
11、于目标明确,收到很好的检索效果。当检索的深度与需求的针对性有关。如果需求的针对性较强(如伏特加酒),且涉及到大量的特定领域和专业词汇,就需要进行较为深入的检索。检索的广度是指信息所涉及的方面和领域。对市场一般供需状况信息的检索,在深度上不必要求太高,但是在信息的广度上应该有比较高的要求。检索概念较泛,尚未形成一明确的检索概念时,或仅需对某一专题做泛泛浏览时,可先用主题指南的合适类目进行逐级浏览,直到发现相关的网址和关键词后再进行扩检。2. 选择查询策略不同目的的查询应使用不同的查询策略,这主要取决于是想得到一个问题的多方面信息还是简单的答案。搜索引擎的统计表明,很多用户只输入一个词来进行查询,
12、这会带来很多不需要的匹配。要进行有效的搜索,最好输入与主题相关的、尽可能精确的词或词组。提供的词组越精确,检索结果就越好。同时,应通过不同词组的检索,逐渐缩小搜索范围。3. 分步细化逐步接近查询结果如果想查找某一类信息但又找不到合适的关键词,可以使用分类式搜索逐步深化。搜狐网站的主页上将所有的信息分为新闻、体育、财经、IT、生活、健康、理财等 30 余类,然后再根据各个大类分为各个小类,如在“IT”中又以细分为“互联网、通信、科学”等。4. 使用模糊查询和精确查询模糊查询又称为智能查询。当我们输入一个关键词时,搜索引擎不但反馈了包括关键词的网址,同时也发来与关键词意义相近的内容。比如,在网站上
13、查找“网络经济”一词时,模糊查询会反馈回来包含了“网络经济论文”、 “网络经济与社会发展”、“信息经济”等内容的网址。所反馈的网址的排列顺序一般是:完全符合关键词的信息在最前边,其次是相近的信息。一般的搜索引擎都 有这一功能,只是模糊的程序不同。模糊查询没有特殊的方法,在文字框中输入关键词即可。用逻辑条件限制这一功能允许我们一次输入多个关键词,各关键词之间的关系可以是“和”、“或”、“非”(“and”、“or”、“not”)或“+”、“”、“,”等基本布尔操作符。各搜索引擎实现这种查询的方式不尽相同,可以通过各 引擎的帮助页找到各自不同的方法。大多数搜索引擎提供了“帮助”栏目,介绍如何使用引擎
14、,以及如何在搜索中输入布尔操作符的相应词法。图 5-1 是中国电子商务联盟的模糊检索及相关符号使用说明。图 5-1 中国电子商务联盟的模糊检索及相关符号使用说明5.3 利用网络收集市场信息5.3.1 利用网络收集市场需求信息1. 专题讨论专题讨论方式是借用新闻组(Newsgroup)、邮件列表(Mailing Lists)和网上论坛(或称电子公告牌,BBS)的形式进行的。1) 新闻组(Newsgroup)网络新闻组是一些有着共同爱好的因特网用户为了相互交换信息而组成的用户交流网(Usenet)。这些信息实际上就是网络用户针对某一主题向新闻服务器张贴的邮件。这些邮件又按不同的专题分类,每一类为一
15、个专题组,通常称为新闻组(Newsgroup)。企业可以选择与自己所关心的问题相关的新闻组,如“可视电话”,与潜在的客户展开讨论,了解用户的需求情况(如图 5-2 所示)。图 5-2 用户在 SOHU 商城上发表评论2) 邮件列表(Mailing list)邮件列表(Mailing list)是指建立在互联网或新闻组网络系统(Usenet)上的电子邮件地址的集合。利用这一邮件地址的集合,邮件列表的使用者可以方便地利用邮件列表软件将有关信息发送到所有订户的邮箱中。按照邮件列表的开放程度,邮件列表可分为以下三类。(1) 开放式邮件列表:任何感兴趣的用户都可以自由加入或订阅的邮件列表, 邮件列表完全
16、由邮件管理程序管理,类似于讨论组。(2) 封闭式邮件列表:邮件列表不对公众开放,只有邮件列表里的成员才能发表信件。(3) 管制式邮件列表:只有经过邮件列表管理者批准的信件才能发表,如产品信息发布、电子杂志等。图 5-4 人民网上的网上调查表和简明式调查问卷图 5-5 有奖网上调查3. 综合性搜索引擎1) Google 搜索引擎Google(.google3)是世界上最优秀的支持多语种的搜索引擎之一,它是由美 国斯坦福大学博士生 Larry Page 与 Sergey Brin 于 1998 年发明的。Google 公司1999 年成立,2000 年 7 月 替代 Inktomi 成为 Yaho
17、o 公司的搜索引擎。Google 因具出色的搜索功能,1998 年至今已经获得 30 多项业界大奖。Google 是目前世界上最大的搜索引擎,拥有 80 多亿张网页和 10 亿多张图片的资源,界面可用100 多种语言表达,检索结果所采用的语言达 30 多种。Google 采用新一代的 Page Rank 检索技术。该技术通过对超过 50000 万个变量和 20 亿个词汇组成的方程进行计算,能够对网页的重要性做出客观的评价。PageRank 技术并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的
18、投票数量来评估该页的重要性。在综合考虑整体重要性以及与特定查询的相关性之后, Google 可以将最相关、最可靠的搜索结果放在首位。2006 年,通过 Google 开发的新一代桌面搜索工具Google Desktop 3,用户可以搜索存储在 PC 中的各种数据,包括文档、电子邮件和通信录等个人信息,还可以加入远程组织和查找信息。如果用户同意将数据存储在 Google 服务器中,他们就可以在家中、工作时甚至飞机上通过任意一台电脑正常使用这些数据。当然,这里还需要解决隐私权保护问题。利用 Google 可以进行网站、图像、新闻组、论坛和网页目录检索,也可以进行 Flash 文件、货币转换等特殊信
19、息检索。图 5-6 显示了 Google 检索的基本过程。2) 百度中文搜索引擎百度在线网络技术有限公司(/baidu)于 1999 年底成立于美国硅谷,是目前全球最优秀的中文信息检索与传递技术供应商。在中国所有提供搜索引擎的门户网站中,超过 80%以上都由百度提供搜索引擎技术支持。它的创建者是信息检索技术专家、超链分析专利的持有人李彦宏和有多年商界成功经验的徐勇博士。2005 年 5月 20 日,百度被中国企业家杂志评选为 2005 年度“最具成长性的新兴企业”, 2005 年 8 月 5 日百度在纳斯达克正式上市。百度搜索引擎拥有目前世界上最大的中文信息库,总量超过 6 亿张网页,每天完成
20、 6000 多万次搜索,是中国因特网用户最常用的搜索引擎。图 5-7 显示了百度搜索引擎的体系结构。百度搜索引擎由四部分组成:蜘蛛程序、监控程序、索引数据库和检索程序, 可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。百度搜索引擎主要提供新闻、网页、贴吧、MP3、图片和网站的检索。除网页 检索只提供关键词检索外,其他栏目都提供目录和关键词两种检索方法,使用起来非常方便。随着手机使用功能的增强,百度开发了通过 PDA 及智能手机进行搜索的功能。无论使用 palm、wince 还是 smartphone 智能手机或者任意一款支持上网浏览网页的手机,都可以通过访问 /
21、pda.baidu,享用百度强大的无线搜索功能。图 5-7 百度搜索引擎体系结构3) 慧聪行业搜索引擎慧聪公司(/web.huicong)成立于 1992 年,是国内领先的商务资讯服务机构。2003 年 12 月,慧职公司实现了在香港创业板上市,成为国内信息服务业首家上市公司。慧聪搜索引擎通过其世界领先的文本分析及集合技术来进一步优化搜索结果, 实现了人工智能和搜索引擎技术的完美结合。其搜索结果的提取不再依赖某一个评价标准,而以用户的个性要求为准则,把基于关键词匹配改变为基于概念的搜索, 把和用户需求有关的内容提炼并聚类,大大提高了检索精度。行业搜索引擎是慧聪为商务人士开发的大型“专业”搜索引
22、擎,其检索结果可按各类商业用途细分,并且能够按照行业进行专业筛选,将出售、求购、科技文献等内容单独体现于检索结果中。例如,在“出售泵”的信息中,可以精确查找应用于水工业/暖通/石油/机械/化工等行业的泵的产品信息,这将极大提高商务人士的检索命中率,使商人不再为数以十万计的检索结果而苦恼,提高行业人士搜索的专业性和精确性。图 5-8 是慧聪的行业分类检索页面。4) 新浪、搜狐、网易的分类搜索引擎新浪、搜狐、网易是国内三大门户网站。这三个网站都建立了强大的分类搜索引擎,各自具有自己的特色。新浪网搜索引擎是面向全球华人的网上资源查询系统,分类检索目前共有 18 大类目录,205 个二级目录,一万多个
23、细目和数十万个网站,是互联网上最大规模的中文搜索引擎之一。其网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。图 5-9 是新浪分类搜索引擎有关目录。搜狐分类搜索引擎(/dir.sohu)收录中文网站达 150 多万个,每日页面浏览量超过 800 万次,每天收到 2000 多个网站登录请求。通过搜狐可以查找网站、网 页、新闻、网址、软件、黄页等信息。搜狐的目录导航式搜索引擎完全由人工加工而成,相比机器人加工的搜索引擎来讲具有很高的精确性、系统性和科学性。分类专家层层细分类目,组织成庞大的树状类目体系。利用目录导航系统可以很方便地查找到一类相关信息。网易分类搜索引擎(/search.163)
24、目前使用新一代开放式目录管理系统(ODP)。在功能齐全的分布式编辑和管理系统的支持下,现有 5000 多位各界专业人士参与可浏览分类目录的编辑工作,极大地适应了因特网信息爆炸式增长的趋势。目前,该网站拥有超过一万多个类目,超过 25 万条活跃站点信息,日增加新站点信息 5001000 条,日访问量超过 500 万次。全新的搜索技术及广告搜索服务可使用户检索高达 16 亿条的信息和及时的新闻内容,同时为广告客户提供更有效的广告方式。5) 北大天网中英文搜索引擎天网资源检索系统(/e.pku.edu)是中国教育和科研计算机网示范工程应用系 统课题之一,是国家“九五”重点科技攻关项目“中文编码和分布
25、式中英文信息发现”的研究成果,于 1997 年 10 月提供 Web 信息导航服务。天网系统目前已收录了1.05 亿个网页和大量的新闻组文章,更新较快,功能规范,反馈内容完整,可在反馈结果中进一步检索。天网支持简体中文、繁体中文、英文关键词搜索,而国内大部分搜索引擎都只收录中文网站,无法用来查找英文网站。但天网不支持数字关键词和 URL 名检索。提供 FTP 文件检索是天网的一个特色,它为高级用户查找特定文件提供了方便。天网将 FTP 文件分为电影和动画片、MP3 音乐、程序下载、文档资源共四大 类,用户可以利用关键词或分类检索查找自己需要的 FTP 文件。图 5-10 是从天网检索到的 FT
26、P 文件。2005 年 8 月,北大天网推出了 Maze 6.0 系统,这是一款资源和功能非常强大的 PIC(Personal Information Center,个人信息中心)文件系统。该系统解决了分布式索引、异内网通信等技术难题,整合了“天网 FTP 搜索”和“Maze P2P 文件搜索”等高级技术解决方案,提供了 1.5 万个文件的网络资源检索服务。图 5-11 是通过天网 Maze 6.0 系统检索的文件。4. 国内部分涉及宏观市场信息的网站企业在网络营销中需要了解本国、贸易伙伴国及有关国际组织的贸易政策、金融政策、自然条件、社会风俗以及相关的法律和法规。这类信息一般可在各类政府网站
27、或国家主办的为促进贸易而设的网站上查询,这类网站一般提供了比较详尽的宏观信息。图 5-12 和图 5-13 所示为中华人民共和国国家发展和改革委员会网站(.ndrc.gov)和商务部网站(.mofcom.gov)主页。为了促进国内与国外的贸易合作,商务部还有针对性地开通了中俄经贸合作网(.crc.mofcom.gov)、中国-新加坡经贸合作网(.csc.mofcom-mti.gov)、上海合作组织经济合作网(.sco-ec.gov)等双边或多边贸易网站。利用这些网站,可以及时了解有关国家和地区的贸易动向,提高贸易的成功率。5. 国内可以提供调研服务的网站国内一些网站上也提供市场信息的调研服务,
28、如中国调查网(rc,图 5-14)提供市场调查、企业调查、传媒调查和舆论调查;零点调查网(.horizon-china,图 5- 15)的调查业务主要涉及耐用消费品、媒体娱乐、快速消费品、政府研究、IT 电信、金融保险等 30 多个行业。艾瑞公司的中国网络用户在线调研(.iusersurvey)主要从事网络用户调研。图5-16 是该网站在线调研样本介绍和样本收集方法。图 5-16中国网络用户在线调研网站在线调研样本介绍和样本收集方法6. 国外涉及调研服务的网站在国际上,比较著名的调研网站有国际营销和市场研究协会的网站(.imriresearch),它提供了世界各国的主要市场调研协会的联系方式。
29、图 5-17 是该协会有关情况和数据库的介绍。7. 数据库1) 国外有关数据库数据网(.dialog,图 5-18)是世界上最大的数据库检索系统,它包括了全球大多数的商用数据库资源。另外,它提供了一套专门的信息检索技术,有专用的命 令,初次使用者需要认真学习才能掌握。它提供了一个免费的扫描程序,可以帮助查询者得到扫描结果。但若要索取具体的内容则要付费。SpringerLink(/springer.lib.tsinghua.edu,图 5-20)是国际著名科技出版集团 Springer 的网络版全文文献服务系统。SpringerLink 提供全文服务的文献包括 Springer 出版的 478
30、种科技、医学等学术期刊,20 余种世界知名科技丛书和权威的 Landolt-B?rnstein 数值与事实型工具书。SpringerLink 通过纯数字模式的专家评审编辑程序,从以卷期为单位的传统印刷出版标准过渡到以单篇文章为单位的网络出版标准,现在已有超过 200 种期刊优先以电子方式出版(OnlineFirst),大大提高了文献网上出版的速度和效率,并保 持了文献的高质量要求。其他比较著名的数据库还有:美国的 EBSCO(/search.epnet)、BigYellow(.bigyellow)、欧洲进出口公司数据库(.randburg)、中东地区公司数据库(.middleesatdirec
31、troy)、澳洲贸易网(.austrade.gov.au)、拉丁美洲网上博览会(.latinexpo)、日本 JETRO 公司数据库(.jetro.go.jp)等。2) 国内有关数据库国内比较常用的网络数据库有万方数据资源系统、中文科技期刊数据库、中国知网等。万方数据资源系统(.wanfangdata,图 5-21) 由万方数据集团与中国科技信息研究所共同开发,是一个以科技信息为主,集科技、经济、文化信息为一体的网络数据库群,主要包含以下三类信息资源:(1) 科技信息系统,包括中国学位论文数据库、中国会议论文数据库、中国科技成果数据库、专利技术数据库、中外标准数据库和科技文献数据库。(2) 数
32、字化期刊,以中国数字化期刊群为基础,整合了中国科技论文与引文数据库及其他相关数据库中的期刊条目部分内容,基本包括了我国文献计量单位中自然科学类统计源刊和社会科学类核心源期刊。(3) 企业服务子系统。包括政策法规数据库、中国科研机构数据库、科技名人数据库等。中文科技期刊数据库(/dx1.cqvip/index.asp,图 5-22)是科学技术部西南信息中心下属重庆维普资讯有限公司开发的数据库。该库是目前国内最大的综合性科技类文献数据库,包括中文科技期刊数据库、中文科技期刊数据库(引文版)、外文科技期刊数据库、中国科技经济新闻数据库、维普医药信息资源服务系统,涵盖自然科学、工程技术、农业、医药卫生
33、、经济、教育和图书情报等学科的 8000 余种中文期刊数据资源。中国知网(/ 5-23)是中国知识基础设施工程(China National Knowledge Infrastructure,CNKI)的主要组成部分,由清华大学、清华同方发起建设。包括中国期刊全文数据库、中国优秀博硕士学位论文全文数据库、中国重要会议论文全文数据库、中国重要报纸全文数据库、中国图书全文数据库、中国年鉴全文数据库、中国引文数据库等。5.3.2 利用网络收集市场供应信息企业的生产活动需要采购大量的原材料,利用因特网可以收集大量原材料供应信息,诸如原材料的产地、价格、交货方式和支付方式等。通过分析比较,可以大大降低采
34、购成本。1) 生产商协会的站点与生产商协会站点生产商站点提供的原材料的价格常常是最低的。营销人员应根据本企业长期积累的购销关系,并通过网络搜索,发现供应商的站点,寻找适合自己的产品价格。生产商协会站点也可通过搜索引擎进行检索查询。通常,这些网站上都列出了该生产商协会所有会员单位的名称及联系办法。2) Trade-Lead许多免费的 Trade-Lead 和专业的进出口网站专门提供进行国际贸易的机会和投资信息,类似国内的供求信息。常用的站点有:.iebb、.digilead 等。运用 Trade-Lead 要注意三个方面。首先,选择有代表性的站点作为常用站点,每周进行例行检索。这些站点的界面都比
35、较友好,而且信息量都很大,反馈回来的搜索结果也较多。其次,要特别注意一些收费的网站,虽然信息的查询、登录是有偿的,但反馈的结果比较满意。一方面收费较低,是可以承受的,另一方面也提供了一个相对安全的贸易环境(核查客户的身份)。3) 垂直搜索引擎站点利用垂直搜索引擎可以较快地获得某一行业更加精确的商务信息。与通用网页搜索引擎不同,垂直搜索引擎对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据。网页搜索以网页为最小单位,基于视觉的网页块分析以网页块为最小单位,而垂直搜索以结构化数据为最小单位,然后将这些数据存储到数据库,进行进一步的加工处理,如去重、分类等,最后分词
36、、索引,再以搜索的方式满足用户的需求。垂直搜索引擎开始主要应用在房产搜索、人才搜索领域,现在开始涉及生产领域。中国纺织网(.texnet)、中国化工网(/china.chemnet)等都是典型的垂直搜索引擎网站。图 5-24 是通过垂直搜索引擎“商搜”(.sunsou)检索出来的 1000 余项“阀门”的供求信息。4) 商品信息展示网站(1) 广交会网站。广交会网站是配合中国广交会而建设的商品信息展示网站, 目前有三个网站(.cecf、.cantonfair.org、/ebusiness.cantonfair.org)。(2) 阿里巴巴(.alibaba)。该网站是全球规模最大的 B2B 电子
37、商务第三方市场平台之一。(3) 各国商品网(/exporttochina.mofcom.gov/wcn)。该网站是国家商务部为 促进国际贸易平衡发展,帮助国外商品进入中国市场而设立的各国产品信息交流平台。(4) 环球资源(/.globalsources)。该网站是一家实体媒体与网络媒体融合应 用的多渠道 B2B 媒体公司,最初为国际贸易企业提供信息撮合的平台,目前推出为国际贸易社群及中国内贸 B2B 市场服务的垂直搜索引擎。5.3.3 利用网络收集关税及相关政策信息关税及相关政策信息在国际营销活动中占有举足轻重的地位。进口关税的高低影响着最终的消费价格,决定了进口产品的竞争力;有关进口配额和许
38、可证的相关 政策关系到向这个国家出口的难易程度;海关提供的进出口贸易数据能够说明这个 国家每年的进口量,即进口市场空间的大小;人均消费量及其它相关数据则说明了 某个国家总的市场容量。从世界 160 多个国家中,选择重点的销售地区、确定重点的突破目标,就必须依靠这些信息。除了通过大型数据库检索外,还有以下几种方法可以用来收集关税及相关政策信息:(1) 向建立联系的各国进口商询问。这是一种实用、高效的事情,不但考察了进口商的业务水平,确认其身份,而且可以收集到最有效的信息。(2) 查询各国相关政府机构的站点。随着 Internet 的高速发展,很多政府机 构都已经上网,建立了独立的网站。用户可以针
39、对不同的问题去访问不同机构的的站点,许多问题都可以得到非常详尽的解答。(3) 通过新闻机构的站点查询。世界各大新闻机构(如 BBC、CNN、Reuter 等) 的站点是宝贵的信息库,几家国际著名的几家新闻机构,其站点中每天 10 万字以上的新闻是掌握实时新闻和最新信息的捷径。5.4 利用网络收集新产品开发信息1. 收集客户新产品构思新产品构思的来源有很多,最重要的一种是用户的提问。这种方法要求用户提出他们使用某一特定的商品或商品系列时所遇到的问题和要求,并对这些问题和要求的重要性、影响程度加以评估,据此选定值得开发的构思。国内一些大企业在这方面已经走出了第一步,如海尔集团,见图 5-25。2.
40、 新产品专利信息的收集新产品的开发不可避免地要涉及到专利问题。一般查询国内的专利信息,可利用中国专利信息网(.patent,图 5-26)、中国专利信息中心(pat)、中国知识产权网(ipr)、万方数据库(.wanfangdata)等网站。中国专利信息网包含了 1985 年 4 月 1 日中国专利法实施以来至今的 172 万件 专利的题录信息;免费用户可以自由浏览专利说明书全文的首页,普通和高级用户 可以查看并打印、下载发明专利和实用新型专利说明书的题录、摘要信息,以及说明书的全部内容。国外的专利制度已经延续了几百年的时间,有关专利的信息管理非常完善。应注意有关专利信息的检索。图 5-27 是
41、欧洲欧洲专利局(.european-patent-office.org)、美国专利商标局(.uspto.gov)和日本特许厅(.jpo.go.jp)的网站主页。3. 高校和科研院所新产品信息的收集一般来说,较大的企业都有自己的研发部门,如宝洁(P&G)、微软(Microsoft)都在中国设立了自己的研究开发中心或研究所,独立从事新产品的研 制与开发。而对中小企业来说,在研究性人才比较集中的高校和科研院所中寻找开发新产品的合作伙伴不失为一条出路。各高校都有自己研究的重点和强项,在因特网上很容易找到全面而详细的信息。中国高校科技成果转化网(.cutt.edu)是连接高校和企业的综合性网站,
42、企业可以按高校校名和行业检索相关的高校科研成果(如图 5-28 所示)并进一步查找发明人或设计人,从而确定希望开发的新产品。5.5 统计信息的收集在因特网上通过各个渠道收集的信息是分散的、无序的, 而企业的市场运作常常需要了解整体的情况。这时,统计数据就显得非常重要了。收集统计数据,首选的网站是政府网站。例如,要了解互联网宽带接入用户发展情况,可以直接登录信息产业部网站(.mii.gov),查询统计信息栏目即可。需要了解美国电子商务发展的统计数据,可以到美国人口普查局网站(.census.gov)。该网站有专门的“E-Stats”栏目公布有关电子商务的统计资料 (参见图 5-29)。在收集统计
43、资料时,应注意专业网站的调研报告。Scottish Enterprise公司(.scottish-enterprise)是专门调查欧盟国家电子商务网站的公司,图 5-30 是该网站发布的 2005 年欧盟国家电子商务发展调研报告。中国行业研究网(.chinairn)每年都发表多个行业研究咨询报告,艾瑞市场咨询网(.iresearch)每年也发布多个市场研究报告(参见图 5-31)。5.6 网络商务信息的整理5.6.1 网络信息的整理通常我们收集到的和储存的信息往往是零零散散的,不能反映系统的全貌,甚至其中可能还有一些是过时的甚至无用的信息。通过信息的合理分类、组合、整理,就可以使片面的信息转变
44、为较为系统的信息,这项工作一般分为以下几个步骤:(1) 明确信息来源。下载信息时,由于各种原因而没有将网址准确记录下来, 这时首先应查看前后下载的文件中是否有同时下载或域名接近的文件,然后用这些接近的文件域名作为原文件的信息来源。如果没有域名接近的文件,应尽量回忆下载站点,以便以后有机会还可以再次查询。对于重要的信息,一定要有准确的信息来源,没有下载信息来源的,一定要重新检索。(2) 浏览信息,添加文件名。从因特网上下载的文件,由于时间的限制,一般都沿用原网站提供的文件名,这些文件名很多是由数字或字母构成的,使用起来很不方便。因此,从网上下载文件后,需要将文件重新浏览一遍,添加文件名。(3)
45、分类。分类的办法可以采用专题分类,也可以建立自己的查询系统。将各种信息进行分类,必须明确所定义的类特征,把具有相同类特征的信息分为同一 类。除了分类处理之外,往往还需要进一步做信息排序处理:各类之间要有类的排 序,每个类的内部要有类内事项的排序。在分类和排序的基础上,还应当编制信息的储存索引。(4) 初步筛选。在浏览和分类过程中,对大量的信息应进行初步的筛选,确定完全没有用的信息应当及时删去。不过应当注意,有时有些信息单独看起来是没有用的,但是综合许多单独信息,就可能发现其价值。比如市场销售趋势必定在数据的长期积累和一定程度的整理后才能表现出来。还有一些信息表面上是相互矛盾 的,例如,一家纸业
46、公司的经理想了解一下新闻纸的市场行情,检索到的结果可能会出现两种情况:一类信息告诉他,新闻纸供大于求,而另一类信息则说新闻纸供不应求,这时就要把这些信息进行科学的分类整理,然后进入加工处理环节。5.6.2 网络信息的加工处理网络信息的加工处理是指将各种有关信息进行比较、分析,并以自己的初衷为基本出发点,发挥个人的才智,进行综合设计,形成新的有价值的个人信息资源, 如个人专业资源信息表等等。信息加工的目的是要进一步改变或改进信息利用的效率,使其向着最优化发展。因此,信息加工处理是一个信息再创造的过程,它并不是停留在原有信息的水平上,而是通过智慧的参与,加工出能帮助人们了解和控制下一步计划的程序、
47、方法、模型等信息产品。从网络上得到的信息有时候会是自相矛盾的,还有一些可能是商业对手散布的用来迷惑竞争者的虚假信息。对于上面提到的关于新闻纸的两条信息,就需要进行人工处理。首先要对这两条信息的发源地、发布时间等进行比较,如果发源地和时间都基本相同,就要参考其他信息来进行比较,最终获得真正有价值的信息。5.6.3 网络信息处理的类型1. 为提高效率而进行的网络信息处理这种处理主要是指对各种各样的信息的压缩,即去除信息中的多余成分或次要成分,留下信息的主要成分。当然,压缩的前提是要保证信息的失真不会超过允许的限度。目前所采用的信息压缩技术完全局限在语法信息的范畴。主要原理是消除语法信息中的统计相关性和改变统计分布,具体的途径是通过有效性编码来实现。新一代的信息压缩技术可能突破语法信息的限制,深入到语义信息和语用信息的范畴。换句话说,信息中哪些成分重要、哪些成分次要,不是仅从“恢复波形” 这样一个纯语法信息的角度来判断的,而主要是从语义信息(信息的逻辑含义)和语用信息(信息的效用价值)的角度来判断的。因此,基于语义和语用信息分析的信息压缩必定比基于语法信息分析的