1、提纲 什么是对等计算?什么是对等计算?日常生活中的应用日常生活中的应用什么是对等计算?什么是对等计算?历史沿革历史沿革将来的应用将来的应用 基本技术基本技术体系结构体系结构定位和路由定位和路由查询处理查询处理其它相关技术其它相关技术 相关技术相关技术Web 服务服务网格计算网格计算 系统与开发系统与开发设计与技术选择设计与技术选择JXTAJabber 其它问题其它问题 小结小结2022-12-302我们生活中的对等计算(1)即时消息传递即时消息传递ICQ I SeekYou!OICQ/QQYahoo!PagerMSN MessengerAOL IM 聊天、文件传递、网上视频聊天、文件传递、网上
2、视频2022-12-303我们生活中的对等计算(2)多媒体文件共享、下载多媒体文件共享、下载KaZaA:最热门的下载软件最热门的下载软件E-Donkey:可能是中国最热门的下载软件可能是中国最热门的下载软件GnutellaFreenet以前的以前的Napster 你共享你的多媒体文件,也从别人那里拿别人你共享你的多媒体文件,也从别人那里拿别人的的2022-12-304对等计算是什么?P2PPoint-to-Point 物理上物理上,点和点之间直接相连,点和点之间直接相连People-to-People 逻辑上逻辑上,用户(应用)和用户,用户(应用)和用户直接对话直接对话Peer-to-Peer
3、 对话的两端是平等的对话的两端是平等的2022-12-305对等计算的历史(1)曾经,曾经,Internet就是就是P2P的的ARPANet1969 1995 DNS Usenet 2022-12-306对等计算的历史(2)后来,后来,客户机客户机/服务器体系结构出现了服务器体系结构出现了垃圾信息处理、拥塞控制使得网络节点之间不再协垃圾信息处理、拥塞控制使得网络节点之间不再协作作防火墙、动态防火墙、动态IP、网络地址翻译的出现中止了开放、网络地址翻译的出现中止了开放网络时代网络时代客户机客户机/服务器体系结构由于利于开发、使用、管服务器体系结构由于利于开发、使用、管理,成为很多网络应用的首选理
4、,成为很多网络应用的首选 HTTP FTP 2022-12-307对等计算的历史(3)2000年年NapsterICQ 新的新的P2P模型出现模型出现2022-12-308对等计算的历史(4)局限性局限性 功能上功能上寻找:寻找:“指环王指环王”寻找象寻找象“指环王指环王”这样好看的电影这样好看的电影寻找寻找3月份刚发布月份刚发布的电影的电影寻找最流行的寻找最流行的10部电影部电影和好友聊天和好友聊天寻找和我有相同爱寻找和我有相同爱好的好友好的好友寻找和我有相同好寻找和我有相同好友的好友友的好友音频音频/视频聊天视频聊天音频音频/视频白板视频白板2022-12-309对等计算的历史(5)局限性
5、局限性 性能上性能上集中索引的方式没有可伸缩性(集中索引的方式没有可伸缩性(scalability)分散处理方式往往找不到需要的内容分散处理方式往往找不到需要的内容带宽消耗太大带宽消耗太大 如果不控制,校园网上如果不控制,校园网上80%的带宽消耗在的带宽消耗在P2P文件传输上文件传输上2022-12-3010潜在的 P2P 应用 金融金融 电信与网络提供电信与网络提供 移动通信移动通信 科学计算科学计算2022-12-3011P2P 系统的特点 资源共享资源共享 已有系统和网络的利用已有系统和网络的利用自底向上,而不是自上而下的自底向上,而不是自上而下的 大规模分散处理大规模分散处理 不稳定的
6、节点或者网络不稳定的节点或者网络2022-12-3012基本技术 体系结构(1)分类分类2022-12-3013基本技术 体系结构(2)集中式系统集中式系统2022-12-3014基本技术 体系结构(3)分散式系统分散式系统2022-12-3015基本技术 体系结构(4)混合式系统混合式系统2022-12-3016基本技术 体系结构(5)结构化系统系统结构化系统系统2022-12-3017基本技术 定位和路由(1)宽度优先搜索宽度优先搜索搜索路径短搜索路径短大量的网络消耗大量的网络消耗可能会搜索整个可能会搜索整个网络网络2022-12-3018基本技术 定位和路由(2)深度优先搜索深度优先搜索
7、低网络消耗低网络消耗大量的回溯时间大量的回溯时间2022-12-3019基本技术 定位和路由(3)启发式搜索启发式搜索路由表和路由索引的使用路由表和路由索引的使用 基本思想基本思想如果我知道数据在哪里,我就可如果我知道数据在哪里,我就可以有针对性地去搜索以有针对性地去搜索从而节约网络带宽消耗,快速找从而节约网络带宽消耗,快速找到答案到答案 P2P 系统中,系统中,100%准确的准确的搜索是不可能的搜索是不可能的 在每个节点上保留一些信息可在每个节点上保留一些信息可能有用能有用2022-12-3020基本技术 定位和路由(4)结构化结构化 P2P 系统中的定位和路由系统中的定位和路由2022-1
8、2-3021基本技术 查询处理(1)匹配查询匹配查询现在的现在的 P2P 系统已经能够很好地完成这个系统已经能够很好地完成这个任务任务特别是结构化特别是结构化 P2P 系统系统2022-12-3022基本技术 查询处理(2)关键词查询关键词查询现在的现在的 P2P 系统能够完成简单的关键词查系统能够完成简单的关键词查询询 标题搜索标题搜索但是距离搜索引擎那样的搜索还差得很远但是距离搜索引擎那样的搜索还差得很远2022-12-3023基本技术 查询处理(3)结构化查询结构化查询当前的技术不能处理当前的技术不能处理 节点间模式不同节点间模式不同 节点间数据的表示不同节点间数据的表示不同 无法用简单
9、的定位确定数据无法用简单的定位确定数据 复杂的技术需要消耗大量的网络资源复杂的技术需要消耗大量的网络资源 语义上存在问题语义上存在问题 2022-12-3024基本技术 查询处理(4)其它查询其它查询近似搜索近似搜索/区域搜索区域搜索 寻找片长在寻找片长在2小时以下的电影小时以下的电影空间搜索空间搜索 寻找距离五角场最近的寻找距离五角场最近的 5 辆出租车辆出租车分析查询分析查询 有多少辆出租车距离五角场有多少辆出租车距离五角场 10 分钟距离以内?分钟距离以内?其中最近的多长时间能够到达?其中最近的多长时间能够到达?2022-12-3025基本技术 其他相关技术 复本放置与缓存技术复本放置与
10、缓存技术放置策略选择放置策略选择一致性的保证一致性的保证安全与隐私问题安全与隐私问题 节点异构性节点异构性你的数据我永远不你的数据我永远不懂懂 可靠性保证可靠性保证一个一个scr文件可能是文件可能是一个病毒一个病毒 元数据管理元数据管理谁能够使用系统?谁能够使用系统?系统中有什么数据?系统中有什么数据?某某数据的语义是什某某数据的语义是什么?么?2022-12-3026相关技术 Web Service 共同点共同点分布式数据处理分布式数据处理服务服务/客户点对点客户点对点没有集中的服务器,只有类似于索引服务器的没有集中的服务器,只有类似于索引服务器的UDDI服务器服务器 差别差别目前,大多数服
11、务只牵涉到少数目前,大多数服务只牵涉到少数(通常是通常是2个个)节节点点没有数据定位没有数据定位/路由等问题路由等问题2022-12-3027相关技术 网格计算 共同点共同点网格服务通常是分布进行的网格服务通常是分布进行的 差别差别网格在操作系统之下,而网格在操作系统之下,而 P2P 是应用层的是应用层的目前,网格用户之间不是目前,网格用户之间不是 P2P 的的2022-12-3028系统与开发 设计与技术选择 遵守开放标准遵守开放标准 vs.开发封闭系统开发封闭系统前者更易于设计、开发,而后者更可靠、安全前者更易于设计、开发,而后者更可靠、安全 使用公开协议使用公开协议 vs.使用开放源码系
12、统使用开放源码系统前者的开发代价较大前者的开发代价较大 使用系统相关工具使用系统相关工具 vs.使用系统独立工具使用系统独立工具后者更符合后者更符合 P2P 的本意的本意2022-12-3029系统与开发 JXTA(1)2022-12-3030系统与开发 JXTA(2)2022-12-3031系统与开发 Jabber 基于基于 XML 标准标准 采用集中式索引服务采用集中式索引服务器器2022-12-3032其它问题 法律和道德法律和道德共享盗版文件是违法共享盗版文件是违法/犯罪吗?犯罪吗?发布不属于自己的内发布不属于自己的内容合理合法吗?容合理合法吗?技术问题技术问题如何处理并适应如何处理并
13、适应 IPv6?移动系统的问题移动系统的问题 安全与隐私保护安全与隐私保护我不希望别人知道我我不希望别人知道我看了什么电影看了什么电影金融数据是保密的金融数据是保密的P2P 并不意味着任并不意味着任何节点可以任意访问何节点可以任意访问任何数据任何数据 应用问题应用问题企业应用与个人应用企业应用与个人应用的差别的差别2022-12-3033小结 P2P 是一种新的分布式计算模型是一种新的分布式计算模型它牵涉很多新的技术问题它牵涉很多新的技术问题还牵涉了技术以外的问题还牵涉了技术以外的问题 它未必能够改变现有应用的计算模型它未必能够改变现有应用的计算模型但是现有计算模型的一种有力补充但是现有计算模型的一种有力补充2022-12-30342022-12-30352022-12-30362022-12-30372022-12-3038