基于二部图网络的个性化推荐系统课件.ppt

上传人(卖家):三亚风情 文档编号:3432919 上传时间:2022-08-31 格式:PPT 页数:18 大小:1.68MB
下载 相关 举报
基于二部图网络的个性化推荐系统课件.ppt_第1页
第1页 / 共18页
基于二部图网络的个性化推荐系统课件.ppt_第2页
第2页 / 共18页
基于二部图网络的个性化推荐系统课件.ppt_第3页
第3页 / 共18页
基于二部图网络的个性化推荐系统课件.ppt_第4页
第4页 / 共18页
基于二部图网络的个性化推荐系统课件.ppt_第5页
第5页 / 共18页
点击查看更多>>
资源描述

1、CONTENTS个性化推荐系统研究Part 1基于二部图网络的推荐算法Part 2算法优缺点分析Part 3目目录录1LOREM IPSUM DOLOR1 搜索引擎技术是最早被提出的针对互联网信息超载问题的研究方法,但是由于它需要用户提供明确的搜索目标,而且返回的搜索结果时间过于雷同,因此没有办法很好的满足用户的多元化及个性化需求。针对上述搜索引擎中存在的局限,个性化推荐系统应运而生。系统主要由用户模块、项目模块以及推荐算法三部分构成。个性化推荐系统在用户模块中分析用户的历史行为,比如浏览哪些信息、点击哪些商品等,从而生成用户偏好模型。项目模块被用来分析不同项目的特征信息,并以此来完成对项目模

2、型的构建。最后,系统通过某种推荐算法将用户模块中的用户兴趣偏好与项目模块中的项目特征模型进行比对,选出符合用户偏好的所有项目生成推荐列表,并把推荐列表推荐给用户,从而完成推荐。其中最关键的部分就是个性化推荐算法,通过设置高效的推荐算法,系统可以自动地向其中所有用户进行智能的个性化推荐。图1.1 通用推荐系统模型 推荐算法的优劣直接决定了整个系统的推荐效果.。目前学界尚未有一个统一的标准来对其进行系统的分类,较为常用的推荐算法主要包括以下几种。基于内容的推荐算法(Content Based Recommendation Algorithm)协同过滤推荐算法(Collaborative Filte

3、ring Recommendation Algorithm)混合推荐算法(Hybrid Recommendation Algorithm)基于复杂网络的推荐算法(Complex Networks Based Recommendation Algorithm)1.数据稀疏性问题 作为依赖用户对项目评价信息的推荐算法所面临的主要问题,评分矩阵的稀疏性会严重影响推荐算法的性能,导致系统难以准确地发现目标用户的相似邻居,致使用户感兴趣的内容无法被完整发掘,令推荐效果大打折扣,无法充分满足用户需求。2.冷启动问题 在实际应用中,系统的受众和项目随着系统规模的扩大呈指数型增长,这是就容易出现冷启动问题。当

4、新项目出现时,由于缺少任何用户对该项目的评分,从而难以对用户相似性或匹配程度进行计算,也无法对项目进行评分预测,系统因此无法对该项目产生任何推荐,当新用户加入系统时同理。目前虽然己有许多研究人员针对这一问题提出了解决办法,但问题仍未被彻底解决,还需要对其进行深入的研究。3.可扩展性问题 在实际应用中,针对用户的项目推荐难度也随着系统规模的不断扩大而愈发提高,由此导致的可扩展性问题也成为推荐算法中鱼待解决的问题之一。通过离线计算以及降维、聚类等方式,可以解决在大型系统中出现的反应过慢、计算量过大等问题,这些改进方法都在一定程度上对系统的可扩展性有所提高。4.系统安全性问题 个性化推荐系统在对用户

5、进行推荐时需要以某种方式来获取其偏好,但用户往往由于担心泄密而拒绝提供个人信息,这是推荐系统中长期面临的问题。如何既能获取用户兴趣信息而提高系统的推荐效率,又能有效保护用户的个人隐私,这也是个性化推荐系统中的重要研究方向。同时也有一些用户出于个人意愿恶意捏造评分数据,以达到提高或降低某些项目被推荐概率的目的,这被称为推荐攻击,也是推荐系统中存在的安全问题之一。如何检测并预防推荐攻击,也是个性化推荐系统的另一个研究方向。1LOREM IPSUM DOLOR2 二部图网络结构是复杂网络中一种重要的表现形式,具有一定的普遍性,是复杂科学中的研究热点。基于二部图网络的推荐算法以二部图网络中的节点及连边

6、代替传统推荐算法中的角色及其选择关系,并通过在网络结构上进行形式化的计算来发掘用户的兴趣点。二部图是的二分网络的数据结构表现形式,它是由两种不同类型的节点集以及这些节点间相连的边所组成的网状结构。设G=V,E,是一个无向图,它的顶点集V包括两个子集V1和V2,其满足以下条件。图2.1 二部图结构模型 我们就把它称为一个典型的二部图,常记为G=V1,V2,E如图2.1所示。系统输入的数字可以组成一个二部图G=U,O,E,m个用户的用户集U=u1,u2,um,含有n个项目的项目集O=o1,o2,,on,边集E=eip(uiU,opO),二部图G具有以下拓扑性质。(1)度和度的分布节点度被用来表示网

7、络中某节点的连接特性,在一个网络中,所有节点度的集合可以映射出这个网络的连通关系。网络中某节点1的度k;代表着与其相连的节点数量。(2)邻接矩阵aip可构成mxn的邻接矩阵A,它记录了用户i与项目p之间的选择关系,其结构如下其中,用户uiU,项目opO。当aip=1时,代表用户i与项目P之间存在选择关系,当aip=0时,则代表用户i与项目P之间不存在选择关系。基于图的推荐算法由Aggarwal于1999年首次提出,并迅速成为了个性化推荐领域中新的研究热点。基于二部图网络的推荐算法以二部图中的节点及其连边代替传统推荐算法中的角色及其选择关系,并通过在网络结构上进行形式化的计算来发掘用户的兴趣点。

8、当用户和项目之间发生选择关系时,在二部图结构中的相应节点间便出现了一条代表这种选择关系的连边,我们认为在相连的节点之间存在着某种可传递的能力值。算法的基本思想如下:在一个二部图网络中,推荐系统希望通过节点之间的选择关系,向目标用户进行推荐。当目标用户选择了某项目时,代表这个项目中必然存在着某种用户感兴趣的属性值,它代表一种可传递的能力值,根据二部图网络的关联结构,这个项目可以将自身的属性值传递给与其相连的项目节点。通过对目标用户所有选择过的项目上的属性值进行传递及计算,便得到了用户感兴趣的属性在二部图上各项目节点中的分布。在二部图网络的基础上引入扩散动力学,实现了物质扩散(Mass Diffu

9、sion)及热传导(Heat Conduction)推荐算法。下面我们对两种算法分别进行分析。基于物质扩散(Mass Diffusion)的推荐算法假设目标用户选择过的所有项目都具有一定的其喜爱的属性,并且可以通过网络结构中节点之间的连边来传递这种属性,我们称这种属性为节点所拥有的资源值。拥有这种资源的项目节点会把资源更多的传递给目标用户喜爱的项目。具体推荐过程分为三步:首先,为所有目标用户选择过的项目分配一个初始值,在这里我们将初始值设为1,它代表了某种用户喜爱的属性。然后,根据用户和项目之间的选择关系,把项目节点上的初始值按照一定的方式传递给用户节点。最后,计算所有用户节点获得的分配值,并

10、把它们按照同样的传递方式返回给项目节点,最终,每个项目节点都获得了一定的代表目标用户喜爱特性的属性值。算法中每个节点分配给对应节点的分配值都是通过其自身拥有的初始值除以节点度得到的。算法的实现过程如图2.2所示。1.所有初始资源等概率的从项目集O流向用户集U,则用户集U中第i个节点u所分配到的资源f(ui)计算公式如下:2.流向用户集U的资源再等概率的流回项目集O,此时项目op分配到上午资源f(op)计算公式如下:图2.2 物质扩散过程实例推荐系统中的热传导过程类似于热量在用户一项目二部图中扩散的过程。基于热传导的推荐算法(HCBI)将物质扩散算法中代表推荐能力的资源命名为物质,热量的传递同样

11、通过三步来完成:首先,我们同样为所有目标用户选择过的项目分配一个初始值I,它代表了某种用户喜爱的属性。然后根据选择关系,把项目节点上的初始值按照一定的方式传递给用户节点。最后,计算所有用户节点获得的分配值,并把它们按照同样的传递方式返回给项目节点,通过计算,每个项目节点最终都获得了一定的代表目标用户喜爱特性的属性值。在这里热量传递的方式为每个节点所得到的所有相连节点分配给它的值的和除以这个节点的度。热传导的实现过程如图2.3所示。1.设某项目op的初始资源为f(op)0,经过这一步传递,用户ui接收到的资源f(ui)等于与其相连的所有项目资源的平均值,其计算公式如下:2.流向用户集的资源再反馈

12、给项目集,项目op分配到的资源f(op)为与其相连的所有产品拥有资源的平均值,其计算公式如下:图2.3 热传导过程实例1LOREM IPSUM DOLOR3优点:(1)不拘于推荐内容:算法通过二部图网络上的选择关系来实现算法对用户的推荐,并不考虑节点中项目的内容类型。只要节点之间存在选择关系,就可以在网络中实施推荐过程,因此算法较基于内容的推荐可应用的场景更加丰富。(2)重视推荐多样性:在热传导算法中,多样性的体现尤甚。二部图网络的结构优势决定了它可以对算法的准确性和多样性兼而得之,大大提高了系统推荐冷门项目的能力,算法也因此受到了更为广泛的关注。缺点:(1)存在冷启动问题:本算法的计算过程是围绕着二部图网络进行的。当有新的节点加入系统时,由于缺少选择记录,在二部图结构中尚未存在新节点与其他节点的连边,因此节点上的传递值也无法扩散到新节点当中,因而无法对其产生推荐,即出现冷启动问题。(2)关联强度过大:在本章提出的算法中,对初始资源均等地赋值为1,这不利于区分项目的受喜爱程度;同时在资源值传递时亦选择等分的传递方式,致使在经过一段时间的传递后,节点间的资源值有所增强,关联程度有所升高,这会导致算法精度的下降,也降低了算法的多样性效果。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(基于二部图网络的个性化推荐系统课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|