以下内容纯属个人见解,欢迎大家交流。
发布于2020 SIGIR
1.motivation
1.1问题
研究人员已经开始利用异构知识图(KGs)作为推荐系统中的辅助信息,以缓解冷启动和稀疏性问题。但是,利用图表神经网络(GNN)捕获信息的KG和进一步在推荐系统中应用仍然是有问题的,因为它不能看到每个项目的属性从多个角度。
1.2 解决方法
为了解决这些问题,我们提出了一种基于gnn的推荐模型——多视图项目网络(multi-view item network, MVIN)从用户和实体的独特混合视图描述项目角度。MVIN从两个用户视图学习项表示实体视图。
从用户视图来看,面向用户的模块根据包含用户点击信息的KG实体对特性进行评分和聚合,从而从个性化的角度提出建议。从实体视图来看,混合层对比各层的GCN信息,进一步从KG内部实体-实体交互中获得综合特征。
2. 相关介绍
假设一些用户对同一作者的图书感兴趣,而其他用户对某种图书类型感兴趣,其中作者和类型是图书与其知识库中的邻居(作者、类型)之间的两种关系。我们可以说,在现实世界中,每个用户对给定的商品都有不同的视图。在实体视图中,项目表示由KG中与之连接的实体定义。一个复杂的表征可以通过合并实体的智能操作而产生。例如,本文利用分层的整块差异来改进它,使其不受邻域实体的影响。
为了丰富用户与实体的交互,我们首先学习kg增强的用户表示,使用面向用户的模块来描述关系和信息对每个实体的重要性。为了细化实体-实体的交互,我们提出了一个混合层来进一步改进由GCN聚合的实体的嵌入,并允许MVIN从不同的层邻域特征中捕获混合的GCN信息。此外,为了保持计算效率和接近整个邻域的全景,我们采用分期策略和采样策略来更好地利用KG信息。
3. model
3.1 符合定义
用户和物品分别定义为
三元组为
3.2 User-Entity Interaction
3.2.1 User-Oriented Relation Attention
当MVIN从KG中给定商品的邻域收集信息时,它会以用户特有的方式为该商品的每个关系打分。所提出的面向用户的关系注意机制利用给定用户、产品和关系的信息来确定连接到该产品的哪个邻居信息更丰富。因此,邻域的每个实体都被依赖分数加权,表示从实体到相邻实体的关系。我们聚合加权邻域实体嵌入,并生成最终面向用户的邻域信息为
3.2.2 User-Oriented Entity Projection
对于不同的用户,KG实体应该有不同的信息量来描述其属性。实体投影机制通过将每个实体投影到用户透视图u来细化实体嵌入,公式包含线性和非线性,如下:
面向用户的实体投影模块可以看作是增加用户实体交互的早期层。然后,面向用户的关系注意模块以用户特有的方式聚合邻近信息。
3.2.3 KG-Enhanced User Representation
为了提高前几节中接收到的面向用户的信息的质量,我们根据包含用户单击信息的KG实体来丰富用户表示。从KG中获取用户偏好信息需要咨询KG中所有相关实体,实体之间的联系可以帮助我们找到潜在的用户兴趣。用户兴趣的提取符合所提出的面向用户的模块;在用户的心目中,著名演员的图标不仅是由他们看过的电影定义的,而且还由用户可能感兴趣的kg中的电影定义的。
在此基础上,用KG实体对用户表示进行建模,并通过KG增强的用户表示来增强面向用户的信息。整体流程如图所示,算法1所示
Preference Set
用户交互过的物品集合为
用这些物品作为起点,探索偏好集。
Preference Propagation
首先,我们在hop-0定义用户首选项响应。
第二,在hop-p,其中p > 0,用户偏好响应,计算为对应关联概率加权后的尾的和。
在整合所有用户偏好响应
3.3 Entity-Entity Interaction
在实体-实体交互中,我们提出了层混合,并着重于捕获高阶连通性和分层混合信息。我们分别从深度和广度来介绍这两个方面;结合3.2节中提到的方法,整个过程如算法2所示。
对于深度,我们整合面向用户的信息如3.2节所述,收益高阶连接信息来生成实体
利用分层的实体宽度差异,允许不同级别]实体之间的比较,我们混合了不同距离的邻居的特征表示,以进一步提高后续推荐的性能。具体地说,在每一层,我们利用层矩阵混合分层的GCN信息
4. 学习方法
损失函数为:
采用交叉熵损失函数,
4.1 固定大小采样
在真实世界的知识图中,N的大小变化很大。此外,可能随着hop数量增长过快。为了保持计算效率,我们采用固定大小的策略,并对3.2节中的实体集进行采样。对于每个实体均匀采样一个领域,其中,对于hop-p,。
4.2 Stage-wise Training
为了解决固定大小的采样策略可能会限制所有实体的使用,最近提出了分段训练的方法,从KG中收集更多的实体关系,以接近整个邻域的全景。具体地说,在每个阶段,阶段式训练将重新取样另一组实体,以允许MVIN从KG收集更多的实体信息。分段训练的整个算法如算法3 (Line11)所示。
5.结果
for ML-1M; for LFM-1b; for AZ-book;
此外,为了验证个模块对作用,进行了灼烧实验,分别是user-oriented relation attention
再对