题目:AIR: Attentional Intention-Aware Recommender Systems
AIR:注意意图意识推荐系统
摘要-如今,从用户与项目交互数据中提取顺序模式的能力已成为推荐系统的关键特征。 尽管捕获顺序效果很重要,但是现有方法仅专注于对用户偏好中的稀疏逐项顺序效果进行建模,并且仅考虑同类的用户交互行为(即,一种类型的用户行为)。 结果,不可避免地出现数据稀疏性问题,并使学习的顺序模式脆弱且不可靠,从而阻碍了现有方法的顺序推荐性能。 因此,在本文中,我们提出了AIR,即注意意图感知推荐系统,以预测按类别划分的未来用户意图,并共同利用丰富的各种各样用户交互行为(即多种类型的用户行为)。 在AIR中,我们建议将用户意图表示为一个动作类别元组,以发现按类别排列的顺序模式并捕获不同类型动作的不同效果以进行推荐。 提出了一种新颖的注意递归神经网络(ARNN),用于建模意向迁移效果并推断用户的未来意向。 此外,开发了意图感知分解机(ITFM)以执行意图感知顺序推荐。 在两个真实的数据集上进行的实验证明了AIR在连续的top-k推荐任务中的优越性和实用性。
介绍
推荐系统已经向在线服务平台和普通用户展示了其强大的优势,因为它们可以使用户更轻松地访问首选资源,并帮助服务提供商更好地了解其客户。
在top-k推荐的背景下,目标是推荐用户可能在不久的将来与之交互的k个项目,采用矩阵分解[1],[2]和分解机[3],[4]之类的方法 假设用户偏好是静态的,则在top-k推荐中获得了巨大成功。 但是,尽管用户和项的数量都随着时间呈指数增长,但如今研究数据连续top-k推荐的问题更为实际,因为数据动态在推荐器系统中起着关键作用。
与常规的top-k推荐不同,顺序的top-k推荐方法将用户行为建模为一系列项目而不是一组项目[5]。 为了捕获用户-项目交互的顺序依赖性,已经开发了基于马尔可夫链(MC)和递归神经网络(RNN)的推荐技术。 基于MC的方法[6] – [8]通过学习商品的过渡图来建模顺序的用户交互,该图用于预测用户的下一个感兴趣的商品。 尽管据报道它们实现了良好的性能,但是这些方法往往无法捕获复杂场景的复杂动态[9],并且缺乏用于用户和项目建模的足够表示能力。 最近,随着RNN在诸如机器翻译[10]和销售预测[11]等广泛的序列建模任务中的成功,基于RNN的模型引起了许多顺序推荐研究人员的关注[12] – [15]。 例如,RNN能够从序列中学习深度表示,已被证明可用于基于顺序会话的推荐任务[12]。 此外,[13]指出用户和物品的特性都随时间变化,并且设计了双RNN方案来并行捕获用户和物品(或者说商品)的动态,以进行电影推荐。
但是,为了确保模型的表达能力,深度神经网络需要大规模且密集的训练数据[9],因此当可观察到的用户偏好信息非常稀疏时,很难完全概括。 稀疏性的一个主要原因是,在现有方法中研究的用户偏好是逐项而非分类的(即,他们直接对用户-商品对进行建模)(PS:都是用户-商品这种键值对的进行建模的)。 在我们的评估数据集天猫(请参阅第VI-A节)中,有超过1亿种可能的“用户-商品”交互,其中仅观察到0.1%,可用于推断此类逐项用户偏爱。 由于大量的项目和极端的数据稀疏性,学习到的项目-项目(item-toitem)顺序模式不可避免地不可靠且不稳定。
为了解决数据稀疏性问题,一个有前途的想法是集中于类别级别的用户(category-level user)交互数据并学习按类别的顺序模式(category-wise sequential patterns),这可以显着缩小预测空间,并允许基于RNN的模型通过更密集的数据充分发挥其优势。 例如,在顺序设置下,用户可以在购买新手机后考虑购买手机壳。 从特定的手机迁移到特定的手机壳(例如,从iPhone X太空灰迁移到iPhone X的Louis Vuitton手机壳)往往是微妙和不稳定的,但从类别到类别的一般迁移(例如,从手机到手机) 案例)为推荐系统提供了更可靠和稳定的顺序模式。故而,忽略类别交互会为从序列中学习有用的模式以及捕获用户动态以进行连续的前k个推荐造成困难。
PS:类别到类别(手机-手机壳而非个体到个体例如iPhoneX-iPhoneX手机壳)的迁移很重要
另外,大多数有关顺序推荐的现有方法仅关注同类用户交互行为。 然而,关于单一类型的用户行为/动作(例如,购买)的用户交互数据极为罕见且稀疏,因此必须共同利用丰富的各种各样的行为数据来增强顺序推荐。 例如,在典型的电子商务平台(例如,亚马逊或天猫)中,至少有四种类型的用户操作:点击,添加到购物车,添加到收藏夹和购买。 为了预测用户接下来将购买什么产品,不仅要注意用户先前购买的产品,而且还要注意该用户过去添加到收藏夹列表中的产品可能会有所帮助。 此外,不同类型的用户操作暗示着不同的语义,并且对最终推荐具有不同的贡献。 例如,购物车操作比点击操作为用户购买行为预测提供了更强的信号。 利用各种用户行为/动作类型之间的顺序关联并捕获其对用户决策过程的各种影响,无疑是最具挑战性的。
PS:合理利用用户的多种交互行为,如:点击,增添到购物车,加入收藏夹。
鉴于前面连续k推荐中的上述挑战,我们建议在本文中对类别用户意图(category-wise user)而不是逐项用户(item-wise user)偏好进行建模。 具体来说,我们将用户意图表示为操作类型(例如,点击,购买等)和产品类别标签(即(操作,类别))的元组。 直观上,用户意图包含两个方面的信息:用户倾向于与之交互的产品类别; 以及用户想要进行交互的方式,这表明了意愿的强度。
例如:不同的交互方式,收藏和购买表明用户的意愿强度是不同的。
此外,与建模用户在商品上的偏好动态变化(即项目级顺序影响)相反,我们调查了用户意图迁移,该意图集中于针对顺序依赖项学习的类别用户需求动态。
PS:从item级别上升到category级别。(从iPhone上升到手机)
为此,我们开发了AIR,即Attentional IntentionAware推荐系统,作为顺序topk推荐的解决方案。 AIR的工作流程包括两个主要阶段。 首先,我们设计一个注意力循环神经网络(ARNN),以根据历史预测未来的用户意图; 然后,提出了一种新颖的意图感知时间因子分解机(ITFM),作为基于用户意图感知的top-k项目推荐的成对评分功能。 通过从用户交易数据中得出一系列用户意图,我们建议首先预测需要哪种类型的物品,然后相应地向每个用户推荐确切的物品。 与现有方法相比,我们的方法的明显优势在于:(1)尽管由于复杂的现实情况(例如促销),用户对精确项目的及时偏好具有很大的随机性,但其类别意图反映了用户的内在需求。 倾向于表现出更强的顺序依赖性; (2)在为用户推荐确切的商品时,正确预测的用户意图实际上将重点更多地放在了偏好的商品类别上,从而提高推荐效果。
总而言之,我们的研究的主要贡献是:
• 我们指出,按类别建模用户意图并联合利用丰富的各种各样的用户交互行为是解决连续top-k推荐中数据稀疏性问题的更有效方法。
• 我们提出了AIR,这是一种灵活而有效的模型,可以预测用户意图并以统一的方式对顺序数据进行意图感知的推荐。 在AIR中,我们开发了用于用户意图预测的ARNN,其中我们将新颖的注意力机制设计为意图迁移(intention migration)建模。 在对每个用户项目对进行前k个推荐时,我们建议ITFM捕获通过ARNN学习的动态用户意图模式。
• 我们对两个真实的数据集进行了广泛的实验。 结果显示了我们的方法贼厉害贼好,SOTA。
• 我们通过消融测试和可视化验证了AIR中每个组件的贡献。 进一步的实验表明AIR具有广阔的实用性和可扩展性。