Spotify的交互式推荐系统

今天看了一个Recsys2015讲交互式RS的slide,感觉我们可以借鉴。所以又看了两篇Spotify RS的文章,与slide的内容一起整理如下。

一、产品形态

  1. 首先用户通过一位艺术家、专辑、歌曲、播放列表或是风格流派开启一个radio。

  2. 接着用户通过thumbs表达自己对歌曲的偏好,同时也是在tune推荐系统。推荐系统会根据thumbs的正负反馈,实时调整推荐结果。

二、整体数据流

Step1:训练各种推荐模型

歌曲和电影的区别:

  • 数量级:电影6w;歌曲2000w。
  • 歌曲可以被同一用户重复消费。
  • song is more niche.

Implicit Matrix Factorization

  • 把所有(user, track)数据组成一个矩阵。
  • 目标:最小化两个小矩阵内积与binary偏好矩阵的带权RMSE。权重由一个包含了播放行为、上下文和新颖度的函数给出。

其中如果用户u对歌曲i有行为则p_ui=1,否则p_ui=0。
c_ui=1+alpha * r_ui

或者

  • 目标:假设用户播放一个歌曲的概率是logistic,然后最大化偏好矩阵的log likelihood。其中同样要对正反馈加权。

通常用ALS来求解。得到两个小矩阵a、b后,用户u对歌曲i的偏好就是:



歌曲i与歌曲j的相似度为:


Spotiy开源了找近似最近邻的工具:https://github.com/spotify/annoy

NLP models on News, Blogs, and Text

Distributed Representations of Words and Phrases and their Compositionality: http://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf

Deep Learning on Audio

协同过滤模型会把用户和歌曲分别映射到低维的隐空间里。歌曲在隐空间中的位置,相当于反应收听偏好的各种信息的编码。如果两个歌曲在隐空间中距离较近,说明它们可能比较相似。如果一个歌曲与用户的距离较近,它可能就是这个用户的一个好的推荐结果。如果我们能预测一个歌曲在隐空间中的位置,就可以把他推荐给合适的用户,并且不需要它的历史行为数据。

这里是用了CNN把音频信号回归到CF的隐向量。和做图片预测有很多不一样的地方,具体见这个博客:http://benanne.github.io/2014/08/05/spotify-cnns.html

Step2:用thumbs数据组合多种模型

Step3:自适应个性化

给定用户u, Station S,在t时刻选择歌曲i的概率:


其中,
rank(i, S)是歌曲库中的全局排序,
rel(u, i)是根据CF向量得到的用户商品相关性
thumb(u, i)是根据thumb得到的用户商品相关性
div(u, i, t)表示session中艺术家与专辑的多样性

Step4:把thumbs反馈引入组合模型

三、见解

用户角度

  • 交互式RS在产品中的布局很重要
    • 要把浏览和搜索行为自然的过渡到交互行为
  • 交互式RS要尽可能做到轻量级
    • 用户偏爱lean-back的体验
    • 交互意味着要尽快帮用户找到最优item
    • 推荐解释可以建立信任和透明性
  • 选择
    • 多少输入合适
    • 多少返回结果合适

算法角度

  • 在交互系统的不同阶段需要平衡流行性相关性多样性
  • 实时打分 vs 离线推荐结果计算

引用

InteractiveRecommender Systems, Recsys2015

Hu Y. & Koren Y. & Volinsky C. (2008) Collaborative Filtering for Implicit Feedback Datasets 8th IEEE International Conference on Data Mining

Johnson C. (2014) Logistic Matrix Factorization for Implicit Feedback Data NIPS Workshop on Distributed Matrix Computations

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,045评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,114评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,120评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,902评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,828评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,132评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,590评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,258评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,408评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,335评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,385评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,068评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,660评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,747评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,967评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,406评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,970评论 2 341

推荐阅读更多精彩内容