亚马逊前科学家Greg Linden曾在个人博客里写道,从亚马逊离职的时候,亚马逊已至少有20%的销售来自于推荐算法,并在其之后的博文里将这一数字更正为35%。而来源于亚马逊前首席科学家Andreas Weigend的另一组数据显示,亚马逊有20%~30%的销售来自于推荐系统。其确切数字虽未经官方证实,但推荐算法于亚马逊的重要地位于此可见一斑。
这恰好给予我们一个分析推荐系统的角度。究竟,怎样的推荐系统才能称之为好的推荐系统呢?
首先,这要从信息过载说起。
当互联网和通信技术,将信息的溪流汇聚为汪洋大海,如何帮用户快速找到想要的信息,以及如何将对的信息推荐给感兴趣的用户,便变得异常棘手。我们专门为这过盛的信息发明了一个词汇,叫做“信息过载”,以区别那个远去的“信息匮乏”时代。而信息过载所带来的,横亘在信息生产者与消费者之间的矛盾,便像一道天然的屏障,为“人找信息”和“信息找人”带来了诸多麻烦。
为此,我们曾一度试图利用类似Hao123的分类目录网站,对常用网址信息分门别类,以节省信息筛选用时。然而,随着信息的极度膨胀,分类网站仿佛再也不顶什么鸟用;于是,Google崛起了,继之是百度,然后所有存在信息过载问题的领域,基本上都开发了与之匹配的检索端口(如电商平台等);但是,这依然没能解决全部信息过载的问题(检索太过依赖基于用户经验的关键词输入,而对用户未知的领域不能提供实质的帮助),并成为推荐应运而生的肥沃土壤。
所以,一个好的推荐系统一定要能有效解决“信息过载”问题,让“人找信息”和“信息找人”都变得准确而高效。
其次,一个好的推荐系统,一定是基于个性化推荐的
所谓“无数据,不个性”,个性化推荐系统强度依赖用户行为数据,通过分析大量用户行为日志的方式,达到给不同用户提供不同个性化信息的目的。无论是电子商务、电影、社交 网络、阅读、基于位置的服务,还是广告领域,都无一例外地包含着“展示页面”、“后台日志系统”、“推荐算法系统”三个构成部分。
亚马逊的个性化推荐主要通过“个性化推荐列表”得以实现。它由“推荐结果”“结果评分”“推荐理由”三个模块组成。其中,“推荐结果”,由标题、图片、相关内容属性组成,用以概述产品的基本情况;“结果评分”,基于大部分用户对该图书的打分,用以评估该图书的总体质量;“推荐理由”,浓缩了用户正向的历史行为与该图书千丝万缕的联系(很可能,过去的你,对相似图书或同类图书曾表示过喜欢的倾向)为得到用户确切的偏好数据,亚马逊还在图书后面专门设置了“Fix this recommendation(修正这一推荐)”按钮,并附带了包 括Add to Cart(加入到购物车)、Add to Wish List(加入到心愿单) 、Rate this item(给书 打分)、 I own it(我已经有这本书了)和Not interested(对这本书没兴趣)等在内的五种修正方式。甚至在“推荐理由”最下端的“推荐原因”设置也是非常人性化的,借以让读者进一步看清其推荐的确切由来。
亚马逊的推荐系统,一方面采用了“基于物品”的推荐算法,即为用户推荐那些相似于他们过去所喜欢过的物品;另一方面采用了“基于好友”的推荐算法,即为用户推荐其Facebook好友所喜欢过的东西。
最后,一个好的推荐系统,也是一个相关推荐系统
这得益于亚马逊的“相关推荐列表”功能。
在用户购买商品的时候,通过告诉用户其他用户在购买该商品时也会购买的其他几个商品的方式,以达到打包营销目的。亚马逊的这一“打包销售”手段,堪称推荐算法的最重要应用,并被推而广之地内化为电子商务网站的标准应用。
“购买了这个商品的用户也经常购买的其他商品”和“含浏览过这个商品的用 户经常购买的其他商品”构成了“相关推荐列表”的两种方式。
亚马逊通过其成熟的推荐系统,给予每个进入网站的浏览者以不同的个性化体验,从而把一个庞大的图书帝国,拆分成一个个“精而美”的个人书店。