一、基本思想
基于人口统计学的推荐应该算是最容易实现的推荐算法。该算法仅使用用户的基本信息,比如年龄、性别等,衡量用户的相似性,将与当前用户相似的用户所偏好的物品推荐给当前用户。
二、举例说明
我们以下图为例进行简要说明。
用户A是名女性,年龄介于20~25岁,偏好物品A;用户B是名男性,年龄介于40~45岁,偏好物品B、物品C;用户C是名女性,年龄介于 20~25岁;我们已为每位用户建立了profile(用户画像),现在我们要给用户C进行推荐。基于profile和合适的距离度量计算用户的相似度, 我们发现用户A与用户C最相似,可将用户A偏好的物品A推荐给用户C。
三、优缺点分析
优点
该推荐算法仅使用用户的基本信息数据,不涉及到用户对物品的历史偏好数据,所以对于新用户来说,只要有他(她)的基本信息就可以进行推荐,不存在“冷启动”问题;
该推荐算法在不同的物品领域都可以使用,因为它不依赖于物品信息,可称为“领域独立”;
缺点
该推荐算法目前仅基于用户的基本信息,比较粗糙;在一些对品味要求比较高的领域,比如音乐、电影等,不能得到很好的推荐效果;
用户的基本信息不好获取,比如年龄等;在某些情况下,用户的基本信息也需要通过建模获取;