今天来说一下2本书《走进内容推荐时代:写给内容行业从业者的推荐分发入门书》、《数据驱动:从方法到实践》
为什么两本书一起做评价?
两本书作者有相似的经历。
内容有一些共同点,用这个书评来整理一下。
最重要的是一个系统的书籍,两本书底层逻辑是关于大数据、算法的。
两本书的结构
从结构上来看,2本书很难建立关联,但
仔细读完里面的章节,会发现他们有很多相同的知识点。目前我思考出5个维度。欢迎大家补充。
5个维度上来看这2本书
1、算法大数据内容
算法会导致“信息茧房”,而好的算法可以提高业务指标(百度知道回答量提升7.5%案例),抛开信息本身,百度知道用于拓展新用户,用好的算法给新用户推荐他们有可能感兴趣的内容(在2007年这个思路还是很先进的)。优化算法>更精准的内容匹配>不断拓展边界,这也是平台、分发服务上要做的,在用户对信息对内容的现有诉求上,勇于探索其他机会点,而这个机会点随着数据量的丰富、内容的挖掘,会变得越来越有效。
2、平台视角——关于算法和推荐
由于作者背景,在这2本书中,他们用平台的视角在思考和写作。而这点对于没有在百度和今日头条经历的,在这本书中会领域到。
关于数据驱动决策
数据驱动这类是新概念,以前大家习惯叫做数据分析。桑的书籍中四个决策:产品改进、运营优化、营销分析、商业决策。
个性化的好,是生意。
好的个性化,是理想。
个性化的好,是不断追求数据指标。在技术水平不足以支撑目标的时候,就越来越容易围绕马斯洛需求模型的塔座转圈。所以,我们才看到网络上会有那么多调侃“××惊讶体”“××爱国体”的内容。
而好的个性化,是需要克制欲望的,需要引入更多维度的人工评估进行决策权衡,以可量化的短期指标损失来保证不能轻易量化的消费体验。
既然说到平台视角,我也在用户视角思考了下:
我一直用的统计类产品(百度统计)是用户视角,如何和这个平台视角结合起来呢?
作为国内第二批站长,第一批自媒体人员,从业中貌似缺少平台思维,没做好原因之一
3、数据驱动产品内容
提到大数据,肯定少不了数据驱动这一理念,神策作为一个提供数据服务的公司,数据驱动产品测,他们有不少案例,书中很大章节也在围绕数据驱动这个点展开,其核心理念是他们的几个模型:
行为事件分析
漏斗分析
留存分析
分布分析
点击分析
用户路径
用户分群
属性分析
闫在书中,也提到数据驱动产品、数据驱动内容的知识点。如平台侧如何通过大数据反馈优化分发规则,内容侧通过数据反馈来做规划(案例如下)
数据分析辅助内容创作在国外最典型的样本非BuzzFeed(一家美国新闻聚会网站)莫属了。员工总数逾千人,拥有全球新闻团队、自己的视频制作工作室、尖端数据运算中心和内部创意广告机构,每月全网超过50亿次阅读——这就是BuzzFeed,怎么看都是一个庞大的媒体集团。然而,当我们深入了解BuzzFeed的工作流程后就会发现,与其说它是一家媒体公司,不如说它是一家科技公司。“数据驱动内容创作”,是BuzzFeed给自己贴上的标签。
4、用户画像上的观点
内容画像、数据画像是大数据的本质。闫提到推荐的起点:断物识人,识人就是用户画像。
桑的书中更近一层:用户智能
5、两本书提到的分发
闫泽华的书中关于分发的内容随处可见,而桑文峰则是在个性化推荐系统的架构的角度上去说的。可以说了解分发的前因后果,把这2本书结合起来看会更好(本文只做重点提炼,后续会对这个维度单独写几篇感想)。
重点:以短视频推荐案例为例,我们通过神策分析对这个短视频产品的业务数据做了一些简单的分析,用于指导我们后续的策略研发。这些分析指标包括活跃用户量、视频量、视频平均播放次数、视频平均观看时长等。从这个分析中,我们得到了一个初步的结论,对比每日众多的活跃用户量,相当比例的视频的播放次数非常有限,为长尾冷门视频。因此,在进行个性化推荐时,我们会尝试激活其中的高质量视频,同时也会挖掘热门视频,吸引用户观看产生更多的行为,以便后续业务迭代升级。与此同时,在这个分析过程中,我们也确定了此次个性化推荐的评价体系,也是日后迭代优化的目标,即从视频平均观看时长、用户留存、视频播放CTR(Click★rough Rate,点击通过率)这几个指标来衡量。
这里提到一点:用户分群、还是内容分群,这就涉及到推荐分发的2个常见模型:
基于用户:
基于内容:
附录:
搜索引擎部分,虽然内容比较少。
自媒体的部分,暂做简单的提炼。