车品觉老师在其决战大数据一书中,强调的更多的是一种数据思考方式,书中范例介绍的小偷思维、先开枪后瞄准、CEO关注的三个问题等,都属于数据思考方式重构解决问题的过程。
全书从为什么大数据说起来容易做起来难出发,以大数据构建未来商业利器结束,总共花费了11个章节,中间穿插着其在阿里的数据实践经验,本人结合自己的读书体会,特将其总结归纳为以下50条:
1、大数据从来都不是免费的午餐,因为数据来源渠道的宽泛,难免出现偏倚误差
2、人的断层是是大数据应用面临最严重的问题,这个断层包括沟通的断层、建模的断层,譬如现在收集数据的人不知道未来使用数据的人要什么?创建模型的人不知道未来数据是否稳定,使用模型的人不知道数据的来龙去脉。
3、从数据化运营到运营数据,是从看到用的过程。这个过程需要主动管理,需要更多的创新,需要学会问问题,问问题的过程就是寻找答案的过程,好的问题就是答案。
4、从商业角度讲,大数据的本质就是还原用户的真实需求
5、数据价值的如何判定?首先看这个数据与你的目标是否一致,对你的价值是什么?其次看这个数据能否清楚的识别用户身份,以及反应出的对应的场景。
6、学会双向思考,关于数据的价值,对于企业而言,是实现企业资源的合理分配,而对于用户而言,则是对用户体验的提升改进,比如个性化的推荐系统就基于此。
7、场景与还原并行,前端还原为消费者场景,后端还原为业务需求。
8、数据的本质是还原,落地可能表现为收集元数据的方法,个人建议初期引入最小数据集的概念。
9、关于数据还原可以从两方面理解:①对人的行为目的的还原;②对制造原始信息的人的朔源。
10、活的数据才是大数据,这里的活主要从两方面考量:一是灵活收集数据,抓相关性,比如我们的克强指数;二是灵活动态的数据指标,动态的使用数据,将数据场景化。
11、移动互联网时代,无线数据将是大数据的“颠覆者”。这个颠覆主要指无线数据的加入将原有数据的噪音加大,无线数据与原有PC数据的关系处理等。
12、无线数据分为wap和app两种,而APP的数据收集方式又有两种:①收集用户联网时请求服务器的记录②用户行为记录
13、APP对用户的识别主要基于手机的机器码,而机器码在不同系统中也有差异,差异体现在操作系统本身的差异和操作系统版本的差异。
14、保证PC和无线两份数据的完整,通过用户体系将两份数据关联起来,就可以在分析过程中用彼此的融合来还原用户的行为,所以用户体系的建设在多屏时代尤为重要。
15、关于数据价值,从数据的角度讲,估值就是通过不同的纬度去思考数据的价值。
16、数据作为一种资产,不同的数据含金量必然不同,自然就会产生不同的价值,与此同时,同样的数据在不同环境中也会呈现出不同的价值。
17、数据的四种分类:①可再生与不可再生数据;②基础层、中间层、应用层数据;③不同数据主体对应的主体数据;④隐私与非隐私数据。
18、数据的五种价值:①串联与识别价值;②描述价值;③时间价值;④预测价值;⑤产出数据价值。
19、数据分类与数据价值的意义,主要还是体现在数据产品的建立上,其应用思想体现在基础层-中间层-应用层上。
20、基础层收集那些数据,如何收集,如何保存等;中间层涉及数据管理与数据框架的搭建,应用层则是八仙过海各显神通。
21、数据收集的出发点是解决问题,此外数据的生命周期、收集背景都须注意。
22、用数据是一种方法论,养数据则是一种数据战略,是基于更深的商业解释的商业决策。
23、跳出固有思维圈,从旁观者角度出发,跳出0或1的选择,我们可以有第三种选择。
24、数据应用应该是小而美,而不是大而全。小而美指目标简单具体。
25、如何利用数据框架做决策,简单四步告诉你:①确定问题,从解决问题的角度去收集数据;②整理数据放在一个框架内;③看框架与决策的关系;④根据决策行动,检查是否达到目的。
26、数据的盲点分为物理盲点和逻辑盲点,物理盲点是我不知道的,逻辑盲点是我知道但没被挖掘的。
27、数据也有正负能量,正能量的数据告诉你如何成功,负能量的数据告诉你如何避免失败。
28、是否看到数据盲点的核心价值是,有没有看到应该看到的数据,有没有错失不应该错失的数据。
29、数据运营中的常见问题:①堵,日常报表信息量大,难以铺捉有效信息;②独,信息分散在不同部门,缺少有效组合;③慢,业务异动的处理往往是自上而下的推动;④漏,关键分析成果取得实效,但未实现沉淀。
30、阿里的大数据实践一:数据化运营需要和商业咬合的非常紧密,所以数据也是混合在商业里,以假定稳定的方法去做业务上的对比、细分以及趋势预估。
31、阿里的大数据实践二:假定数据是稳定的,意味着习惯于不去寻找一些新数据,用数据拿数据的方法可以将数据化运营和运营数据打通。
32、阿里数据化运营的内三板斧之混:混出数据,只有具备商业敏感的分析师,才懂得使用什么数据来驱动公司实现经营目标,数据部的人和业务部的人经常混在一起。
33、阿里数据化运营的内三板斧之通:打通混的数据,通是混、通、晒的关键节点,知道带着业务问题看数据或带着数据看业务,这就是通。
34、阿里数据化运营的内三板斧之晒:晒出混和通的数据,数据能不能做到获取、使用、分享、协调、链接、组合之上,让自己变得超级简单和便捷,这是数据化管理运营中非常重要的一点。
35、数据化运营需要有框架可依,做到如何证明业务是好还是不好,而这里的框架就是一个对业务进行指标化的分解,并通过有限多个指标来客观描述业务的状况。
36、阿里运营数据的外三板斧之存:存是数据收集的开始,收集数据不是目的,让收集起来的数据如何产生价值才是最终目的。
37、阿里运营数据的外三板斧之管:管是保护好存储数据,学会用数据产品来解决获取以及使用数据的问题。
38、阿里运营数据的外三板斧之用:用是从收集数据到管理数据,在用数据的问题上,数据的分裂和重组,都能做到颠覆性的创新。
39、数据思维之MECE法则,不断地用逻辑方法将问题进行分解,直到不能分解为止,然后从根本去解决问题。
40、大数据的本质是人,数据研究的极点就是揣测变幻莫测的人性。
41、假定数据是脏的,在处理数据的时候,会像污水处理厂一样,每一步都问自己几个为什么。这种情况的出现,到底是因为数据脏了还是因为数据提验过程中做的不好。
42、做好数据的质量评分,从反映数据的可信度和质量水平出发。
43、学会慢慢的淡化数据,数据是有优先级的,在数据中有些是特别核心的,有些即使缺失了也没问题,所以,我们要学会真正坐下来盘点那些对公司最有价值,对用户最有价值的数据。
44、数据的标签化管理,数据的属性标签是人类经验判断的数据,是数据后的数据。
45、大数据价值的实现在于数据与数据之间的连接。
46、数据的实时化和实时性分层,我们千万不要把所有能力都用来处理实时化的问题,因为我们依然会有大量的数据需要在恰当的时机处理,有的数据是重要的,但并不紧急。
47、关于数据,未来是人机的结合体。人和机器的结合,或者人和数据的结合将是未来的一种进步模式,人类将通过数据变得更加智能。
48、未来,人身体中流通的不仅是血液,还有数据。
49、关于数据分析,更准确的说法应该是信息分析,目的是寻找短板,这个短板可能是自己的,也可能是竞争对手的。
50、我们都说数据分析是指导决策的重要依据,但我们用什么来保证分析的正确呢?是不断的试错还是考验我们数据分析师(科学家)分析和利用信息的能力。