这本书是一本比较奇妙的书。
好比你想要参加铁人三项,先找一本入门的书来看一看。于是找到一本书,里面介绍了铁人三项有哪些运动,其中每种运动都做了入门的介绍,包括如何学习游泳,如何选择自行车,怎样练习马拉松。按照这本书,不考虑体能原因,至少可以完成铁人三项。但是想做好,每一项上都要额外去下苦功。
这本书也类似,基本讲解了全栈数据所需要的一些技能的入门级知识,甚至包括了安装、常用命令的介绍等,比如linux的grep、sed命令,python的安装和基本语法,emac的快捷键,机器学习的基本算法原理,hive的安装使用,分布式计算的环境搭建,机器间通讯证书的使用方法。。。所以也像作者所说,这本书是介绍入门。
如果真心想进入大数据领域,看起来按照本书完全走一遍会有不小的收获(之所以“看起来”,是因为我自己并没有这个时间和精力来真正做一遍;实际上还是投入的热情不够)。至少可以让你运行起来一个大数据的环境,对于整体的掌握是很有好处的。
但是想要进一步,还要个人再去自行分项修行了。尤其是统计学。我在读统计学的书时也这样想:数据本身是没有实际意义的,有人提出了统计分析的方法并得出结果,才使得数据有意义。
对于第一次接触大数据概念的人来说,这是值得一读的书。如果我未来有足够的兴趣或者工作上的要求,我或许会把这本书再看一遍,并且完全实现一次,而不是像这一次这样只是浏览而已。