当我读到第一章的引言时就深深被作者“在大数据时代进行抽样分析就像在汽车时代骑马一样”的观点震撼到了。现在,我们仍然在学概率论,老师强调总体往往太多,我们需要抽取样本仔细研究,发现其特点和规律后推导出总体的特征。然而,时代的进步,科学技术的发展是日新月异的,在不知不觉中,大数据已经对我们的生活产生了潜移默化的影响,而我们身在其中却不自知。
抽样方法的提出只适用于那个技术落后的年代,科技的发展逐步把我们推向技术的制高点,大数据时代应运而生。我想作者写这本书的很大意义在于解除技术匮乏对我们思维的束缚,让我们有意识地去搜寻大数据进行研究,而不是在思维定式中故步自封,这样无法面对愈发神秘的世界。
书中首先对过去技术条件有限的情况下进行数据搜集的艰难做了描述,表明随机抽样是如何发展而来的,进而印证了作者观点:大数据时代是一种大变革。尽管随机采样不失为一种技术匮乏下的好方法,但这毕竟是一种“缓兵之计”。一但我们拥有更高水平的技术时,我们就需要大数据来支持更精确的研究。大数据中的“大”并不是顾名思义的大,而是全体的意思。既然要进行科学研究,就要有严谨的态度与方法,毫无疑问研究全体数据是更好的选择。
书中谈到DNA分析和乔布斯的案例让我想到现在日本的一种新型医疗技术,我觉得某种程度上是一种科学——一滴血测出一个人患某种癌症的倾向。也就是说,利用一滴血进行重组蛋白质大规模制备技术制备出热休克蛋白,这为医疗甚至人类进程上添了浓墨重彩的一笔,也是大数据时代为人类带来的福音。