随着大数据时代的到来,数据挖掘和分析从原来单调的技能栈开始走向多元化,很多excel可以胜任的工作开始变得力不从心,office2010以来,单sheet可以处理的行数从2的16次方(65536)变成了现在的2的20次方(1048576),但是面对动辄GB\TB乃至PB级别的数据,在很多情况下显得无能为力。
鉴于此,hadoop,hive,mysql,【R,SAS,Python,spss】均成为一个合格的数据分析师所必备的技能,而pandas则使得Python在数据分析领域中成为璀璨的一颗明星,笔者通读了pandas官方文档,结合自己的数据分析经验,对文档做了翻译工作,一方面加深自己的印象,一方面造福广大网友,也算是GNU精神的一种传承吧。
翻译计划如下:打算用10篇文章来完成 Python Cookbook的整体翻译工作,接下来会有10篇左右的博客来结合具体分析案例呈献给数据分析的同仁们。
闲言少叙,书归正传。