《利用Python进行数据分析》这本书在我目前看来是一本工具性质的书,没有具体讲如何进行数据分析,主要做着重于如果用Python做数据分析,目前你可以用到的哪些工具。因此,当我看这本的时候每天也就花了1个小时不到的时候,通过幕布整理了一些常用功能,而熟练掌握这些工具则是在下一周学习理论基础后,通过数据进行练手的时候进行。
以下内容是我认为比较重要的知识点,
- numpy的ndarray对象,将同质数据存放到内存的相近区域加速运算
- pandas的DataFrame的索引操作,如何熟练选择自己需要的区域
- pandas的层次索引
- pandas的分组运算思想
- matplotlib类似于R语言的grid基本库,为后续开发提供了API
时间序列部分,我就简单看了一下,比较重要的就是时间序列的划窗相关函数。
阅读的时候,我每章都在幕布上做了一些记录,帮助自己回忆知识点。
幕布地址: https://mubu.com/doc/3F9fCuHhs0