开始大数据的学习已经两周了,因为有热度的加持,比想象的进度要快些。基本学习的内容如下:
向量,矩阵,数组,数据框等基本概念
绘图等基本命令,包括各种类型图,如直方图,散点图,学会调整部分参数
引入图形文件(包括excel,txt,png等)
根据数据做线性回归的初步分析
具体计划及实践如下图:
总《R语言实战》我自己觉得,对于初入门者并不是一本很friendly的书。因为对于小白来说,语言比较少,案例比较精简,一个例子就罗列了n多参数列表。让我想起当时学习autocad和ps的书。好在其实只要掌握其中的50%,甚至30%就可以开始干实际的活了。
《深入浅出统计学》这本书很好看,我觉得对于初入门的外行而言,要理解概率,线性回归,方差等,用这本书的深度就够了。其实很基本的线性回归,就是y=ax+b,我们初中就学过的方程,不要把它看得太可怕,能理解多少就理解多少,能怎么理解就怎么理解。看不懂数学课本,那就看漫画书好了,反正又没有老师管。据说《漫画统计学》也很推荐。
视频部分也完成的不错,我看了两个视频,一个是c学院的R语言视频,只有15节课,而且老师算是翻来覆去的讲,但很适合我这种小白。
笔记,我连很简单的步骤或者函数都要记一下,不然真的不会。
然后看了群友放在网上的《数据分析与r语言》,这个视频更为系统,讲的也很好。不过用的书是薛毅的《统计建模与R软件》,统计理论部分很枯燥,充满了正经的数学公式,我个人觉得可以略过不看,不要折磨自己了。
几个路径一起学的好处是能多方面的理解一个概念,举例可以比较多,另外有作业可以练习。我自己比较每天喜欢做一两道习题,检验自己所学。常常是看着好像明白,自己做的时候就绕不过来了。做题可以逼着自己深刻思考一下。
还是满花时间的,还好是趁着热乎劲儿自己的动力也比较足比较主动,时间花费统计如下:
《R语言实战》:40分钟(每天几页的信息量都感觉很大)
《深入浅出统计学》:20分钟
视频:一小时
作业:半小时
可能我本来的工作就有看excel表,和用图形表示数据的内容,所以有些地方还是可以理解,甚至感觉“原来这个表可以这么看”。
希望下面的目标:
step1.利用春节假期,继续坚持学习计划,上一点儿强度。
step2.节后进行实践,用行业统计表格和数据进行分析。
step3.顺利展开SQL的学习
去年年底,上郑伊廷老师的元学习课时,当时编程于我而言还是完全另一个世界,是她的几句话让我觉得,学习还可以这样学:
“不求掌握概念”,“不求全部理解”,“不求从基础原理理解”,还有一条:
“必须题海战术”,配合大脑左右脑模式,把新东西带到记忆中,不懂的先背下来,甚至先copy下来,再去理解。
还是她说的:不要脸,不要完美,不要扎实。是啊,反正我就用来数据分析,加上行业的背景,只要懂得20%的大数据知识,就已经很有用了。关键还是践行。
最后要多谢猴子老师和大数据群友的支持和指点,希望我能多多进步,有所回馈。