12月的学习目标:(1)SQL基础(《SQL必知必会》学习与上级实践)和(2)《商务与经济统计》前13章
12/23 完成(1)完成80%章节的快速浏览和上级实践 (2)前两章,特别跳看了F检验与ANNO方法
(1)《SQL必知必会》
MYSQL 作为最流行的一款关系型数据库DBMS, 是作为数据分析师入行的第一块敲门砖。因为所在行业一直没有实际操作的经验,只知道如何在Acess实施增删查改的基础操作,但在实际接触之后发现在Python中数据拆分,聚合重组,字符串查找索引实际上在MYSQL都可以轻松的实现,而且语句更为简练,查询速度更快,从数据采集的源头上就可以大大节约项目开发的进度。
MYSQL毕竟是做为数据仓库的管理工具,更多的重心应该放在查找,和更有效的查找上。因此,即使有SQL关于updata,delete,insert等数据操纵的封装工具,更多的学习中心应该放在以SELECT为中心的SQL语句以及效率化的方法上。
以下是一些总结笔记
(2)F检验与ANNO方法
因为面试中出现有关内容,回来仔细跳看了章节。最大的感受就是如何判断抽样样本来自的总体是否是兼容的,组间差异和组内差异是如何度量,偏差平方和与自由度,F分布与值是如何在置信区间应用的,假设检验的一般方法流程。在Python中生成不同正态分布的数列来模拟变异,尝试去理解生活中处理与参考样本的基础分析概念,确实是很有趣的体验,但还要花更多时间去体会。从下周下开始在ANNOVA,ANCOVA,MANNOVA花更多时间。