我作为一个数学差的2B青年,十分渴望提高自己数据分析的能力,读了几章《深入浅出数据分析》感觉这本书是非常优秀的数据分析入门读物,接下来会在阅读的同时做笔记。
第一章 分解数据
数据分析的基本步骤为:
1确定问题:确定和了解问题。
2分解:数据分析就是分解问题和数据,使其成为更小的组成部分。
3评估:进一步对前两步了解到的情况作出各种结论。
4决策:把结论重新组合在一起,作出(建议)一个决策。
确定问题
要明确核心问题和目标,然后再进行分析。
除了运用图表阐述观点,同时需要解决问题和作出建议决策。
客户将帮助你确定问题,尽可能的从客户了解更多的信息,才能有助于确定问题。
分解(把问题和数据分解为更小的组块)
需要将问题划分为可管理、可解决的字块,问题常常是含糊不清的。
通过回答大问题分解出来的小问题,就可以找到大问题的答案。
进行有效的比较是数据分析的核心。
评估
评估组块的关键就是比较。
做出明确的假设,仔细阅读得到的数据和观察结果。
提出建议
作为数据分析师,需要让自己和客户仔细研究你的数据和评估,确保自己的意见传达到位,能简单则简单。
提交给客户的报告要以得到客户的理解,鼓励客户已数据为基础做出明智的决策为重点。
报告要简练、专业、直接了当。报告可按背景、数据解说、建议来撰写。
心智模型
心智模型会大大影响你对数据的解释。
所以要像对待数据一样严肃认真地对待心智模型。
统计模型取决于心智模型,你无法看到一切,因此你的大脑必须做出选择,以便集中注意力,这就是所谓的心智模型大大决定观察结果。
如果了解自己的心智模型,就会发现重点,开发最相关、最有用的统计模型。
统计模型取决于心智模型,如果用错了心智模型,分析就会胎死腹中。
而心智模型包括人们不了解的因素,一定要指出不确定因素,只要能明确不确定因素,就可以小心防范并想办法填补知识空白,继而提出更好的建议。
了解自己的知识缺陷非常重要。
原始数据
所获得的新数若未经任何处理,即称为原始数据,千万要保存原始数据,避免任何数据处理,必须能够将自己的工作结果与原始数据进行比较。
数据多往往是好现象,只需专注于目标即可。
深入挖掘数据
任务要明确,再进行深挖数据。
总结:这一章作者举了非常生动的例子,除了按照步骤去分析数据外,还要和自己的阴暗面斗争,即找到并坦白自己所不了解的知识,把他们罗列出来辅助分析,不让自己原有的心智模型影响客观分析。