现象、符号、数据、信息:现象即我们所见;符号是数据呈现的载体,是数据传递的工具;数据即符号代表的含义,即对现象的描述;信息即数据描述的现象;
数据分类(动态数据:状态数据 / 静态数据:属性数据、行为数据):①属性数据(用来描述一件事物或人的数据表达;例如,杯子的颜色、硬度、大小等,都是确定某个值来描述眼下的这个杯子);②状态数据(描述当前时间节点的状态,或者说描述一个行为产生的结果,在分析该数据时,你要分清该物有哪些状态,状态之间可以通过哪些行为进行切换,状态数据是动态的,可能发生改变,当发生某种特定的行为时,该数据将会发生变化;例如货物的状态(这里不是库存量,库存为二级数据),开关的状态等);③行为数据(描述一个已经发生的行为,例如后台记录的操作记录、购买商品记录、浏览历史等);
属性数据、行为数据、状态数据均为基础数据或底层数据,当将基础数据进行计算后,得到二级数据;
数据层级(数据的产生):有些数据是根据基础数据汇总计算得来的;比如一个企业分为多个部门,每个部门的人数可以看成基础数据,而全公司的人员是通过将所有部门的人员相加所得,所以全公司人员为二级数据,而部门人员为基础数据;基础数据是通过搜集或调研得到,而上级数据是根据基础数据的计算得到;二级数据或三级数据通常是做分析使用,基础数据在业务中被使用(核心思想参考指标树、杜邦模型);
数据层级(数据的流动):流入企业的一手数据,或在企业中产生的数据称为“底层数据”,通过对底层数据加工所得的新数据,称为次级数据;数据在企业内的流转根据业务流程来;在分析数据流时,需要明确数据的产出者与使用者,产出必定为一处,即数出一处,而使用可有多处;
数据的生产者、所有者、消费者:在考虑数据时,梳理清楚数据生产者、管理者、消费者三者之间的关系,生产者必只有一处、管理者视情况而定,可能分布存储或集中存储、消费者是最不固定的;在数据库中,对应的是数据的产生与写入、数据的存储与管理、数据的提取与分析;
数据分析思维的核心是“关系”,发现两者之间的关系,关系分为定性与定量两种,数据分析;更多是挖掘数据的相关性,而非因果