主讲:陈丹奕
撰写第一份数据分析报告
展示数据收集、处理的能力,逻辑思维框架,数据可视化,行业业务理解的能力
数据报告的制作过程
需求层、数据层、分析层、输出层
普通难度
目标确定 数据获取 数据清洗 数据整理 描述分析 洞察结论 报告撰写
目标确定
选择熟悉感兴趣的领域行业
选择范围比较小的细分领域行业作为切入点
确定这个领域行业有公开发表的数据,可以获取的ugc内容
构建报告故事线,常用结果是“总分总”
数据获取
数据来源 内部数据和外部数据
内部数据可以直接获取,已有原始资料需整理,需要进行收集
外部数据包括一般手段收集、技术手段收集、合作、纯购买
数据清洗
数据清洗是分析流程最重要的部分,占分析项目时间的60%以上
数据清洗路径
预处理
去除/补全有缺失的数据
去除修改格式和内容错误的数据
去除逻辑错误的数据
去除不需要的数据
关联性验证
数据计算 对数据表进行统计计算,生成各级指标
描述分析:变化 分布 对比 预测
数据建模
考虑线性回归和聚类模型