更新于2017年6月26日,在第二部分数据探索时,根据@Radon的建议,为了消除极值对结果的影响,在统计比例前去除了离群点(outliers)...
更新于2017年6月26日,在第二部分数据探索时,根据@Radon的建议,为了消除极值对结果的影响,在统计比例前去除了离群点(outliers)...
前言 为了找到最伤感的一首歌,我分析了王力宏,周杰伦,林俊杰和潘玮柏32万字歌词。 本项目受到《我分析了42万字歌词,就为了搞清楚民谣歌手们在唱...
注:1.本项目所有的代码均放在了我的GitHub上,戳我戳我进行访问。2. 感谢周同学的指点,补充了关于所属行业的分析以及调整了多项计数的方式。...
因为有同学反映英文版看得太心累,所以翻译了一下,如果有任何错误,欢迎指正。 英文版可以戳这里,后期可能会加上每个技能要求背后学习地址的链接。 总...
为了保证每周找点事做(争取每周写一篇),我决定对我最近在学习数据分析的某在线平台下手,研究分析下该平台收费课程的质量。我是一个在线学习重度爱好者...
最近小组作业在分析Ritz酒店的业绩变化,刚好做了简单的一幅图。 这幅图是反映了Ritz酒店从2005年到2016年的一个整体入住率表现。这张图...
前几天接触了一下pyspider,最近又在复习pandas,所以打算拿豆瓣的数据来练练手。 这次我的目标是分析一下豆瓣2016年国产影视剧的情况...
作为一个数据分析的新手,最近我也在kaggle上晃荡,不过主要是观摩大师以及寻找有趣的数据集的。这不,今天早上发现了一个星巴克的数据集,下载下来...
这几天在学数据视觉化,学到了d3.js和基于d3的dimple.js。Dimple.js虽然和d3比缺少了灵活性,但是上手比较简单,只要几行代码...
Ultimate Skill Checklist For Data Analyst Contents Programming Statistic...