作者:Kay @VisIt有视没事
部分文章内容取材于:An overview of every Data Visualization course on the internet
原作者:David Venturi
国庆长假快到了,在休息娱乐之余,你是否也想趁难得的空闲时间给自己充充电呢?
亦或是你对数据可视化感兴趣已久,却不知从何学起?
小编 Kay 早就为大家准备好了一份整理自开源社区 Class Central 的数千条评分和评论的《在线数据可视化课程推荐清单》,赶紧收藏起来吧~
由于原清单整理于 2017 年三月,可能有一些新的课程没有被纳入,小编在该清单的基础上,精心筛选和补充了一部分课程,以满足不同的学习需求——无论你是否会编程,无论你是可视化小白还是老司机,无论你的应用场景是商业还是数据科学,这份超全清单都不容错过。
我们如何筛选课程
每个入选课程都满足以下三个条件:
- 该课程的大部分内容应侧重于解释性数据可视化(explanatory data visualization)。比方说,数据预处理相关的内容是可以有且必须有的,因为它是数据可视化的重要环节。而其它主题,例如统计建模等,则没那么相关,可以排除。后面我们会更详细地介绍什么是解释性数据可视化。
- 课程应是可随时加入的,或至少定期(每几个月)开放的。
- 课程应是可互动的在线课程,所以本清单不会包括书籍或只读教程。虽然学习方法可以有多种,但本清单关注的主要是在线课程。
我们相信我们涵盖了符合上述标准的每一个值得考虑的课程。由于 Udemy 有近百个课程,我们仅挑选了评价和评分最高的课程。尽管如此,我们还是可能有所遗漏,所以如果有你觉得很棒的课程不在本清单中,请务必在评论留言告诉我们~
我们如何评估课程
我们整合了来自 Class Central 和其他点评网站上的评分,并计算出每门课程的加权平均分。同时,我们还阅读了不同课程的评论信息,作为评分之外的参考。
至于主观上我们是怎么评估一个可视化课程的呢?主要是根据以下两个方面,并且我们认为第一个方面比第二个更为重要:
- 数据可视化理论的涵盖范围。 例如,有没有介绍如何选择合适的可视化设计?还是仅仅介绍了可视化工具的使用?更多相关内容将在下一节中讲解。
- 所选数据可视化工具的覆盖范围。该课程是否有效地教授了常见的可视化工具(Tableau,ggplot2,Seaborn等)?学生是否有机会上手练习这些技能?(注:在可视化工具的选择上我们没有任何偏好)
为什么偏重可视化理论
(敲黑板!划重点!小伙伴们请看这里~~~)
首先,如果缺乏可视化的基础理论知识,不了解什么样的可视化才是有效的,再怎么精通一门可视化工具也是徒劳,甚至可以说是浪费。
再者,工具是不断变化且可以根据需要灵活选择的,但万变不离其宗,作为各种工具的重要基础的可视化理论知识,是相对稳定的。
实际上,做好数据可视化比绝大多数人想象的要复杂得多。从选题、分析、设计到执行,各个阶段都有许多事情需要我们仔细地考虑——正确的图表类型的选择,总览概括与细节展示的平衡,pre-attentive 视觉属性(小编注:pre-attentive visual properties 是可视化理论常常涉及的一个重要概念,目前没有很好的中文翻译,主要指颜色、形状等人类能通过潜意识以极快地速度处理的视觉元素)的利用等等。数据可视化是一种科学与艺术的结合。它不仅很容易出错,而且有的错误可能会很糟 (见下图)。
什么是探索性与解释性可视化
根据数据可视化的应用场景与目的,通常可以将它们分为解释性数据可视化与探索性可视化。如同印第安纳大学教授Yong-Yeol Ahn所描述的,解释性数据可视化(explanatory data visualization)用于传达见解和信息,而探索性可视化(exploratory visualization)则是用于探寻数据中隐藏的模式、有用信息。
本文将重点介绍解释性数据可视化课程。 探索性数据可视化这个话题并非不重要,只是没有足够的相关课程来单独支撑一篇文章,因此我们只会对其进行简要的介绍。 因此,Udacity 的 R 语言数据分析(偏重探索性数据可视化)等课程将不会被本文选用。
精选课程清单
小编整理发现,许多数据可视化在线课程都以英文为教学语言,要求一定的编程基础,并且需要付费,因此本文提及的课程如无特别说明,默认英文、付费、要求编程;不同于这三种情况的课程都会单独标明,并在保证质量的基础上优先考虑加入精选清单。实际上,没有“最好的可视化课程”,只有“最合适的”的,所以请根据自身需要选择~
下列课程是各类别课程中评价及评分较高的,排名不分先后:
1. 中文最佳:「数据可视化与 D3.js」
在相关中文课程奇缺的情况下,Udacity 的这门课程虽然是英文授课,但其视频均有中文字幕已经是十分非常相当良心了。本课程涵盖如何将设计原则、人类感知、色彩理论和有效的故事讲述运用于数据可视化。通过这门课程,你还将学习到如何使用 Web 技术(HTML、CSS、D3.js)开发数据可视化图表,创作自己的在线作品集。
此课程的重点是如何对数据进行视觉编码,并将数据呈现给受众,即解释性数据可视化,而探索性数据可视化的内容较少。不得不提的是课程中提到的学习资料质量大多相当不错,值得进一步学习。
关于编程:由于课程项目涉及编程,最好有编程背景,如果没有也可以学习第 1a 和 2a 课的数据可视化与设计原则,并建议先通过 Udacity 的另一门课 Python 编程基础进行编程的入门学习。此外,由于 D3.js 是一个 JavaScript 图表库,且学习曲线较陡,可能会导致这门课的部分内容理解较为困难,如果有相关基础配合食用更佳。
一句话总结: 视频(有中文字幕)+ 阅读材料 + 交互式习题,免费,Udacity 课程平台易于使用,学习时间约七周,理论与实操的有机结合,实例丰富,内容生动有趣,适合有编程基础的初学者。
2. 非编程类最佳: 「信息图表和数据可视化入门」
这是一门由国际知名信息可视化专家 Alberto Cairo 设计和授课,由 Google 资助的在线课程。该课程由德克萨斯州大学奥斯汀分校奈特美洲新闻中心(Knight Center for Journalism in the Americas)开设,自2012年年底上线后,已吸引来自150多个国家一万四千人报读。课程涵盖了以下四个模块:
- 可视化的基本介绍
- 如何用可视化探索数据
- 如何用可视化传达信息
- 实践项目
课程主办方 Knight Center 和赞助方 Google News Initiative 均主要关注新闻及传媒行业,因此这门课程也更偏向这方面的应用,尤其是介绍了如何利用可视化增强故事叙述和数据分析等效果,且展示了如何使用不同的工具进行从数据预处理,到完成整个可视化甚至文章内容的全流程。视频托管在 Youtube 上,全英文暂无字幕。
香港大学新闻及传媒研究中心(JMSC)曾于15年与 Knight Center 合作推出慕课,内容一样,本文对该课程名的中文翻译也选自这门慕课,戳这里看课程的中文介绍。
一句话总结:新课程,名教授,视频 + 阅读材料,完全免费,涵盖了探索性和解释性可视化,学习时间约四周,适合初学者。
3. 综合最佳:加州大学戴维斯分校 「使用 Tableau 进行数据可视化」专项课程
包括以下五门课:
- Tableau 可视化的基础知识
- Tableau 的基本设计原则
- 使用 Tableau 进行可视化分析
- 使用 Tableau 创建仪表板和讲故事
- 使用 Tableau 项目进行数据可视化
根据本清单的评估标准,这门课的课程结构最佳,可视化理论知识和应用工具都有足够的涵盖,其中对理论知识的介绍比许多其他课程都要深入。他们不仅告诉你如何进行可视化设计,还告诉你为什么(原理、设计原则)。通过随堂练习和课程项目,你将有许多机会来上手练习使用 Tableau,尽管精通 Tableau 并不是课程的主要目标。
该课程的实例侧重于商业数据的分析与可视化。
一句话总结:视频(英语字幕) + 阅读材料,Coursera 课程平台易于使用,每个子课程可免费旁听,专项课程预计总耗时 22 周(每周 3-8 小时)。
4. 编程类/数据科学类最佳:「使用 ggplot2 进行数据可视化」系列课程
这门课程获得了来自 RStudio 首席科学家及 ggplot2 创建者 Hadley Wickham 的“官方认可”:
我非常推荐 Rick Scavetta 的“使用 ggplot2 进行数据可视化” 课程。它为您提供了优秀的 ggplot2 介绍。在 DataCamp 的在线学习环境中,您将学习到 ggplot2 的基础理论,并能够实际地去练习使用它。
该系列课程共包含三部分: 第1部分, 第1部分 及 第3部分。
如果你对学习 R 语言,或具体而言 ggplot2 有兴趣,DataCamp 的「使用 ggplot2 进行数据可视化」系列课程是个不错的(如果不差钱,甚至可能是最佳的)选择。比较难得的是,课程涵盖了大量可视化理论知识,相信这跟 ggplot2 基于图形语法 Grammar of Graphics 这一点不无关系。这门课对工具的讲解和练习也设计得很棒——当你完成这门课,你将会很熟悉 R 语言及其语法。
DataCamp 的采用了一种视频结合浏览器内代码编辑器的教学方式,并辅以文本步骤以及大量实例。课程的视频,文本和代码内容都很精美。
所有三门课程的预计学习共计16小时。收费方面,每门课程的第一章都是免费提供的,可以方便我们先试听再决定课程是否合适/值得购买。课程的其余内容则需要通过 DataCamp 订阅进行访问,目前每月29美元或每年300美元(不定期有打折)。
一句话总结:视频(英文,无字幕) + 集成代码编辑器 ,首章节免费试听+订阅式收费,理论与实践的绝佳结合,适合数据科学领域,适合进阶学习。
5. BI 工具类最佳:「Tableau 10」系列课程
该系列课程由 Kirill Eremenko 授课,是 SuperDataScience 团队在 Udemy 推出的,共包括以下两门课程,建议按顺序学习:
该系列课程主要侧重于介绍工具(Tableau)的使用,而非数据可视化理论,内容详实且循序渐进,采用真实商业案例,适合商业人士;且实用性比较强,是类似于通俗版使用说明书的存在。值得一提的是,Eremenko 是相关课程中最受欢迎的授课者之一,该系列课程的两门课程在 Udemy 上均拥有 4.6 的高评分(满分5分,评分次数分别为1.8万余次和4千余次)。
这个系列的总学时为17小时;课程需要付费但常年有折扣(购买组合还有额外折扣),每门课折后可低至 10 美金。(要知道 Tableau 的官方基础课程 是 1,400 美金一门。。。)
一句话总结:录屏讲解视频(英文,有英文字幕),可通过 Udemy 网站或移动端 app 观看;付费课程,适合需要从零开始学习 Tableau 的入门者,或有一定基础但想要全面提升相应技能的人士。
更多课程推荐
可视化理论相关课程:
- 印第安纳大学慕课:信息可视化:完全免费;在 Class Central 平台的数据可视化课程中目前排名第一,涵盖了容量可观的理论知识及可视化工具的介绍,还有相当不错的实际项目,并提供数据和工具给注册学生使用。如果无法成功注册,可以发邮件向课程管理员申请。
编程类工具相关课程:
- 使用 D3.js 数据可视化简明教程(Udemy):4小时付费视频课程,评分较高。
- 数据可视化学习路径(O’Reilly):详细介绍了 D3.js 用法和可视化理论知识,学时约 15 小时,提供 10 天免费试用。
- 使用 Python 与 Matplotlib 进行数据可视化(Udemy):6小时付费视频课程,介绍 Python 的主流图表库 Matplotlib。
- 使用 Python 与 Bokeh 的交互式数据可视化(Udemy):7小时付费视频课程,除了数据可视化,还包含网页应用开发相关内容。
BI 类工具相关课程:
- Tableau 入门(Udemy):共四小时的付费视频课程;有助于准备 Tableau 资格认证考试(Tableau Desktop Qualified Associate Exam);评分较高。
- 使用 Tableau 进行数据可视化(Udacity):免费课程,内容为可视化理论与工具介绍的结合,学习时间约三周。
- 使用 Power BI 进行数据分析及可视化(edX):Microsoft 为自家工具 Power BI 打造的课程,是其数据科学专业认证的一部分。课时约六周(每周 2~4 小时)。课程本身免费,如需课程认证证书则要另外付费 $99 美金。同为该系列课程之一的还有使用 Excel 进行数据分析及可视化(edX)。
后记
整理完这个清单,小编最大的感触就是 —— 中文数据可视化资源实在不多,质量高的更加少之又少,有的很优质但是太学术,面向没有相关背景知识的人群,或是能应用到实际学习工作中的资料很少。这更加坚定了我们努力的方向:致力于创作与分享优质可视化中文资讯~ 请多多关注我萌鸭~
附赠实用资料
- WTF Visualizations:小编记得自己上的可视化课程的第一份作业就是寻找和点评一个“糟糕的可视化设计”,有了这个网站,再也不怕找不到作业的素材了hhh。
- 数据新闻教育哪家强?,及其完整原文:Where in the world can I study data journalism?。
- 怎么样考取Tableau的资格证(Tableau Qualified Associate Exam)?:这个知乎的答案里面也提到了本清单中的推荐课程,对考证感兴趣的小伙伴不妨了解下,仅供参考。