Apache Superset 简介
Apache Superset 是一个适合企业日常生产环境中使用的商业智能可视化工具。
它具有快速、轻量、直观的特点,任何用户都可以轻松地上手探索他们的数据。从非常简单的饼图到复杂的地理空间图,Superset都给到了非常好的支持。
下面是几种打开Superset的正确方式:
- 从 Github 下载最新的源码
- 从 Pypi下载最新的 Superset 版本
- 使用 Docker Compose命令在本地设置 Superset
- 从 Dockerhub下载 Docker 镜像
Superset 提供以下功能:
- 用于数据可视化和制作交互式的数据看板、报表
- 各种漂亮的可视化效果来展示数据
- 不需要写代码就可以查询数据,以及做数据可视化
- 具有方便好用的SQL Lab做日常的SQL 查询,元数据浏览,以及制作看板前的数据清洗
- 数据分析师能够快速定义自定义维度和指标
- 支持企业级生产环境中各种各样的大数据中间件以及数据库
- 无缝衔接的内存异步缓存和查询
- 高度定制化、细粒度的安全模型/权限模型。允许配置非常复杂的规则来决定谁可以访问哪些产品功能和数据集
- 支持自定义登陆验证,支持各种主流的方式(如数据库、OpenID、LDAP、OAuth、REMOTE_USER 等)
- 可以实现可视化组件自定义
- 各种各样的后端API提供做定制化
- 云原生架构,支持生产环境高可用
Superset 是云原生的,旨在提供高可用性。它旨在扩展到大型分布式环境,并且在容器中运行良好。既可以仅在本地环境上轻松测试 Superset,又可以横向扩展到生产环境中使用。
正是因为 Superset 是云原生的,因此它很灵活,可以让你切换各种中间件,如:
- 网络服务器可以选择:Gunicorn、Nginx、Apache 等
- 元数据数据库引擎支持:MySQL、Postgres、MariaDB 等
- 消息队列可以定制化:Redis、RabbitMQ、SQS 等
- 数据存储后端可使用:AWS S3、Redis、Memcached 等
- 缓存层支持:Memcached、Redis 等
Superset 还可以很好地与 NewRelic、StatsD 和 DataDog 等服务配合使用,用于监控 Superset服务的健壮性,并且能够针对最流行的数据库技术运行分析工作负载。
Superset 目前在许多公司大规模运行。例如,Superset 在 Kubernetes 内的 Airbnb 生产环境中运行,为每天查看超过 10 万张图表的 600 多名活跃用户提供服务。
你可以在 GitHub 的此页面上找到采用 Superset 的行业和公司的部分列表 。
关于作者
程序员赤小豆毕业于加州大学洛杉矶分校计算机专业,目前在国内某大厂担任软件工程师。在此之前,曾在创业公司工作,从零到一搭建 Superset 并在公司内部大范围推广使用。深度实践过 Superset 的二次开发,对源码十分熟悉,也是 Superset 早期的开源贡献者,欢迎follow我的 github https://github.com/yamyamyuo
长期致力于开源项目,希望可以分享更多的 Superset 知识,欢迎通过我的个人简介加我,我组织了 Superset 技术交流社 ☄ ,因为在跟大部分的Superset开发者交流过程中发现,大部分人受困于阅读英文的资料,小豆因此编写一系列官方文档的中文校对版,希望对大家有帮助。