Apache Flink是什么? 在当代数据量激增的时代,各种业务场景都有大量的业务数据产生,对于这些不断产生的数据应该如何进行有效的处理,成为...

Apache Flink是什么? 在当代数据量激增的时代,各种业务场景都有大量的业务数据产生,对于这些不断产生的数据应该如何进行有效的处理,成为...
Apache Doris 代码仓库地址:apache/incubator-doris[https://github.com/apache/inc...
分享提纲: Doris 背景介绍 适用场景 & 案例介绍 Doris 整体架构 Doris 关键技术 Doris 背景介绍 介绍 Doris 的...
用了几次impala + kudu做大数据实时计算场景,一路踏坑过来,这里分享踏坑经验 一开始需要全量导入kudu,这时候我们先用sqoop把关...
Kudu是Cloudera开源的新型列式存储系统,专门为了对快速变化的数据进行快速的分析。在国内,小米和神策都已经采用了kudu。我们使用了ku...
重要tip 项目git地址 hadoop搭建部分,使用了kiwenlau的hadoop dockefile。 注意,hadoop的分布式是基于多...
Hue官方网站:https://gethue.com/HUE官方用户手册:https://docs.gethue.com/官方安装文档:http...
概述 在使用Hue的时候会遇到异常情况,在查看Hue Server的log无法通过INFO和ERROR日志无法定位到具体的问题,这时我们需要借助...
本节介绍一个常用的Hadoop生态管理工具——HUE。 安装介质:hue-4.2.0.tgz 提取码:ep88 1.什么是HUE HUE是一个开...
一、OLAP在唯品会演进迭代 1.1 Presto/Kylin在唯品会的使用 Presto作为当前唯品会OLAP主力军,经历了数次架构和使用方式...
专题公告
大数据