RDB RDB是什么? Redis持久化数据的两种方式之一,另外一种是AOF。Redis会定期保存数据快照至一个rbd文件中,并在启动时自动加载...
RDB RDB是什么? Redis持久化数据的两种方式之一,另外一种是AOF。Redis会定期保存数据快照至一个rbd文件中,并在启动时自动加载...
Spark On Yarn 资源申请流程 Client 模式因为是Client模式,所以当我们 Spark-Submit 提交Spark任务的时...
转载自: lxw的大数据田地 前言 GROUPING SETS,GROUPING__ID,CUBE,ROLLUP这几个分析函数通常用于OLAP中...
前言 Kafka 提供了数据高可靠的特性,但是如果使用不当,你可能无法享受到这一特性,今天我们就来看看如何正确的使用Kafka 保证数据的不会丢...
计算速度 计算的速度是取决于计算机本身的计算能力的。并且目前来看,所有的计算机计算都是基于内存的(如果有不是的,请原谅我的孤陋寡闻...),也就...
前言 在N久之前,曾写过kafka 生产者使用详解,今天补上关于 offset 相关的内容。那么本文主要涉及: Kafka 消费者的两个大版本 ...
原文地址 2019年11月08日 数砖的 Xingbo Jiang 大佬给社区发了一封邮件, 宣布 Apache Spark 3.0 预览版正...
Hive简单优化与定期ETL Hive优化 Hive的执行依赖于底层的MapReduce作业,因此对Hadoop作业的优化或者对MapReduc...
Spark Streaming 编程指南 概述 一个入门示例 基础概念 依赖 初始化 StreamingContext Discretized ...
前言 本篇文章主要是从作业提交到最后获取到作业结果,从源码的角度,但是不涉及源码进行的分析.其目的是读完本篇文章,你将对作业的基本流程有个清晰的...
专题公告
一个做技术的专题,欢迎所有对大数据技术感兴趣的朋友加入