目录 1 环境 1.1 系统版本 1.2 ASM 磁盘组规划 1.3 主机网络规划 1.4 操作系统配置部分 2 准备工作(rac1 与 rac2 同时配置) 2.1 配置本...
备份容灾 一、备份 1.手动备份redis数据库 2.迁移Redis指定db-数据库 方式1.同主机db迁移到另外一个dbn中 方式2.跨主机迁移db 3.Redis集群数据...
需求,使用MR实现读取hbase表数据,只要某一个列族的数据,并且写入到另一张表中。 Main Mapper Reducer HDFS导入数据到Hbase和Hbase导出到H...
1. HBase介绍,Hbase是什么? HBase -- Hadoop Database ,是一个高可靠、高性能、面向列、可伸缩的分布式存储系统。Hbase来源于Googl...
HBase是Apache基金会的一个项目,是一个分布式可扩展的NoSQL数据库,提供了对结构化、半结构化、甚至非结构化大数据的实时读写和随机访问能力。 要说HBase在Had...
1.前言 本文讲述如何使用IDEA远程调试spark,这里所说的调试spark包括: 调试spark应用程序,也就是使用spark算子编写的driver applicatio...
初始化项目 初始化一个git仓库,做一次提交操作 创建分支 git branch #创建指定名称的分支 查看分支 git branch #查看所有分支,* 号代表当...
需求 有2张大的mysql表,量级分别是1亿和4.5亿(太大了,DBA的同学正在考虑分表),而且数据是增量的,需要写spark任务做处理,直接读取mysql有点吃力,想通过s...
Producer 在kafka文档中选择文档版本: 我的机器上装的是1.0.0,所以 点击图 Producer API中的javadocs,跳转到熟悉界面的java api:...
Window是无限数据流处理的核心,Window将一个无限的stream拆分成有限大小的”buckets”桶,我们可以在这些桶上做计算操作。本文主要聚焦于在Flink中如何进...
使用旁路输出(side output)来拆分和复制流 我们在处理数据的时候,有时候想对不同情况的数据进行不同的处理,那么就需要把流进行拆分或者复制。如果是使用filter来...