最近有个项目,需要读取hive表中的数据写到Hbase中,正好flink1.10版本刚出来,而且支持连接hive,那就他了。 哪想到这才是噩梦的开始。确定了技术栈,就开始着手...
IP属地:广东
最近有个项目,需要读取hive表中的数据写到Hbase中,正好flink1.10版本刚出来,而且支持连接hive,那就他了。 哪想到这才是噩梦的开始。确定了技术栈,就开始着手...
简介 Flink运行时主要角色有两个:JobManager和TaskManager,无论是standalone集群,flink on yarn都是要启动这两个角色。JobMa...
1. Nginx原理 对于每个Worker进程来说,独立的进程,不需要加锁,所以省掉了锁带来的开销 采用独立的进程,互相之间不会相互影响,一个进程退出后,其他进程还在工作,服...
单纯的练习,是从尚硅谷大数据课程之Hive(2019新版)学的,反正我记录的都是我手敲过的。。。 1.空字段赋值 函数说明: NVL:给值为null的数据赋值。格式是NVL(...
公司目前在开展大数据业务,在大数据框架选型方面一直在Ambari+HDP 和CM+CDH之中徘徊。我就尝试动手搭建了两套环境来试试效果。接下来我会记录搭建HDP和CDH环境的...
背景 Spark支持多种数据源,但是Spark对HBase 的读写都没有相对优雅的api,但spark和HBase整合的场景又比较多,故通过spark的DataSource ...
引言 在实际的kafka开发中,我们会发现,无论是生产者还是消费者,都需要构建一个Properties对象,里面设置了很多参数。对于很多初学者来说,会看不懂这些参数分别代表什...