海东青忧珠 - 简书

发简信

海东青忧珠

14
关注
2
粉丝
0
文章
0

字数
0

收获喜欢

IP属地：福建

海东青忧珠

HBase数据的删除和更新
当删除HBase中的数据，HBase会删除存储在HDFS上的数据，而Hadoop的Sequence File是一个顺序读写，批量处理的系统。那HBase怎么就能够查询到该记录...

虾米在海飘
10741 0 7
海东青忧珠

【实战】spark streaming 如何保证消费EOS
前段时间，一直有人问 spark streaming 偏移量问题。什么是偏移量？百度。一个正常或者线上的sparkstreaming执行顺序：1.根据group获取kafka...

CTO_zej
1845 2 5

海东青忧珠

Spark kafka + streaming自适应topic partitions变化
背景 spark streaming + kafka 有两种方案接收kafka数据-基于receiver的方案和direct方案(no receiver方案)。基于rece...

路飞_5611
2192 0 6
海东青忧珠

Spark Streaming中的scheduling delay问题
最近由于疫情在家办公，事情比较多（主要在各种沟通和会上），一直没有更新；正好工作中有个case, 用到啦spark streaming，所以随手记录一下，遇到的问题；背景...

没有格子衬衫的程序员
2958 1 1
海东青忧珠

HADOOP集群搭建实战（HA高可靠性模式）
一、环境安装 3台服务器的搭建，为了好描述我把服务器的地址分成hadoop1、hadoop2、hadoop3,实际生产环境可以用域名来代替。注意：配置里面尽量用域名，不要用I...

POGITA
1703 0 3
海东青忧珠

Spark Streaming读写Kafka，将offset写入Zookeeper
摘要： Spark Streaming， Kafka，zookeeper Scala调用Kafka API发送数据使用Scala调用Kafka API向Kafka发送数据，...

xiaogp
721 0 3
海东青忧珠

Elasticsearch 入门: _bulk 批量导入数据
批量导入数据使用 Elasticsearch Bulk API /_bulk批量 update 步骤：需求：我希望批量导入一个 movie type 的名词列表到 wor...

王兵
20998 1 6

海东青忧珠

数仓面试|四个在工作后才知道的SQL密技
SQL是大数据从业者的必备技能，大部分的大数据技术框架也都提供了SQL的解决方案。可以说SQL是一种经久不衰、历久弥新的编程语言。尤其是在数仓领域，使用SQL更是家常便饭。本...

大数据技术与数仓
248 0 1
海东青忧珠

阿里巴巴为什么能抗住90秒100亿？看完这篇你就明白了！
作者：huashiou链接：https://segmentfault.com/a/1190000018626163 1、概述本文以淘宝作为例子，介绍从一百个并发到千万级并发...

夜空_2cd3
138342 62 1059 1
海东青忧珠

Elasticsearch的选举机制
关于Elasticsearch的选举机制：ES选举master机制不像Hbase的HMaster选举， HMaster选举是借助ZK，通过各个节点向ZK注册临时节点（ZK保证...

kason_zhang
17368 3 16
海东青忧珠

CoderJed
写了 231118 字，被 1243 人关注，获得了 863 个喜欢
海东青忧珠

总结：Hive，Hive on Spark和SparkSQL区别
Hive on Mapreduce Hive的原理大家可以参考这篇大数据时代的技术hive：hive介绍，实际的一些操作可以看这篇笔记：新手的Hive指南，至于还有兴趣看Hi...

mrlevo520
29010 6 61

海东青忧珠

Spark SQL以编程方式连接到Hive Metastore 报错：org.apache.spark.sql.AnalysisException: Table or view not found
使用SparkSQL连接Hive数据库报错：找不到表 Table or view not found: bp_ods.ods_bp_user_behavior 解决方案： 1...

尼小摩
9304 1 4
海东青忧珠

（十四）Win10 IDEA环境下SparkSQL连接Hive的几个坑
在之前的文章中介绍了通过spark-shell访问hive中数据的方法，那么在IDEA中应该怎样连接Hive并访问数据呢？网上有很多篇文章介绍，但可能是因为环境不同，访问过程...

白面葫芦娃92
13675 1 13
海东青忧珠

再谈Spark Streaming Kafka反压
0x01 前言上篇文章Spark Streaming和Kafka集成深入浅出介绍了Spark Streaming的基本内容及和kafka的集成，其中也提到了开启反压的缘由：...

data之道
3668 1 9
海东青忧珠

Spark之CheckPoint
Check Point sparkContext.setCheckpointDir() spark的checkpoint目录在集群模式下，必须是 hdfs path。因为在集...

踏雪寻梅4149
3762 0 2
海东青忧珠

spark常见问题处理
1、spark thriftserver报以下错误，其他诸如hive/sparksql等方式均正常 ERRORActorSystemImpl:Uncaughtfatalerr...

达微
13739 0 5

海东青忧珠

spark之Failed to create local dir那点事
近日莫名遭遇异常一枚，如下：原因分析：1 Failed to create local dir，什么时候spark会创建临时文件呢？shuffle时需要通过diskBloc...

假文艺的真码农
7487 0 5
海东青忧珠

总结很好, nice

Spark常见调优，以及错误整理
1.常见调优方法： spark作业经常会出现跑得很慢或者卡死的情况，需要考虑调优。 1.1 任务提交参数调整最简单的调优就是调整参数为spark作业加大资源。以下是我提交...

wong11
7830 1 3
海东青忧珠

Spark常见调优，以及错误整理
1.常见调优方法： spark作业经常会出现跑得很慢或者卡死的情况，需要考虑调优。 1.1 任务提交参数调整最简单的调优就是调整参数为spark作业加大资源。以下是我提交...

wong11
7830 1 3

暂无个人介绍