GoofyWang - 简书

发简信

GoofyWang

21
关注
21
粉丝
15
文章
18414

字数
20

收获喜欢
25

总资产

IP属地：宁夏

GoofyWang

建maven工程，把hive的jar引入到依赖里，然后写对外的方法接受sql，把sql发给Driver类，拿到语法树的根节点ASTNode，然后写代码遍历ASTNode，根据不同的特征解析不同的属性出来。

使用Hive内置的解析器构建血缘关系
背景最近在做数据血缘关系相关的工作，最初级的版本我们是通过执行计划分析出表到表的计算关系。有同事在看了之后提出，希望能给一个字段到字段的计算关系出来，所以我们做了一些尝试，...

GoofyWang
6994 3 2
GoofyWang

30张图带你彻底理解红黑树
写在前面当在10亿数据进行不到30次比较就能查找到目标时，不禁感叹编程之魅力！人类之伟大呀！ —— 学红黑树有感。终于，在学习了几天的红黑树相关的知识后，我想把我所学所想...

安卓大叔
659837 262 1258 9

GoofyWang

B树
引子上一篇文章结束的时候，我亲手立下了flag，要手写2-3树。经过卧薪尝胆半个月后，终于放弃了。因为2-3树只是B树的某个状态，写了半天就写某个类的一个状态貌似很没有什么...

408 0 2 2
GoofyWang

Java入门到入坟
写了 0 字，被 14376 人关注，获得了 6205 个喜欢

扫码关注公众号《老男孩的架构路》
GoofyWang

AVL树
介绍 AVL树是最常见的自平衡二叉搜索树了。关于二叉搜索树大致的描述如下：每个节点只有左右两个子节点每个节点的左子节点的值小于该节点值，每个节点的右子节点的值大于该节点的...

506 0 2
GoofyWang

春笋啊五花肉啊
春笋？最近被公众号各种安利春笋，五花肉春笋，油焖春笋balabala，作为北方人，吃过笋，但是春笋是个啥？市场溜达圈，买了几根回来，造起来，挥发码农创新，勇于尝试精神！ ...

厨子写代码
284 0 4 1
GoofyWang

春笋啊五花肉啊
春笋？最近被公众号各种安利春笋，五花肉春笋，油焖春笋balabala，作为北方人，吃过笋，但是春笋是个啥？市场溜达圈，买了几根回来，造起来，挥发码农创新，勇于尝试精神！ ...

厨子写代码
284 0 4 1

GoofyWang

厨子写代码
写了 415 字，被 2 人关注，获得了 4 个喜欢

要师傅，IT技术从业者，爱喝酒跑马的厨子。
GoofyWang

使用Hive内置的解析器构建血缘关系
背景最近在做数据血缘关系相关的工作，最初级的版本我们是通过执行计划分析出表到表的计算关系。有同事在看了之后提出，希望能给一个字段到字段的计算关系出来，所以我们做了一些尝试，...

6994 3 2
GoofyWang

HiveServer2无响应分析
场景描述我们在工作中有时候需要使用JDBC操作Hive，但最近经常出现每隔一段时间JDBC就超时没反应的情况。（这个问题和MetaStore内存溢出时的表现一模一样，关于M...

3928 0 1 1
GoofyWang

wenming6688
写了 11018 字，被 13 人关注，获得了 5 个喜欢
GoofyWang

对ddl语句，如何做到仓库与业务库的同步呢？

MySQL数据实时同步实践
来自公众号：小米云技术背景 MySQL由于自身简单、高效、可靠的特点，成为小米内部使用最广泛的数据库，但是当数据量达到千万/亿级别的时候，MySQL的相关操作会变的非常迟缓...

码农小光
5092 3 67

GoofyWang

理解Spark中Job-Stage-Task之间的关系
Spark-Job-Stage-Task之间的关系基本概念在开始之前需要先了解Spark中Application，Job，Stage等基本概念，官方给出的解释如下表： J...

由木人_番茄
11970 3 18
GoofyWang

李小李的路
写了 208066 字，被 551 人关注，获得了 806 个喜欢

李小李可不能落后呀
GoofyWang

Spark--Spark Shuffle细节掌握(面试类)问题
Spark Shuffle Read阶段是如何读取数据的 Reduce去拉取Map的输出数据，Spark提供了两套不同的拉取数据框架：通过socket连接去取数据；使用net...

李小李的路
2176 1 13
GoofyWang

工作文件不该全部归档吗？怎么会只有员工的电脑上有？我司离职电脑会由专门的安全人员做清空……

活久见！！！一员工离职卸载掉电脑的全部软件，就连桌面文件也一扫而空
之前在网上看到一句话这样来形容靠谱的人:“凡事有交代，件件有着落，句句有回应”。个人十分认同，这个解释尤其用在职场，判定一个员工有没有责任心最合适不过。工作了四年的我，经...

橘猫暖暖
24383 168 170
GoofyWang

我们分析团队关注每条数据的每次变化，现在封装了canal来收binlog后端用kafka将离线数据与实时计算解耦，这个场景用datax要如何实现呢？

DataX 3.0简介安装及使用
DataX3.0离线同步工具介绍一. DataX3.0概览 DataX 是一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、...

香山上的麻雀
68587 7 40

GoofyWang

LittleMagic
写了 499547 字，被 35616 人关注，获得了 4877 个喜欢

本博客所有内容均适用知识共享-署名-相同方式共享（CC-BY-SA）4.0协议。
GoofyWang

Kafka+Spark Streaming如何保证exactly once语义
在Kafka、Storm、Flink、Spark Streaming等分布式流处理系统中（没错，Kafka本质上是流处理系统，不是单纯的“消息队列”），存在三种消息传递语义（...

LittleMagic
6759 6 27