飞不高的老鸟

发简信

飞不高的老鸟

0
关注
22
粉丝
17
文章
13949

字数
25

收获喜欢
7

总资产

IP属地：北京

飞不高的老鸟

今天，你“羊”了吗？
“ 一切都会过去！除了羊的第二关....” 今天，你“羊”了吗？这应该是最近出现频次最多的用语了吧！“羊了个羊”是最近非常火爆的一款微信小游戏。它火到什么程度？火到上线2天服...

678 0 0
飞不高的老鸟

Flink 源码笔记 — execute 后发生了什么？
前言我们知道，Flink 程序的执行是在我们调用 env.execute() 后才会真正开始。事实上，我们在编写业务代码时，是在勾勒程序执行的 DAG 图，当调用 exec...

1156 0 2

飞不高的老鸟

flink 学习笔记 — 基于 Flink 实时数仓的简单实践
回顾 Flink 因其高吞吐、低延时、有状态、高容错的特性越来越受到数据从业者的青睐，它弥补了Storm、Spark 的很多不足。作为一个实时计算的框架，Flink 在实时数...

3654 0 3
飞不高的老鸟

flink 学习笔记 — 状态 State
回顾在之前的学习中我们了解到，flink 作为低延时的流式数据处理框架，本身是有状态的。状态 state 是为了保存一些操作符 operator 的中间结果，同时，通过状态...

1246 0 2
飞不高的老鸟

简单说说数据仓库
数据仓库介绍数据仓库是集成的、面向主题的、反应历史的数据的集合。它需要具有高效查询、高质量的、可扩展的的特性。数据仓库是协助运营及管理人员及时做出策略调整的最有效的依据。 ...

946 4
飞不高的老鸟

flink 学习笔记 — 时间定义及窗口机制
flink 回顾通过之前的了解，我们知道，flink是一个高吞吐、低延时的流式处理框架。flink 中具有严格的时间定义，采用不同的时间机制，对于其处理延时及处理结果的准确...

1626 0 2
飞不高的老鸟

flink 学习笔记 — 编程模型
flink 抽象分层结构 flink 作为流式处理框架，不仅具有高效的流数据和批数据处理性能，具有针对开发人员使用的高效的底层API，同时有方便分析人员使用的 table/s...

706 0 2

飞不高的老鸟

flink 学习笔记 — 初识 flink
Apache flink 简介 Apache flink 是分布式流式数据处理框架，主要用于有界(bounded)和无界(unbounded)数据流的有状态处理，具有高性能、...

909 0 4
飞不高的老鸟

flink 学习笔记 — 自定义 Sink 函数
flink Sink简介 flink 中有两个重要的概念，Source 和 Sink ，Source 决定了我们的数据从哪里产生，而 Sink 决定了数据将要去到什么地方。 ...

6307 0 2
飞不高的老鸟

flink学习笔记 — watermark 水印
flink 简介 flink 是最近几年发展最为迅速的实时计算框架，它解决了 storm 低吞吐量的问题，同时也解决了 spark 的高延时问题。flink 是一款高吞吐量、...

1504 0 1
飞不高的老鸟

flink 遇到 Tuple2 泛型导致的问题：could not be determined automatically, due to type erasure.
问题描述错误原因：这里错误发生的地方使用了一个 tuple 元组，且没有指定泛型。错误代码解决方案在 tuple 元组使用时指定泛型。正确代码

6671 0 0
飞不高的老鸟

hive表之数据倾斜问题解决方案
数据倾斜的主要表现形式 reducer 阶段一直卡在99.9%，但是一直不能结束。大量数据进入某个或者某几个reducer中处理，远远超过正常的reducer。某几个co...

590 0 1

飞不高的老鸟

hive表之 order by、sort by、cluster by、distribute by 对比
order by 语法操作 order by 是进行全局排序，在整个作业执行过程中，只产生一个 reducer，在数据量过大的时候，执行的时间会很长。事实上，这与分布式的思...

769 0 1
飞不高的老鸟

hive表之简单窗口函数 over()
窗口函数通常是分析人员使用 hive ql 进行一些复杂逻辑计算时使用的特殊函数，其中 over() 通常与聚合函数共同使用，比如 count()、sum()、min()、m...

3631 0 1
飞不高的老鸟

记一次 redis 问题排查：MISCONF Redis is configured to save RDB snapshots, but is currently not able to pe...
问题描述近期在redis的使用中出现下面的问题：这个问题描述的很清楚，redis的配置是保存数据库快照，但是在执行时不能将数据持久化到磁盘。解决方法简单的解决方案： ...

271 0
飞不高的老鸟

hive表之分桶
桶是 hive 表在表(分区)结构的基础上额外的一种数据文件，它的出现有两方面的意义：一、提高表数据的查询效率。二、随机取样。分桶规则：hive 表是对指定的某列属性进行...

577 0 0
飞不高的老鸟

hive表之分区
hive 是一款基于 hadoop 的、提供结构化数据组织及查询的数据仓库工具，它提供了 Hive ql方言，使用简单的 sql 就能解决大多数的数据查询工作，使得复杂的 m...

854 0 0

飞不高的老鸟

@IT·互联网
若锦编，75731 篇文章，2650297 人关注

Hi，很高兴在@IT·互联网专题遇见你。收录范围：收录IT&互联网行业观察与思考，数码产品极客体验分析等类型文章投稿须知：https://www.jianshu.com/p/4edc76104c27 专题主编：@若锦 https://www.jianshu.com/u/e4c63b354a77 官方社群：可联系添加 @若锦加入专题官方社群交流、学习，添加时备注简书ID。
飞不高的老鸟

程序员
小彤花园编，96494 篇文章，1663331 人关注

如果你是程序员，或者有一颗喜欢写程序的心，喜欢分享技术干货、项目经验、程序员日常囧事等等，欢迎投稿《程序员》专题。专题主编：小彤花园 http://www.jianshu.com/users/4a4eb4feee62/ 【程序员】专题拒稿指北：http://www.jianshu.com/p/7c8b33b5f63b 投稿须知： 1.收录相关技术文章，但不限于技术，也可以是项目经验类的文章和程序员日常。 2.文章內不得有任何推广信息。包括但不限于公众号、微博、微信，更不得在通过投稿后再修改文章加入推广信息。你可以将这些推广以及个人信息放在个人主页介绍里。 3.字数极少，段落混乱，大段代码没有放到代码框的文章不收录 4.不相关的内容不收录，请确认文章内容和本专题相关目前针对优质作者及爱好者，开设了官方程序员微信群，希望加入请发简信给主编小彤花园索取个人微信，主编会将你加入到【程序员】微信群，分享内容，收获知识。添加微信时备注昵称。
飞不高的老鸟