官网地址:https://trino.io/docs/current/[https://trino.io/docs/current/]参阅书目《Trino: The defi...
![240](https://upload.jianshu.io/users/upload_avatars/18825037/8cc047d8-8932-44d6-8f56-71652341345b.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
官网地址:https://trino.io/docs/current/[https://trino.io/docs/current/]参阅书目《Trino: The defi...
Flink cdc源码 前言 flink-cdc源码地址 : https://github.com/ververica/flink-cdc-connectors[https:...
提出问题 我们当前通过5个DM任务从RDS MySQL向TiDB同步数据。这些任务均非合库合表任务,且同步的库表相互之间没有交集,safe-mode均未显式打开,Syncer...
一、 Log4j简介 Log4j有三个主要的组件: Loggers(记录器):日志类别和级别; Appenders (输出源):日志要输出的地方; Layouts(布局):日...
背景 在调试flink写hdfs和hive时,任务总是报各种各样的异常,其中255问题最多,异常信息如下: 这段异常是yarn报出来的,根本原因是Direct Memory ...
Mysql数据库的安装对于开发者来说,是我们必然会面对的问题,它的安装过程其实并不复杂,并且网络上的安装教程也非常多,但是对于新手来说,各种不同形式的安装教程,又给新手们带来...
pidstat 概述 pidstat是sysstat工具的一个命令,用于监控全部或指定进程的cpu、内存、线程、设备IO等系统资源的占用情况。pidstat首次运行时显示自系...
一、动态mapping 在我们最开始使用ES的时候,可能还不太了解mapping,也没有添加过mapping为什么我们还是能够正常的添加文档。 那是因为ES可以动态映射,添加...
Flink的 Window 操作 Window是无限数据流处理的核心,Window将一个无限的stream拆分成有限大小的”buckets”桶,我们可以在这些桶上做计算操作。...
基于flink-1.8.1 概述 parallelism指的是并行度的意思。在 Flink 里面代表每个任务的并行度,适当的提高并行度可以大大提高 job 的执行效率,比如你...
Flink on yarn部署模式 背景 Flink是一个高性能,高吞吐,低延迟的流处理框架。它不仅仅是作为一个流式处理框架,更将批处理统一了起来(在Flink中,批处理是流...
spark Web UI的各tab页分别进行介绍: Jobs在提交spark任务运行后,日志中会输出tracking URL即任务的日志链接。在浏览器中打开tracking ...
责任链模式 一、概念 是一个请求有多个对象来处理,这些对象是一条链,但具体由哪个对象来处理,根据条件判断来确定,如果不能处理会传递给该链中的下一个对象,直到有对象处理它为止。...
附上最近更新的面经:某大佬的20+公司面试题总结和自己的补充 一面 自我介绍下自己,不超过3分钟(实际上我的自我介绍不到一分钟)你感觉比本科阶段自己进步了多少,有哪些进步研究...