Apache Doris 代码仓库地址:apache/incubator-doris[https://github.com/apache/incubator-doris] 欢...
Apache Doris 代码仓库地址:apache/incubator-doris[https://github.com/apache/incubator-doris] 欢...
case when语句书写注意点 统一数据类型——同一字段不能出现不同数据类型 不要忘记end 养成写子句else 用法1:group by 按照casewhen分组应用场景...
8月份 FlinkCDC 发布2.0.0版本,相较于1.0版本,在全量读取阶段支持分布式读取、支持checkpoint,且在全量 + 增量读取的过程在不锁表的情况下保障数据一...
Flink Mysql CDC结合Doris flink connector实现数据实时入库Apache doris通过扩展支持通过 Flink 读写 doris 数仓中的数...
上一次我们讲了,数据怎么进行快速的接入,这次我们讲在接入及后续的数据处理中质量怎么控制 如何更加合理、高效的监控每类作业的运行状态,并将原本分散、孤岛式的监控日志信息通过规则...
数仓分层模型 数仓分层模型的好处: 1、数据结构化更清晰:每一个数据分层都有它的作用域和职责,在使用表的时候能更方便地定位和理解。 2、数据血缘追踪:提供给外界使用的是一张业...
指标体系定义 指标体系是将零散单点的具有相互联系的指标,系统化的组织起来,通过单点看全局,通过全局解决单点的问题。它主要由指标和体系两部分组成。 指标是指将业务单元细分后量化...
这里我们要先搞懂什么是元数据?元数据和数据的区别是什么?元数据有什么作用 1.什么是元数据 举几个例子: 如果一本书是一个“数据",那么它的书名、封面、出版社、作者、总页码就...
1. MVCC的基本概念 1.1 三种数据库并发场景 读-读:不存在任何问题,也不需要并发控制 读-写:有线程安全问题,可能会造成事务隔离性问题,可能遇到脏读,幻读,不可重复...
顺序保证难点 本文主要分析 CDC 业务场景中任务级顺序保证,技术选型为:debezium、kafka、flink,其构成了顺序保证中至关重要的每一环,应该充分考虑、分析各组...
近来接触到DorisDB,做了些调研,记录下来。过程描述不一定准备,如有描述偏差,请指正。 1介绍部分 1、DorisDB是什么 DorisDB重新定义了MPP分布式架构,集...
1. TiDB介绍 TiDB 是分布式关系型数据库,是一款同时支持在线事务处理与在线分析处理的融合型分布式数据库产品,具备水平扩容或者缩容、金融级高可用、云原生的分布式数据库...
00背景 规范约束是数仓建设的全流程,以及后续的迭代和运维的参照。事实上,数仓规范文档,应该随着架构设计文档,在数仓开发启动之前,分发给所有相关人员,且是所有人都必须严格遵守...
Flink+Clickhouse实时数仓在广投集团的最佳实践 一、业务背景 由于历史原因,大型集团企业往往多个帐套系统共存,包括国内知名ERP厂商浪潮、用友、金蝶、速达所提供...
Hola,我是 yes。 今年来看了 RocketMQ、Kafka、Dubbo 、Tomcat 的源码,之前也有读者询问过如何读源码,索性就来分享一下。 其实还看了一点点 L...
垃圾回收两本基础经典书籍分享:《垃圾回收的算法与实现》 链接:https://pan.baidu.com/s/16g-H9QB7-gvEJAYoclwbrA[https://...