数据库和数据仓库这几个字看起来都差不多,不就多个仓字嘛,又不是多了苍老师? 从本质上来说,数据库和数据仓库都是数据的集合。没什么不同。 但是它们...
收录了32篇文章 · 169人关注
数据库和数据仓库这几个字看起来都差不多,不就多个仓字嘛,又不是多了苍老师? 从本质上来说,数据库和数据仓库都是数据的集合。没什么不同。 但是它们...
在使用Hive搭建数据仓库,处理数据时,同传统数仓的结构化数据不同,我们经常会遇到一些非结构化的数据,json格式的字符串就是常见的一种类型。对...
PS:无法复制表格样式,只能截图了
大数据数仓的性能优化主要围绕以下四个方面: 调度优化 模型优化 同步任务优化 计算任务优化下面将对着四方面的优化方法进行具体阐述。 调度优化 在...
数据仓库(Data Warehouse ) 1.1 基本概念 数据仓库的目的是构建面向分析的集成化的数据环境, 为企业提供决策支持 (Decis...
前篇传送门:https://www.jianshu.com/p/5ffd8730aad8 目录 Prologue(见前篇) Kudu的初衷(见前...
Prologue join是我们这些整天与数据打交道的人绕不开的一个词,不管是在传统的关系型数据库,还是在大数据领域的数据仓库/数据湖中,joi...
后篇传送门:https://www.jianshu.com/p/24bdc6f62e84 目录 Prologue Kudu的初衷 集群架构与共识...
1、ETL和ELT ETL是Extract、Transfrom、Load即抽取、转换、加载三个英文单词首字母的集合: E:抽取,从源系统(Sou...
毕业后做了7年java应用开发,主要在一家传统软件公司做BI相关的东西。因为主要是写业务代码,大公司都有自己的技术平台,所以java技术也...
专题公告
大数据数据仓库