贾华 - 简书

发简信

贾华

20
关注
2
粉丝
0
文章
0

字数
0

收获喜欢
7

总资产

IP属地：北京

胖虎大哥

数据仓库--通用的数据仓库分层方法(转载)
概述数据分层是数据仓库设计中十分重要的一个环节，优秀的分层设计能够让整个数据体系更易理解和使用。而目前网络中大部分可以被检索到相关文章只是简单地提及数据分层的设计，或缺少明...

8183 0 8
codeBugCoder

spark读取parquet文件优化
业务背景 Spark读取文件时，对于可切分的文件，会将文件切分为一系列 Split ，每个Split对应一个Task。一般而言，Split的大小与HDFS的Block大小相当...

10471 0 4
茂盛哥哥

转Apache Kylin VS Apache Doris
作者: 康凯森日期: 2018-04-17 分类:OLAP 1 系统架构 1.1 What is Kylin 1.2 What is Doris 2 数据模型 2.1 Ky...

4262 0 2
旺旺鸽不鸽

Spark内存管理功能概述 & 对Unroll Memory的理解
谈到Spark内存管理，估计大家都会想到：static memory manager，unified memory manager，execution memory，stor...

9971 0 4
siddontang

Kudu：一个融合低延迟写入和高性能分析的存储系统
Kudu 是一个基于 Raft 的分布式存储系统，它致力于融合低延迟写入和高性能分析这两种场景，并且能很好的嵌入到 Hadoop 生态系统里面，跟其他系统譬如 Clouder...

28976 3 47 3
Gevin

Flask 入门指南
本文首发于Gevin的博客原文链接：Flask 入门指南未经 Gevin 授权，禁止转载 1. 初识Flask Flask 是一个微框架（Micro framework）...

17139 10 237
Cecil维

ubuntu下安装superset
安装所需的依赖：安装python: 安装python的virtualenv环境安装superset 可能遇到的问题如果执行fabmanager create-admin...

5396 0 2
it_zzy

Druid单机版安装及离线导入数据
Druid单机版安装及离线导入数据 1.概述本文快速安装基于单机服务器，很多配置可以默认不需要修改，数据存储在操作系统级别的磁盘。推出快速安装的目的，便于了解并指导基于Dr...

8488 0 2
柴诗雨

一文读懂Apache Kylin
“麒麟出没，必有祥瑞。”—— 中国古谚语前言随着移动互联网、物联网等技术的发展，近些年人类所积累的数据正在呈爆炸式的增长，大数据时代已经来临。但是海量数据的收集只是大数据...

33109 12 86 1