李小李的路 - 简书

发简信

李小李的路

2
关注
551
粉丝
177
文章
208066

字数
806

收获喜欢
187

总资产

IP属地：河北

李小李的路

@Lilydut 它只是实现的一个工具，工具有很多中的。

数仓--Hive-面试之Hive与HBase的区别
需要从组件作用、架构设计多个方面进行学习，理论指导实践从使用方面讲 Hive是一个构建在Hadoop平台上的数据仓库，可以将结构化的数据文件映射为一张数据库表。通过Hive...

李小李的路
6566 3 13
李小李的路

Druid--Druid的基础集群配置优化
基于apache-druid-0.17 概述本文是基于官网的一些建议进行的与进程类相关的配置建议 Historical 进程 Heap 大小（堆大小） Historica...

2526 0 2

李小李的路

Druid--Druid中数据管理
基于apache-druid-0.17 schema变化 DataSource中的schema可以在任何时候进行改动，Druid中支持DataSource中Segment中有...

1296 0 4
李小李的路

Druid-Druid中schema设计技巧
基于apache-druid-0.17 Druid的数据模型 Druid中的数据存储在DataSource中，像传统关系型数据库RDBMS的table。 Druid中Data...

2977 1 2
李小李的路

Druid-Druid中的数据抽取-Ingestion
基于apache-druid-0.17 概述 Druid中所有的数据被组织成Segment。这些Segment是数据文件，通常一个Segment文件有几百万行。Druid中加...

943 0 2
李小李的路

Druid-Druid中修改日志中的时区
基于apache-druid-0.17 概述部署好druid集群后，发现druid的日志中时区与服务器的时区存在偏差，详见下图：时区异常经排查各项配置文件，发现是drui...

2718 1 1
李小李的路

Druid-Druid中task详解
基于apche-druid-0.17 概述在Druid中task完成与数据提取相关的工作。对批处理，通常通过Task的api进行提交，对于流式处理，task由superv...

3949 0 1

李小李的路

Druid-Druid中Indexing Service
基于apache-druid-0.17 概述 Druid的Indexing Service是一个分布式、高可用的，同时运行索引相关的tasks； Indexing Servi...

729 0 1
李小李的路

Druid-Druid中Segment
基于apache-druid-0.17 概述 Druid将索引存储在按时间分区的Segment文件中。在基本的设置中，会为每个时间间隔(time interval)创建一个s...

2482 0 1
李小李的路

Druid--Druid中Indexer Process
基于apache-druid-0.17 Attention:Indexer是一个可选的实验性特性。它的内存管理系统仍在开发中，并将在以后的版本中得到显著增强。 Apache ...

871 0 1
李小李的路

Druid-Druid架构分析
基于Apache-Druid-0.17.0 文档参考基于 apache-druid-0.17.0-src.tar.gz中doc/design/architecture.md ...

476 0 1
李小李的路

Druid-Druid中MiddleManager Process
基于apache-druid-0.17 启动命令概述 MiddleManager进程是一个执行已提交任务的工作进程。MiddleManager将任务转发给运行在不同jvm中...

717 0 2

李小李的路

Druid-Druid中Historical Process
基于apache-druid-0.17 启动命令加载和服务Segment 每个Historical进程维护一个与Zookeeper的固定连接，并监视可配置的Zookeepe...

808 1 2
李小李的路

Druid-Druid中Router Process
基于apache-druid-0.17.0 概述 Router进程可以被用于查询不同的Broker进程。通常情况下，broker查询路由依赖与规则(Rule)的设定。举例来说...

1304 0 2
李小李的路

Druid-Druid中Broker
基于apache-druid-0.17 概述如果希望运行分布式集群，Broker是查询路由的流程。Broker可以读取并理解zookeeper集群上的元数据，这些元数据是关...

168 0 1
李小李的路

Druid-Duid中Overlord Process
基于Apache-Druid-0.17.0 概述 Overlord进程负责接受任务、协调任务分配、任务锁创建，并将状态返回给调用者。Overlord可以配置运行在两种模式之一...

495 0 1
李小李的路

Druid-Druid中Coordinator Process
基于apache-druid-0.17.0 Configuration和HTTP endpoints详见官网；概览 Druid中Coordinator进程主要是负责Segm...

748 0 1

李小李的路

Druid-Druid-0.17集群搭建
基于Apache-Druid-0.17 基于Centos-7 准备工作检查Centos的hosts配置，集群中各个节点都需要保持一致；检查集群各个节点防火墙是否关闭；检...

608 0 1
李小李的路

kylin-Cube中的Rowkey优化
基于kylin-3.0 重点通过对Cube的Rowkey的设置来优化Cube的查询性能前言 Cube的每个Cuboid中包含大量的行，每个行又分为Rowkey和Measue...

1021 0 1
李小李的路

kyin-Cube中对Rowkey的编码方式介绍
基于kylin-3.0 Cube中结果在HBase中存储形式在Apache Kylin中是以key-value的形式将Cube的构建结果存储到Apache HBase中的。...

688 0 1

个人介绍

李小李可不能落后呀