需求来了 今年上半年做了一个需求,需求目的是获取实时的广告曝光在各个时刻各个类目的占比,发现曝光不足的类目,针对对应类目商家进行引导广告投放。团队当时用的存储介质只有mysq...
最近看了一篇 Paper,Dostoevsky: Better Space-Time Trade-Offs for LSM-Tree Based Key-Value Stor...
标题:一个针对基于LSM的NoSQL数据库上的辅助性索引的比较性研究本文是对NoSQL辅助索引技术的一个综述文章。 ABSTRACT NoSQL数据库在大数据领域得以广泛应用...
前言 笔者在之前的文章中已经提到过,MergeTree引擎族是ClickHouse强大功能的基础。MergeTree这个名词是在我们耳熟能详的LSM Tree之上做减法而来—...
简介 Spark是基于内存计算的开源分布式大数据计算框架。为了更好、更快地开发Spark应用程序,开发者不仅要掌握Spark的理论基础和实现原理,更需要掌握Spark应用程序...