现在 BAT 都在走向 开源社区,确实 大家从 商业或者个人实现上来看,开源运动 分享 是一门非常棒的好的Business腾讯现在专门 开...

现在 BAT 都在走向 开源社区,确实 大家从 商业或者个人实现上来看,开源运动 分享 是一门非常棒的好的Business腾讯现在专门 开...
在做报表数据统计时,我们用的是mysql + kafka + Spark Streaming方案,kafka监听mysql订单表中订单状态,然后...
好久没有更新文章了……这一年过得太忙。准备一篇个人认为值得拿出来分享的文章真的需要很多时间,如果你喜欢,请评论、点赞让我知道,我会抽更多的时间来...
正常来说 neo4j是用来图存储的,neo4j企业版 的性能远远高于 社区版,毕竟是收费的,不过 只要下载到就可以使用了,我已经用上了,非常棒。...
(一) openstack仿照的Amazon的云,hadoop仿照的是Google的云 openstack注重的是虚拟化/虚拟机及其配套的服务,...
前言 近两年,KUDU 在大数据平台的应用越来越广泛。在阿里、小米、网易等公司的大数据架构中,KUDU 都有着不可替代的地位。本文通过分析 KU...
Apache HAWQ是目前社区比较火的一种SQL-on-Hadoop方案,由Pivotal公司开发并贡献给了Apache社区。HAWQ的技术与...
GeoMesa 是由locationtech开源的一套地理大数据处理工具套件。其可在分布式计算系统上进行大规模的地理空间查询和分析。使用GeoM...
概述 在讲清楚了《zookeeper选举》的过程之后,突然有个疑问那就是既然完成了选举了,那么zookeeper集群中各个角色将会如何进入工...
Spark 默认采用的是资源预分配的方式。这其实也和按需做资源分配的理念是有冲突的。这篇文章会详细介绍Spark 动态资源分配原理。 前言 最近...
专题公告
收集较好的数据挖掘类文章,以及自己感兴趣的话题