Hadoop和Spark都是目前主流的大数据框架,但是随着Spark在速度和易用性方面表现出的优势,一些国内外专家逐渐推崇Spark技术,并且认为Spark才是大数据的未来。...

IP属地:江苏
Hadoop和Spark都是目前主流的大数据框架,但是随着Spark在速度和易用性方面表现出的优势,一些国内外专家逐渐推崇Spark技术,并且认为Spark才是大数据的未来。...
ClickHouse是俄罗斯的重要网络服务门户之一Yandex所开源的一套针对数据仓库场景的多维数据存储与检索工具,一个用于联机分析(OLAP)的列式数据库管理系统(DBMS...
近期在客户现场部署环境时遇到了一个问题,客户有较多的服务器没有安装系统,如果采用传统的光驱部署安装的方式太过繁琐耗时,因此就采用了PXE环境下kickstart批量装机的方式...
上两期回顾: 在第一期[https://www.jianshu.com/p/9f00a8e67b16](点击可参阅详情)中,我们通过性能故障排查解决了Hadoop2.6.0版...
在上一次我进行了超万亿规模的Hadoop NameNode问题的排查[https://www.jianshu.com/p/9f00a8e67b16],通过为时四天的努力,终于...
作者介绍 母延年,大数据领域数据分析处理专家,原腾讯和阿里巴巴大数据领域专家级工程师。曾在阿里开源项目Mdrill及腾讯Hermes项目担任核心开发人员。 随着国内互联网行业...