2020 年是近代史上史无前例的一年。人类在过去一百年中都没有经历过像 COVID-19 这样的全球性大流行病。它影响了我们星球上所有的国家、部门和几乎所有的个人。 一年以前...
IP属地:广东
2020 年是近代史上史无前例的一年。人类在过去一百年中都没有经历过像 COVID-19 这样的全球性大流行病。它影响了我们星球上所有的国家、部门和几乎所有的个人。 一年以前...
开源大数据OLAP组件,可以分为MOLAP和ROLAP两类。ROLAP中又可细分为MPP数据库和SQL引擎两类。对于SQL引擎又可以再细分为基于MPP架构的SQL引擎和基于通...
1.1 什么是OLAP? OLAP(OnLine Analytical Processing),即联机分析处理。OLAP对业务数据执行多维分析,并提供复杂计算,趋势分析和复杂...
需求背景 使用spark sql形式操作hive库表数据时,hive-site.xml中的钩子函数不会执行,原因是spark操作hive是独立操作的,简单理解就是spark利...
去年,对产品的数据架构进行了一次较大规模的重构。通过这次重构,大幅提升了整体性能和数据质量。在此,把这次数据架构重构的过程和心得总结一下,为以后数据架构设计提供些参考…… 一...
今天解读的内容是来自 Spark Summit EU 2016 关于 Alluxio 的一个介绍:Effective Spark with Alluxio (视频:http...
消息保存或缓存在磁盘上,一般认为磁盘读写数据是会降低性能,因为寻址会消耗时间,实际Kafka特性之一是高吞吐率。 Kafka轻松支持普通服务器每秒百万级写入请求,超过了大部分...