3篇文章 · 5059字 · 1人关注
Delta Lake 是一个存储层,为 Apache Spark 和大数据 workloads 提供 ACID 事务能力,其通过写和快照隔离之间...
无限增长的表格 Structured Streaming 的关键思想是将持续不断的数据当做一个不断追加的表。 将输入的流数据当做一张 “输入表”...
前言 由于guava的版本在16.0以后,不向后兼容,所以Spark程序中集成HBase是会报找不到依赖的方法错误, 如下: 解决方案 使用 m...
文集作者