
8篇文章 · 8096字 · 1人关注
Apache Arrow定义: Apache Arrow定义了一个各语言通用(language-agnostic)的列式内存格式(columna...
chatgpt写代码的能力早就有所耳闻,作为一个程序员,我也对其很感兴趣,因此我尝试和他对线起来,发现chatgpt的许多“人性”。 神奇九转,...
最近试玩chatgpt,向他问了一些有趣的问题。一开始我把它当作一个搜索的功能在用,后来逐渐感觉变成了聊天式,感受到了互动的感觉。 我问它:五点...
Kafka Kafka是一种高吞吐量的分布式发布订阅消息系统。用于日志处理的分布式消息队列,同时支持离线和在线日志处理。具有高性能、持久化、多副...
数据湖: 数据存储架构+数据处理工具的一套解决方案。概念:数据湖就是一个巨大的数据集合,汇聚了来自各个系统的任意数据格式的原始数据(作为数据库)...
Redis 数据存放在内存中,需要配置持久化将数据保存在磁盘上,redis提供两种方式进行持久化: 1、RDB持久化(原理是将Reids在内存中...
Spark RDD: 弹性分布式数据集 (Resilient Distributed DataSet) RDD的三个基本特性:分区、不可变、并行...
Hive Hive是读时模式: 在传统数据库里,表的模式是在数据加载时强制确定的。如果在加载时发现数据不符合模式,则被拒绝加载数据。 因为数据是...
文集作者