大数据流动 - 专题

投稿

大数据流动

收录了12篇文章 · 2人关注

大数据学习（一）-------- HDFS
需要精通java开发，有一定linux基础。 1、简介大数据就是对海量数据进行数据挖掘。已经有了很多框架方便使用，常用的有hadoop，st...

大数据流动 0 1
Kafka学习（一）-------- Quickstart
参考官网：http://kafka.apache.org/quickstart 一、下载Kafka 官网下载地址 http://kafka.ap...

大数据流动 0 0

Kafka学习（二）-------- 什么是Kafka
通过Kafka的快速入门 https://www.cnblogs.com/tree1123/p/11150927.html 能了解到Kafka的...

大数据流动 1 0
Kafka学习（三）-------- Kafka核心之Cosumer
了解了什么是kafka（ https://www.cnblogs.com/tree1123/p/11226880.html）以后学习核心api...

大数据流动 1 0
Flink入门（一）——Apache Flink介绍
Apache Flink是什么？在当代数据量激增的时代，各种业务场景都有大量的业务数据产生，对于这些不断产生的数据应该如何进行有效的处...

大数据流动 0 0
用户画像系统架构——从零开始搭建实时用户画像(二)
[图片上传失败...(image-185472-1590370876851)] 在《什么的是用户画像》一文中，我...

大数据流动 0 0
用户画像大数据环境搭建——从零开始搭建实时用户画像(四)
本章我们开始正式搭建大数据环境，目标是构建一个稳定的可以运维监控的大数据环境。我们将采用Ambari搭建底层的Hadoop环境，使用原生的方...

大数据流动 0 1

Spark Streaming，Flink，Storm，Kafka Streams，Samza：如何选择流处理框架
根据最新的统计显示，仅在过去的两年中，当今世界上90％的数据都是在新产生的，每天创建2.5万亿字节的数据，并且随着新设备，传感器和技术的出现，数...

大数据流动 0 1
Spark3.0分布，Structured Streaming UI登场
近日，在Spark开源十周年之际，Spark3.0发布了，这个版本大家也是期盼已久。登录Spark官网，最新的版本已经是3.0。而且不出意外，对...

大数据流动 0 0
Spark Streaming——Spark第一代实时计算引擎
虽然SparkStreaming已经停止更新，Spark的重点也放到了 Structured Streaming ，但由于Spark版本过低或者...

大数据流动 0 0