分布式日志收集框架Flume 1.业务现状分析 WebServer/ApplicationServer分散在各个机器上 想在大数据平台Hadoo...
收录了7篇文章 · 6人关注
分布式日志收集框架Flume 1.业务现状分析 WebServer/ApplicationServer分散在各个机器上 想在大数据平台Hadoo...
0. 目录 Kafka概述 Kafka架构及核心概念 Kafka部署及使用 Kafka容错性测试 Kafka API编程 Kafka实战 1. ...
0. 目录 Spark源码编译 Spark环境搭建 Spark简单使用 1. Spark源码编译 http://spark.apache.org...
目录 业务现状分析 实时流处理产生背景 实时流处理概述 离线计算与实时计算对比 实时流处理框架对比 实时流处理架构与技术选型 实时流处理在企业中...
1. YARN产生背景 Hadoop1.x时:MapReduce1.x存在问题:单点故障&节点压力大不易扩展&不能支持除了MR以外的任务MapR...
0. 普通分布式文件系统设计思路 文件以多副本的方式,整个文件存放到单机中。 缺点:文件不管有多大都存储在一个节点上,在进行数据处理的时候很难进...
1. hadoop是什么? Apache开源软件 计算框架--》分布式、可靠、可伸缩(任何节点删除添加不会影响) 搜索引擎、海量数据存储 2. ...
专题公告
微服务,大数据,机器学习技术收录。