简介 在上一次的数据平台实践①中,对基于Flume,Kafka和Spark Streaming的数据平台组合做了介绍,这一次对业界流行的ELK组...
收录了9篇文章 · 1人关注
简介 在上一次的数据平台实践①中,对基于Flume,Kafka和Spark Streaming的数据平台组合做了介绍,这一次对业界流行的ELK组...
蜻蜓点水 Flume——数据采集 如果说,爬虫是采集外部数据的常用手段的话,那么,Flume就是采集内部数据的常用手段之一(logstash也是...
一、环境部署 hadoop集群2.7.1zookeerper集群kafka集群:kafka_2.11-0.10.0.0spark集群:spark...
原文链接:『 Spark 』5. 这些年,你不能错过的 spark 学习资源 写在前面 本系列是综合了自己在学习spark过程中的理解记录 + ...
文·blogchong 首先,如题,这篇依然是写给那些从其他领域跨界到大数据领域的朋友的,当然,初入大数据领域,或者对大数据领域有所兴趣的朋友,...
前言 最近在专注Spark开发,记录下自己的工作和学习路程,希望能跟大家互相交流成长本文章更倾向于实战案例,涉及框架原理及基本应用还请读者自行阅...
今天一大早就看到了一篇文章,叫【大数据对于运维的意义】。该文章基本上是从三个层面阐述的: 工程数据,譬如工单数量,SLA可用性,基础资源,故障率...
在前篇几十条业务线日志系统如何收集处理?中已经介绍了Flume的众多应用场景,那此篇中先介绍如何搭建单机版日志系统。 环境 CentOS7.0 ...
今天,在GitHub上偶然看到了Kailash Ahirwar作者的一个项目cheatsheets-ai,该项目包含了从不同渠道收集的数十张速查...
专题公告
大数据