大数据 - 专题

投稿

大数据

收录了9篇文章 · 1人关注

数据平台实践②——Logstash+Elasticsearch+Kibana
简介在上一次的数据平台实践①中，对基于Flume，Kafka和Spark Streaming的数据平台组合做了介绍，这一次对业界流行的ELK组...

playwolf719 0 6
数据平台实践①——Flume+Kafka+SparkStreaming(pyspark)
蜻蜓点水 Flume——数据采集如果说，爬虫是采集外部数据的常用手段的话，那么，Flume就是采集内部数据的常用手段之一（logstash也是...

0.2 playwolf719 1 26

spark streaming + kafka +python(编程)初探
一、环境部署 hadoop集群2.7.1zookeerper集群kafka集群：kafka_2.11-0.10.0.0spark集群：spark...

0.2 玄月府的小妖在debug 11 23
『 Spark 』5. 这些年，你不能错过的 spark 学习资源
原文链接：『 Spark 』5. 这些年，你不能错过的 spark 学习资源写在前面本系列是综合了自己在学习spark过程中的理解记录＋ ...

0.7 litaotao 5 89
大数据跨界，从这里开始
文·blogchong 首先，如题，这篇依然是写给那些从其他领域跨界到大数据领域的朋友的，当然，初入大数据领域，或者对大数据领域有所兴趣的朋友，...

0.1 数据虫巢 6 34 1
基于Kafka+SparkStreaming+HBase实时点击流案例
前言最近在专注Spark开发，记录下自己的工作和学习路程，希望能跟大家互相交流成长本文章更倾向于实战案例，涉及框架原理及基本应用还请读者自行阅...

0.2 MichaelFly 1 50 1
用大数据思维做运维监控
今天一大早就看到了一篇文章，叫【大数据对于运维的意义】。该文章基本上是从三个层面阐述的：工程数据，譬如工单数量，SLA可用性，基础资源，故障率...

0.1 祝威廉 5 29 1

教你一步搭建Flume分布式日志系统
在前篇几十条业务线日志系统如何收集处理？中已经介绍了Flume的众多应用场景，那此篇中先介绍如何搭建单机版日志系统。环境 CentOS7.0 ...

欢醉 2 19
大数据、机器学习、深度学习Python库必备速查表，快来收藏！
今天，在GitHub上偶然看到了Kailash Ahirwar作者的一个项目cheatsheets-ai，该项目包含了从不同渠道收集的数十张速查...

0.5 大数据学习02 3 104