Spark源码编译 官方文档: https://spark.apache.org/docs/latest/building-spark.html[https://spark....
Spark源码编译 官方文档: https://spark.apache.org/docs/latest/building-spark.html[https://spark....
1、数据挖掘与机器学习 有时候,人们会对机器学习与数据挖掘这两个名词感到困惑。如果你翻开一本冠以机器学习之名的教科书,再同时翻开一本名叫数据挖掘的教材,你会发现二者之间有相当...
前言:在Hadoop 1.x版本,HDFS集群的NameNode一直存在单点故障问题:集群只存在一个NameNode节点,它维护了HDFS所有的元数据信息,当该节点所在服务器...
在日常flink应用中,相信大家经常会遇到checkpoint超时失败这类的问题,遇到这种情况的时候仅仅只会在jobmanager处打一个超时abort的日志,往往一脸懵逼不...
Flink 和 Spark 都是基于内存计算、支持实时/批处理等多种计算模式的统一框架 1,技术理念不同 Spark的技术理念是使用微批来模拟流的计算,基于Micro-bat...
从本章开始我们来介绍一个kafka集群逐步建立的过程; 集群中只有一台broker; topic的创建; 增加多台broker; 扩展已存在topic的partition; ...
导读: 作者介绍,本书作者有两位,一位是布莱尔.克里斯丁,是布朗大学计算机和哲学双学士,还是2009年人工智能洛伯纳大奖得主,另外一位汤姆.格里菲斯,是加州大学心理学和认知科...
1.背景: countDownLatch是在java1.5被引入,跟它一起被引入的工具类还有CyclicBarrier、Semaphore、concurrentHashMap...
转载:https://www.jianshu.com/p/45882f37f47e[https://www.jianshu.com/p/45882f37f47e] 1、本次教...
从在校大二开始到如今参加工作,接触了不少关于分布式的东西。但总是感觉分布式基础理论知识很含糊,不清晰。打算在这一周里梳理下相关的知识线路。 CAP理论 CAP理论又称CAP定...
一 概述 1.1 初步了解Netty Netty是什么? 为什么使用netty? Netty相对于NIO有什么优势? 1.2 Netty的架构是什么? 核心(Core) 传输...
最近和几位企业创始人/高管聊了聊数字化转型,大家明明都认同它是趋势,但谈及投资又极为犹豫。 一位创始人对他们的状态做了个极为形象的比喻:“(数字化)这东西现在就像保健品,大家...