Spark执行模型 Spark执行模型可以分为三部分:创建逻辑计划,将其翻译为物理计划,在集群上执行task。 可以在http://<driver-node>:40...
Spark执行模型 Spark执行模型可以分为三部分:创建逻辑计划,将其翻译为物理计划,在集群上执行task。 可以在http://<driver-node>:40...
1、缓存穿透 缓存穿透是指查询一个不存在的数据,由于缓存不命中,而将请求全部打到数据库上的情况。缓存起不到作用,请求每次都会走到数据库,流量大时数据库可能会被打挂。此时缓存就...
基于flink-1.8.1 本文转载自一文搞懂Flink内部的Exactly Once和At Least Once 如何理解flink中state(状态) state泛指 s...
Parquet调研报告 1. 概述 1.1 简介 Apache Parquet是Hadoop生态圈中一种新型列式存储格式,它可以兼容Hadoop生态圈中大多数计算框架(Had...
在Spring Cloud中一般都使用Eureka做服务治理,本文先快速体验一下基于Eureka完成一次远程调用 Eureka Server搭建 类似于Spring Clou...
基本的垃圾回收算法 判断对象是否可被回收 引用计数法,被零引用的对象可回收。但是很难解决相互引用的问题 从 gc root 开始搜索,搜索不到的对象可回收。Java 的垃圾回...
2016年7月,开始逐渐转变生活方式,10月时固定下一些习惯。到今天,满打满算三个多月,说的长点就是半年。 最新2017年上半年总结已写~http://www.jianshu...
版本选型 spark 1.5.2 + kafka 0.9.0.1 + Elasticsearch 2.2.1 安装部署 1. 安装脚本及文件 密码 4m7l 安装脚本和...
问题描述:公司中一个项目我们用netty接收厂商提供的数据入kafka,接收速度较慢,入kafka也比较慢,需要对其进行一些优化。问题解决:利用一周左右的时间对其代码和相关配...