Jasper_Chen - 简书

发简信

Jasper_Chen

1
关注
7
粉丝
23
文章
37297

字数
10

收获喜欢
1

总资产

IP属地：四川

Jasper_Chen

Spark故障排除
1. 控制reduce端缓冲大小以避免OOM 在Shuffle过程，reduce端task并不是等到map端task将其数据全部写入磁盘后再去拉取，而是map端写一点数据，r...

272 0 0
Jasper_Chen

Spark 数据倾斜解决方案
Spark中的数据倾斜问题主要指shuffle过程中出现的数据倾斜问题，是由于不同的key对应的数据量不同导致的不同task所处理的数据量不同的问题。例如，reduce点一...

328 0 0

Jasper_Chen

Spark调优
常规性能调优 1. 最优资源配置 Spark性能调优的第一步，就是为任务分配更多的资源，在一定范围内，增加资源的分配与性能的提升是成正比的，实现了最优的资源配置后，在此基础上...

449 0 0
Jasper_Chen

Hive调优
Fetch抓取 Fetch抓取是指，Hive中对某些情况的查询可以不必使用MapReduce计算。例如：SELECT * FROM employees; 在这种情况下，Hiv...

322 0 1
Jasper_Chen

SpringCloud Eureka Server配置优化
1. Eureka的自我保护默认情况下，如果EurekaServer在一定时间内（默认90秒）没有接收到某个微服务实例的心跳，Eureka Server将会移除该实例。但是...

381 0 0
Jasper_Chen

Hbase数据模型及其架构原理
HBase数据模型逻辑上，HBase的数据模型同关系型数据库很类似，数据存储在一张表中，有行有列。但从HBase的底层物理存储结构（K-V）来看，HBase更像是一个mul...

434 0 0
Jasper_Chen

HDFS架构及其工作原理
HDFS架构 NameNode: 就是Master，它就是一个主管，管理者（1）管理hdfs的名称空间（2）配置副本策略（3）管理数据块（Block）映射信息（4）处理客户端...

320 0 0

Jasper_Chen

Kafka介绍及其工作原理
Kafka是一个分布式，基于发布/订阅模式的消息队列，主要应用于大数据实时处理领域。基础架构为了方便扩展，并提高吞吐量，一个topic分为多个partition 配合分区...

689 0 0
Jasper_Chen

RocketMQ介绍及其工作原理
RocketMQ是一个开源的分布式消息中间件。集群架构与角色 Producer先去NameServer请求，NameServer分配一个Broker给Producer，Pr...

3160 0 3
Jasper_Chen

Spring源码剖析（二） - Bean对象的三级缓存
前面讲到Spring在创建Bean的过程中使用了三级缓存来对Bean对象进行缓存。这个三级缓存是用来解决对象的循环依赖问题。什么是对象的循环依赖？举个例子： class ...

592 0 0
Jasper_Chen

Spring源码分析（一） - 概述以及Bean的创建
应用上下文创建流程概览源码剖析创建Spring应用程序上下文进入ClassPathXmlApplicationContext构造函数（1）调用父类构造方法，创建Res...

159 0 0
Jasper_Chen

FastDFS工作原理浅析
什么是FastDFS FastDFS 是一个 C 语言实现的开源轻量级分布式文件系统,作者余庆(happyfish100),支持 Linux、FreeBSD、AID 等 Un...

394 0 0

Jasper_Chen

ElasticSearch相关性算分
搜索的相关性算分，描述了一个文档和查询语句匹配的程度。ES会对每个匹配查询条件结果进行算分_score. 打分的本质是排序，需要把最符合用户需求的文档排在前面。ES5之前，算...

548 0 0
Jasper_Chen

ElasticSearch倒排索引及其原理
正排索引：文档ID到文档内容和单词的关联倒排索引：单词到文档ID的关系备注：ES对文档每个字段都有自己的倒排索引，可以指定某些字段不做索引，这样可以节省存储空间，缺点是这个...

6392 0 0
Jasper_Chen

Redis-Cluster浅析
简述 redis cluster是Redis的分布式解决方案，在3.0版本推出后有效地解决了redis分布式方面的需求. 自动将数据进行分片，每个master上放一部分数据，...

183 0 0
Jasper_Chen

Redis内存淘汰策略
当Redis内存超过最大允许的内存之后，Redis就会触发内存淘汰策略(阈值可配置) 早期Redis版本：allkeys-random：在所有的缓存中随机删除（不推荐）all...

458 0 0
Jasper_Chen

Redis缓存穿透，击穿，雪崩
缓存穿透缓存穿透是指缓存和数据库中都没有的数据，而用户不断发起请求。由于缓存是不命中时被动写的，并且出于容错考虑，如果从存储层查不到数据则不写入缓存，这将导致这个不存在的数...

115 0 0

Jasper_Chen

Redis跳表，压缩表，quicklist
跳表(skiplist) 跳表由多层链表组成，通过先比较上一层的大小，就可以很快找到该值在下一层的区间范围。时间复杂度为log(n). Redis的zset，有序集合，是字典...

1751 0 6
Jasper_Chen

Redis持久化机制
一，RDB 每隔一段时间，把内存中的数据写入磁盘的临时文件，作为快照，恢复的时候把快照文件读进内存。优势每隔一段时间备份，全量备份灾备简单，可以远程传输子进程备份的时...

141 0 0
Jasper_Chen

Redis线程模型
在Redis启动及初始化的时候,Redis会(预先)将连接应答处理器跟"AE_READABLE"事件关联起来,接着如果一个客户端向Redis发起连接,此时就会产生一个"AE_...

176 0 0

个人介绍

人与人最大的差别，是思维的差距