240 发简信
IP属地:江苏
  • 麻烦问下楼主,task失败重试会导致数据重复吗?

    Spark优雅的操作Redis

    Spark的优势在于内存计算,然而在计算中难免会用到一些元数据或中间数据,有的存在关系型数据库中,有的存在HDFS上,有的存在HBase中,但其读写速度都和Spark计算的速...

  • 120
    啥?啥是控制反转,依赖注入啊!?

    依赖倒置,控制反转,依赖注入及Google Guice 1. 依赖倒置 依赖 字面意思事物之间具有的一种关系。在面向对象编程中我将其理解为一种对象之间引用的持有关系。任何系...

  • JVM运行时数据区域及异常实战

    声明: 《深入理解Java虚拟机 JVM高级特性与最佳实践 第2版》。以下内容来自书中第二章。 1. JVM概述 JVM是Java Virtual Machine(Java虚...

  • 120
    Hadoop YARN RM内存泄露问题分析

    一、问题描述 YARN 版本升至2.9.1以后,RM每过一段时间就会发生一次切换且GC时间巨长,通过监控发现RM的内存一直在缓慢的增加。 二、问题分析 通过分析RM内存发现,...

  • 120
    JVM运行时数据区域及异常实战

    声明: 《深入理解Java虚拟机 JVM高级特性与最佳实践 第2版》。以下内容来自书中第二章。 1. JVM概述 JVM是Java Virtual Machine(Java虚...

  • 120
    Java多线程之原子操作

    1. 相关概念 本地缓存:程序运行时,为了提高运行的速度,CPU可以不直接跟内存进行通信,而是先将内存中的数据读到内部缓存,然后再进行操作。这样会提高效率,但是我们不知道本地...

  • Jackson之多态反序列化

    1.场景描述 JSON作为一种轻量级的数据交换格式,其清晰和简洁的结构能够轻松地与Java对象产生映射关系。例如,一个Coke(可口可乐)类的java代码如下: 用json描...

  • 120
    Druid.io查询分析

    前言 QueryId作为Druid区分查询的唯一标识,是我们定位查询问题有效的输入。用户查询有问题时,优先提供QueryId,如果在日志中捞不到的话,我们再根据dataSou...

  • 120
    Druid Coordinator源码分析

    前言 Druid Coordinator 服务在整个Druid架构中的主要作用是协调Segments在历史节点之间的分布。其主要功能包括是segments在historica...

  • 写的不错。受教了

    火焰图实践

    1. 场景描述: 因为生产环境组件服务进程执行缓慢导致部分资源无法释放,进而引起了各种任务超时。研究源码发现,部分执行过长的是操作都是在单线程中串行 。这就意味着,单个过程的...

  • 120
    火焰图实践

    1. 场景描述: 因为生产环境组件服务进程执行缓慢导致部分资源无法释放,进而引起了各种任务超时。研究源码发现,部分执行过长的是操作都是在单线程中串行 。这就意味着,单个过程的...

个人介绍
苏宁大数据平台Hadoop-YARN负责人