240 发简信
IP属地:北京
  • debezium中binlog时区问题

    1.官方说明使用database.serverTimezone属性解决时区问题。可见:https://debezium.io/documenta...

  • java运行时区域

    简要记录下java运行时各个区域的作用和生命周期。 堆和方法区/元空间属于线程共享的区域,随着虚拟机进程的启动而存在。 程序计数器,本地方法栈,...

  • 小记一次jvm调优

    问题:young-gc频繁,每2秒收集一次,每次平均耗时25ms;full-gc平均82min一次,每次平均耗时40ms 目的:降低young-...

  • java gc几个常用的调优命令

    1.查看gc jstat -gc pid period(毫秒) 2.查看各年代堆栈以及gc信息 jmap -heap pid 3.查看类实例数量...

  • Resize,w 360,h 240
    spark实现加权采样(不放回)

    加权采样就是按照选定的权重列,根据权重值采样,如权重值是1.2和1.0;则value=1.2所属样本的被采样的概率就大一些。权重列必须为doub...

  • Resize,w 360,h 240
    idea本地调试spark demo 异常

    第一个问题:Caused by: java.lang.ClassNotFoundException: org.apache.spark.Spar...

  • spark读取外部配置文件的方法

    问题:有时我们需要在spark的程序中读取一些外部的配置文件,解决的方式也是比较多的,我这里记录一下我测试解决的方法: spark-submit...

  • 记录sqoop命令行参数-m和--split-by用法

    sqoop是apache开源项目,主要用于关系型数据库数据和hdfs数据的相互同步. 主要记录下-m和--split-by参数的使用: 1. 这...

  • echo $?

    $? 可以获取上一个命令的退出状态。所谓退出状态,就是上一个命令执行后的返回结果。 退出状态是一个数字,一般情况下,大部分命令执行成功会返回 0...