240 发简信
IP属地:江苏
  • Hive 设置

    beeline 方式设置mapreduce, tez参数出现错误 需要通过参数hive.security.authorization.sqlstd.confwhitelist...

  • 120
    Yarn 队列设置

    设置:yarn.resourcemanager.scheduler.class Capacity Scheduler,定义flink、default两个队列,各自50%

  • 120
    Hive 分区location

    https://blog.csdn.net/MrZhangBaby/article/details/100581183 1.显示Table和Partition的详细信息 2....

  • Sqoop

    -Dorg.apache.sqoop.splitter.allow_text_splitter=true // If your database sorts...

  • Hive 数据导入 HBase

    https://segmentfault.com/a/1190000011616473 一、Hive 跑批1.建表 默认第一个字段会作为hbase的rowkey。 2.导入数...

  • 120
    《Prometheus监控实战》读书笔记

    Prometheus是一个开源的监控系统。 一、监控简介 监控不仅仅只是系统的技术指标,还可以是业务指标。确保为客户提供可靠恰当的产品。在生产系统中,监控是必须的,它应该和应...

  • Spark on yarn 日志收集

    Spark on yarn 模式,日志会随机分配到某个磁盘。为了Flume收集,需要在提交任务时通过自定义log4j,再写一份日志写到某个固定目录下。 log4j-execu...

  • Hive 遗留子进程频繁操作HDFS

    NameNode日志中频繁出现rename失败的日志,且频繁GC 根据日志发现查尝试rename 文件/apps/hive/warehouse/zs_db.db/umetri...

  • 120
    Streamsets

    https://streamsets.com/products/dataops-platformhttps://archives.streamsets.com/index.h...

  • Beeline doesn't work with -e option when started in background

    Beeline doesn't work with -e option when started in background 原帖:http://www.zhangdongs...

  • 安装Ranger UserSync for LDAP

    https://cwiki.apache.org/confluence/display/RANGER/Configure+Ranger+UserSync+for+LDAP h...

  • 120
    007.Azkaban-3.x 页面操作手册

    1. 创建Flow 使用Azkaban Flow 2.0 来创建任务流,Flow 1.0 将被废弃 创建一个名为flow20.project的文本文件,添加如下内容用以说明这...

  • 120
    Spark之Spark Streaming原理

    一、Spark Streaming概述 Spark Streaming类似于Apache Storm,用于流式数据的处理,具有高吞吐量和容错能力强等特点。Spark Stre...