240 发简信
IP属地:北京
  • 120
    Apache griffin 正则表达式前后端交互问题

    在Apache griffin搭建完成以后,基于数据仓库的数据,陆续做了一些测试验证工作,主要应用的measure中的profile类型。在使用的过程中,遇到一个奇怪的问题。...

  • 120
    Apache griffin的搭建及应用

    我们面临的问题 随着接入产品的日益增多,以及数据仓库表、字段的日益丰富,数据侧和策略侧对数据质量的关注,越发的迫切;如何能够快速、高效的对核心数据资产,有一个清晰的认...

  • 120
    Spark Streaming中的scheduling delay问题

    最近由于疫情在家办公,事情比较多(主要在各种沟通和会上),一直没有更新;正好工作中有个case, 用到啦spark streaming, 所以随手记录一下,遇到的问题; 背景...

  • 120
    Flink内window机制的实现和应用

    在工作中需要计算指定时间段内的某产品新增用户,可以实现的技术方案有多种,比如Spark StructedStreaming和 Flink Streaming。下面以Flink...

  • 120
    Flink内如何生成StreamGraph

    Flink内,任务的提交执行通过调用StreamExecutionEnvironment类的execute方法,在这个过程中,flink会构建代表任务的StreamGraph...

  • 120
    Flink任务提交过程源码解析

    在Flink内提交任务时,命令行命令入下: flink run -c com.qihoo.anti.bootup coverage-stat-flink-1.0.jar 通过...

  • 120
    Airflow使用本地时区(修改源码)

    在最近的工作中,涉及到很多的数据流程,需要去维护和监控,耗费了不少的人力,但是效果却不理想。数据接入作为工作中基础的一环,数据接入的可靠性和稳定性,对后期业务的影响很大。为了...

个人介绍
stay hungry, stay foolish