240 发简信
IP属地:江西
  • 120
    高级开发必须理解的Java中SPI机制

    本文通过探析JDK提供的,在开源项目中比较常用的Java SPI机制,希望给大家在实际开发实践、学习开源项目提供参考。 1 SPI是什么 SPI全称Service Provi...

  • 120
    对ClickHouse分片和分区的简单理解

    最近由于工作,接触到了现在比较🔥的OLAP数据库-ClickHouse,其中有个重要的概念就是分片(shard)。其实在MySql等传统的关系型数据库中,分库分表的架构也会用...

  • 120
    IntelliJ IDEA之UML类图

    生成方法 选中需要的类,右键单击Diagrams,之后点击Show Diagrams,或者快捷键Ctrl+Alt+Shift+U 如图所示 泛化(继承关系) 实线三角形箭头,...

  • 120
    ClickHouse WindowFunnel 函数修改建议

    背景 ClickHouse 作为性能卓越的OLAP引擎,有丰富的数据分析函数。公司增长分析侧使用 ClickHouse 的 windowFunnel 函数进行自定义漏斗和路径...

  • 编写Spark程序的几个优化点

    虽然spark已经提供了大量简单易用的API,但要想编写出高性能的spark应用,必须要对整体框架有一定的了解,对于Spark初学者来说是比较困难的。针对这个这个问题,其实在...

  • 120
    Hive的分桶详解

    Hive分桶通俗点来说就是将表(或者分区,也就是hdfs上的目录而真正的数据是存储在该目录下的文件)中文件分成几个文件去存储。比如表buck(目录,里面存放了某个文件如sz....

  • 120
    Flink SQL-Client 的使用

    flink sql client 介绍 The SQL Client aims to provide an easy way of writing, debugging, ...

  • LintCode 43 [Maximum Subarray III]

    原题 DescriptionGiven an array of integers and a number k, find k non-overlapping subarra...

  • 120
    一篇文章,教你学会Git

    本文转载于掘金Ruheng,总结非常好,故不再重复造轮子。 在日常工作中,经常会用到Git操作。但是对于新人来讲,刚上来对Git很陌生,操作起来也很懵逼。本篇文章主要针对刚开...

  • 120
    Hive 通过 UDAF 实现 `分组取前 Top N`

    数据统计分析中,对数据进行分组,取出每组数据的前 N 条数据 是非常经典的实践案例。举个例子 如下表 emp 所示: 通常可以通过以下方法实现: 取出每条数据的行号,再用 w...

  • ES 部署流程

    1. 添加用户 ( root 权限下执行 ) 2. 创建外部 log, data 路径 ( root 权限下执行 ) 3. 切换用户 ( root 权限下执行 ) 4. 建立...

  • 120
    Hadoop安装教程 HA高可用模式

    系统准备 一共三台机器 hadoop-01、hadoop-02、hadoop-02 hadoop-01 做 NameNode(active); hadoop-02 做 Nam...

  • @z苗_d771 :grin::grin:

    Flink -- Watermark 那些事

    Watermark 是 Flink 实时处理计算平台的一个重要概念,也是 Google 的著名实时计算论文 The Dataflow Model: A Practical Ap...

  • 120
    Flink -- Watermark 那些事

    Watermark 是 Flink 实时处理计算平台的一个重要概念,也是 Google 的著名实时计算论文 The Dataflow Model: A Practical Ap...