240 发简信
IP属地:北京
  • 120
    flink checkpoint/savepoint的metadata文件格式详解

    源头 flink的checkpoint和savepoint用于恢复作业状态,在恢复作业时,如果存在多个checkpoint,将获取最新的checkpoint来进行恢复,没有c...

  • 鉴于各种压缩算法的压缩比一般不超过50%,则每个tablet中的数据量在压缩前的大小建议应小于2G
    这个逻辑是不是有点问题?

    Kudu在使用过程中的各种限制

    主键 表创建后,主键不能修改。必须删除重建表指定新的主键。 主键列必须在非主键列之前 主键列的值不能使用UPDATE函数修改。如果要修改主键的值只能删除该行重新插入。 DOU...

  • Kudu Impala时区问题,最后解决了吗?

    Kudu Impala使用过程中印象深刻的问题总结

    最近项目中使用 Kudu Impala作为数仓,使用过程中遇到一些印象深刻的问题,以此记录为笔记作为总结 Kudu Impala的decimal 数据类型问题: Kudu在1...

  • 120
    监督学习之分类算法

    在已标签的训练数据中构建分类模型,并在此基础上,对新数据进行分类。这就是分类算法要解决的问题。 分类算法的准确性,取决于以下三个方面:1)所选算法的有效性;2)算法的运用方式...