Avatar notebook default
37篇文章 · 24669字 · 1人关注
  • mindsdb 源码解析

    应用对接的方式包含: mysql mongodb http 三种方式都可以实现对于预测器的透出;当然我们常见的都是http或者mysql的方式;...

  • Resize,w 360,h 240
    代理模式

    代理模式学习 目的 提供一个代理者进入其他对象,并且能够控制它 例如,购买火车票不一定要去火车站买,可以通过 12306 网站或者去火车票代售点...

  • Nessie 像git一样管理你的数据

    Nessie可以管理像git 分支,合并数据源等一些特性; 受git的版本管理启发 跨表事务和可见性 支持hive,spark,AWS Athe...

  • Resize,w 360,h 240
    风控模型的实践思考

    风控架构 需要解决用户是否是黑名单,是否是高质量用户,是否行为触发风控的角度;必须将实时模型和离线模型整合,这样才能做好一个模型 实时模型 离线...

  • 使用flink 中遇到的问题总结

    问题一:如何保证数据按照事件时间准确的落到同一个分区; 使用watermark自定义分桶规则,参考链接:flink 落 hdfs 数据按照事件事...

  • clickhouse 物化视图的踩坑记录

    由于线上查询大于1s,需要对于该次查询进行优化;为了加快查询的效率,我们在基础表上建立了一个物化视图 为了安全性的原因,去掉了一些细节;大概的意...

  • Resize,w 360,h 240
    kafka 源码阅读-LogSegment(一)

    主要是在极客时间中的学习笔记摘入 kakfa源码阅读 第一部分 日志 日志组织架构 kafka日志对象有多个日志端对象组成,包括消息日志文件(....

  • clickhouse 常见使用方法

    clickhouse在用户画像中的使用 将用户标签放在clickhouse中,并且用bitmap形式,可以减少用户空间,同时能够加快用户查询标签...

  • clickhouse SLB 服务搭建

    目前我们公司后台使用clickhouse,来做数据的离线分析;配置为四台集群(shard)通过springboot+clickhouse-jdb...

文集作者