应用对接的方式包含: mysql mongodb http 三种方式都可以实现对于预测器的透出;当然我们常见的都是http或者mysql的方式;...
代理模式学习 目的 提供一个代理者进入其他对象,并且能够控制它 例如,购买火车票不一定要去火车站买,可以通过 12306 网站或者去火车票代售点...
Nessie可以管理像git 分支,合并数据源等一些特性; 受git的版本管理启发 跨表事务和可见性 支持hive,spark,AWS Athe...
风控架构 需要解决用户是否是黑名单,是否是高质量用户,是否行为触发风控的角度;必须将实时模型和离线模型整合,这样才能做好一个模型 实时模型 离线...
问题一:如何保证数据按照事件时间准确的落到同一个分区; 使用watermark自定义分桶规则,参考链接:flink 落 hdfs 数据按照事件事...
由于线上查询大于1s,需要对于该次查询进行优化;为了加快查询的效率,我们在基础表上建立了一个物化视图 为了安全性的原因,去掉了一些细节;大概的意...
主要是在极客时间中的学习笔记摘入 kakfa源码阅读 第一部分 日志 日志组织架构 kafka日志对象有多个日志端对象组成,包括消息日志文件(....
clickhouse在用户画像中的使用 将用户标签放在clickhouse中,并且用bitmap形式,可以减少用户空间,同时能够加快用户查询标签...
目前我们公司后台使用clickhouse,来做数据的离线分析;配置为四台集群(shard)通过springboot+clickhouse-jdb...
文集作者