引言 HyperLogLog算法经常在数据库中被用来统计某一字段的Distinct Value(下文简称DV),比如Redis的HyperLogLog结构,出于好奇探索了一下...

引言 HyperLogLog算法经常在数据库中被用来统计某一字段的Distinct Value(下文简称DV),比如Redis的HyperLogLog结构,出于好奇探索了一下...
前言 Flink从1.12.0上对流式API新增一项特性:可以根据你的使用情况和Job的特点, 可以选择不同的运行时执行模式(runtime execution modes)...
一、基本思想 贪心算法采用每一步都选取当前状态下最优的选择,这样虽然能得到局部最优解,但是可能无法求得全局最优解。 比如最简单的背包问题,将背包的价值v与背包的重量w相除,得...
HTTP/2.0在2015年就已经正式发布了,但是现在大部分网站还在使用HTTP/1.1协议。具体怎么查看网站采用的是HTTP/1.1,还是HTTP/2.0呢,本篇就介绍几种...
综述: 目前深度学习模型在移动端的使用已越来越广泛,而移动端设备的性能表现自然无法与PC端相提并论,目前市面上基本所有的训练框架训练出来的模型都无法直接在移动端上使用和推理,...
1、MNIST数据集简介 60000张图片,包括10个类别,每个类别均为6000张,60000 = 10 * 6000; 训练集50000张,测试集10000张; 图片大小均...
概述 我们知道事务性在数据处理里面是非常重要的,事务性决定了你最终数据的正确与否。在 OLTP 领域里面事务一般通过底层存储提供的事务机制就可以搞定了。但是在分布式数据处理领...
最近 Presto 社区在它的发源地 Facebook 公司举行了它历史上的第一次 Summit, 目前 PPT 已经都放出来了,看了一遍,还是有不少收获的,这里介绍一下 F...
前言 Presto是一款Facebook开源的MPP架构的OLAP查询引擎,可针对不同数据源执行大容量数据集的一款分布式SQL执行引擎。因为工作中接触到Presto,研究它对...
1、什么是CGLIB CGLIB(Code Generator Library)是一个强大的、高性能的代码生成库。其被广泛应用于AOP框架(Spring、dynaop)中,用...
http keepalive 介绍 在http早期,每个http请求都要求打开一个tpc socket连接,并且使用一次之后就断开这个tcp连接。 使用keep-alive可...
一、什么是udev? udev是linux kernel的设备管理器,在最新的内核版本中kernel_3.10中udev已经代替了以前devfs、hotplug等功能,意味着...
Flink 使用介绍相关文档目录 Flink 使用介绍相关文档目录[https://www.jianshu.com/p/74f1990d047c] CDC 简介 CDC即Ch...
首先说一句,master和worker是物理节点,driver和executor是进程。 1,master和worker节点 搭建spark集群的时候我们就已经设置好了mas...
TinkerPop中对于图的计算,底层的计算引擎是通过GraphComputer来提供的 1. 计算的分类 TinkerPop提供的2种和图数据交互的方式: OLTPOLAP...
C++11的版本在类型系统上下了很大的功夫,添加了诸如auto,decltype,move等新的关键词来简化代码的编写与降低阅读代码的难度。为了更好的理解这些新的语义,笔者确...
本文按照 cppreference[https://en.cppreference.com/w/] 列出的特性列表依次介绍。本篇文章较长,而且都是内容「离散」的语言特性介绍,...
前言 笔者在之前的文章中已经提到过,MergeTree引擎族是ClickHouse强大功能的基础。MergeTree这个名词是在我们耳熟能详的LSM Tree之上做减法而来—...
2020年快要过去了,写博客的习惯还是得捡起来。最近刚刚忙完搬家的事情,抽出一点时间简单聊两句。 为什么要有LowCardinality 在常见数据库系统的类型体系中,字符串...