Bloom Filter 可以知道某个key “可能”存在于集合中,也能确定整个key肯定不存在于集合中,但无法算集合中总共有多少个不同的key
SQL优化(二) 快速计算Distinct Count本文介绍了distinct count的SQL优化方法,以及常用的高效近似算法及其在PostgreSQL上的实现。 UV vs. PV 在互联网中,经常需要计算UV和PV。所...
Bloom Filter 可以知道某个key “可能”存在于集合中,也能确定整个key肯定不存在于集合中,但无法算集合中总共有多少个不同的key
SQL优化(二) 快速计算Distinct Count本文介绍了distinct count的SQL优化方法,以及常用的高效近似算法及其在PostgreSQL上的实现。 UV vs. PV 在互联网中,经常需要计算UV和PV。所...
很高兴写的内容对你有帮忙
SQL优化(四) PostgreSQL存储过程原创文章,首发自作者个人博客Jason's Blog。转载请务必在文章开头处注明出自Jason's Blog,并给出原文链接 存储过程简介 什么是存储过程 百度百科是这么描述...
本来对Postgre存储过程一脸懵逼 ,现在入门了 谢谢 衷心感谢,写的比好多博客好的多
原创文章,转载请务必将下面这段话置于文章开头处。本文转发自技术世界,原文链接http://www.jasongj.com/spark/cbo/ 本文所述内容均基于 2018年...
原创文章,转载请务必将下面这段话置于文章开头处。本文转发自技术世界,原文链接http://www.jasongj.com/spark/rbo/ 本文所述内容均基于 2018年...
原创文章,转载请务必将下面这段话置于文章开头处(保留超链接)。本文转发自技术世界,原文链接http://www.jasongj.com/java/concurrenthash...
博主,请问你的这个图是用什么画的?
Spark Streaming使用Kafka保证数据零丢失源文件放在github,随着理解的深入,不断更新,如有谬误之处,欢迎指正。原文链接https://github.com/jacksu/utils4s/blob/master/...
测试源码 下面来看看groupByKey和reduceByKey的区别: 虽然两个函数都能得出正确的结果, 但reduceByKey函数更适合使用在大数据集上。 这是因为Sp...
分布式系统里的Shuffle 阶段往往是非常复杂的,而且分支条件也多,我只能按着我关注的线去描述。肯定会有不少谬误之处,我会根据自己理解的深入,不断更新这篇文章。 前言 借用...
源文件放在github,如有谬误之处,欢迎指正。原文链接https://github.com/jacksu/utils4s/blob/master/spark-knowled...
简单概括就是使用非对称加密传输一个随机密钥,然后使用这个密钥对之后的数据进行对称加密。传输数据使用对称加密而不是非对称加密是因为非对称加解密比对称加解密开销大
https加密完整过程https加密完整过程 step1: “客户”向服务端发送一个通信请求 “客户”->“服务器”:你好 step2: “服务器”向客户发送自己的数字证书。证书中有一个公钥用来加...
spark 2.X开始,三者的关系发生了变化,可以参考《且谈Apache Spark的API三剑客:RDD、DataFrame和Dataset》 ,在2.X中DataFram...
创文章,转载请务必将下面这段话置于文章开头处。本文转发自Jason's Blog,原文链接http://www.jasongj.com/java/multi_thread/ ...
创文章,转载请务必将下面这段话置于文章开头处。本文转发自Jason's Blog,原文链接http://www.jasongj.com/java/multi_thread/ ...
原创文章,转载请务必将下面这段话置于文章开头处。本文转发自Jason's Blog,原文链接http://www.jasongj.com/java/thread_safe/ ...
@王大虎 之前的链接有点问题,现在修复了
Java进阶系列(二)当我们说线程安全时,到底在说什么原创文章,转载请务必将下面这段话置于文章开头处。本文转发自Jason's Blog,原文链接http://www.jasongj.com/java/thread_safe/ ...
原创文章,转载请务必将下面这段话置于文章开头处。本文转发自Jason's Blog,原文链接http://www.jasongj.com/java/thread_safe/ ...
我觉得编程的框架应该分为:直接用->抛弃->重拾 框架(framework)是一个基本概念上的结构,用于去解决或者处理复杂的问题。这个广泛的定义使用的十分流行,尤其在软件概念...