IP属地:广东
Scala 学习笔记 1.函数式编程 函数式编程:函数式编程把函数当作一等公民,充分利用函数,支持函数的多种使用方式。在scala中,函数可以像...
Scala实现:KD-Tree(k-dimensional tree) kd-tree是一种分割k维数据空间的数据结构。主要应用于多维空间数据的...
Spark 本地连接OSS 1. 对象存储 OSS 阿里云对象存储服务(Object Storage Service,简称 OSS),是阿里云提...
本文结合Vincenty公式计算椭圆形地球模型目标点的方法 参考资料 http://www.movable-type.co.uk/scripts...
1.为什么需要异步IO flink在做实时处理时,有时候需要和外部数据交互,但是通常情况下这个交互过程是同步的,这样就会产生大量的等待时间;而异...
随机变量及其概率分布 随机变量(r.v)是研究随机试验中的一串事件:比如掷一颗骰子,用X表示骰子的点数,由于X的取值我们无法确定,所以称X是一个...
我们平时在做报表的时候,经常会有各种分维度的汇总计算,在spark中我们最常用的就是groupBy操作,groupBy就是按照给定的字段名分组,...
描述统计 1.描述数据水平的统计量 平均数(平均数反映了一组数的平均水平,平均数会受到极端值的影响),在计算时一般使用算术平均数: 分位数:四分...