k_wzzc - 简书

发简信

k_wzzc

78
关注
58
粉丝
39
文章
18513

字数
32

收获喜欢
9

总资产

IP属地：河北

k_wzzc

SeanCheney
写了 803226 字，被 11480 人关注，获得了 8996 个喜欢
k_wzzc

tgbaggio
写了 40635 字，被 135 人关注，获得了 137 个喜欢

《精通数据科学：从线性回归到深度学习》作者、数据科学家～～<br><br>欢迎关注我的课程（免费的哦）：<a href="https://study.163.com/course/courseMain.htm?courseId=1006187021&share=2&shareId=400000000447072" rel="nofollow" target="_blank">https://study.163.com/course/courseMain.htm?courseId=1006187021&share=2&shareId=400000000447072</a>

k_wzzc

Flink实战剖析
写了 8091 字，被 119 人关注，获得了 56 个喜欢

专注Flink实时计算，分享Flink相关的原理、源码、使用经验等。同时会分享离线/实时数仓、OLAP、数据架构等干货。<br>欢迎关注微信公众号【Flink实战剖析】，获取更多信息~
k_wzzc

Scala 学习笔记
Scala 学习笔记 1.函数式编程函数式编程：函数式编程把函数当作一等公民，充分利用函数，支持函数的多种使用方式。在scala中，函数可以像变量一样，既可以作为函数的参数...

542 0 1
k_wzzc

建立自己的语料库
最近和一些人讨论到什么样的人才能算作专家，其中有一个问题是专家是不是应该能说会写？这个问题很有意思，这里说的“能说会写”，广义的认为就是一个人的高质量输出能力。大部分人在...

豪哥的世界
12740 1 6
k_wzzc

spark 实现逻辑回归

975 0 0
k_wzzc

Apache Spark 3.0 预览版正式发布，多项重大功能发布
原文地址 2019年11月08日数砖的 Xingbo Jiang 大佬给社区发了一封邮件，宣布 Apache Spark 3.0 预览版正式发布，这个版本主要是为了对...

code_solve
729 0 8

k_wzzc

Flink基本原理
1.支持流处理的引擎：Spark和Flink Spark:基于批处理来模拟流的计算；Flink：基于流计算来模拟批处理；流式：只要数据一直在产生，计算就持续地进行批处理：在预...

将军红
2307 1 9
k_wzzc

Scala实现：KD-Tree(k-dimensional tree)
Scala实现：KD-Tree(k-dimensional tree) kd-tree是一种分割k维数据空间的数据结构。主要应用于多维空间数据的搜索，经常使用在SIFT、KN...

568 0 0
k_wzzc

Spark 本地连接OSS
Spark 本地连接OSS 1. 对象存储 OSS 阿里云对象存储服务（Object Storage Service，简称 OSS），是阿里云提供的海量、安全、低成本、高可靠...

2745 0 0
k_wzzc

已知一点经纬度及与另一点距离和航向，求另一点经纬度
本文结合Vincenty公式计算椭圆形地球模型目标点的方法参考资料 http://www.movable-type.co.uk/scripts/latlong-vincen...

2519 1 0
k_wzzc

google-s2背后的数学
我相信，很多人看到这个都是对google-s2有了解的，所以我在这里废话就不多说了，直接进入正题。首先我们先看下目前都有什么资源（1）GO源码：github.com/go...

夜尽天明时
10080 0 14

k_wzzc

Flink 异步I/O
1.为什么需要异步IO flink在做实时处理时，有时候需要和外部数据交互，但是通常情况下这个交互过程是同步的，这样就会产生大量的等待时间；而异步操作可以在单个函数实例中同时...

1438 0 0
k_wzzc

大数据之统计学基础(二)：随机变量及其概率分布
随机变量及其概率分布随机变量(r.v)是研究随机试验中的一串事件：比如掷一颗骰子，用X表示骰子的点数，由于X的取值我们无法确定，所以称X是一个随机变量，随机变量的取值随机会...

1548 0 0
k_wzzc

Spark DataFrame中rollup和cube使用
我们平时在做报表的时候，经常会有各种分维度的汇总计算，在spark中我们最常用的就是groupBy操作，groupBy就是按照给定的字段名分组，后面接sum、count、av...

5562 1 4
k_wzzc

大数据之统计学基础(一) -- 描述统计
描述统计 1.描述数据水平的统计量平均数（平均数反映了一组数的平均水平，平均数会受到极端值的影响），在计算时一般使用算术平均数：分位数：四分位数、中位数（中位数反映一组数...

1100 0 0
k_wzzc

markdown中公式编辑教程
标签： Mathjax 公式编辑 markdown 目录希腊字母上标与下标括号小括号与方括号大括号尖括号上取整下取整求和与积分求和积分其他分式与根式分式连分数根式 ...

shaniadolphin
258087 12 193 1

k_wzzc

Scala实现机器学习中常用的相识度和距离计算
在机器学习和人工智能领域，距离(distance)、相似度(similarity)是经常出现的基本概念，关于距离和相似度度量的方法也多种多样，本文将总结一些常用的距离计算方法...

1302 0 0

暂无个人介绍