何几时 - 简书

发简信

23
关注
2
粉丝
51
文章
9648

字数
3

收获喜欢
2

总资产

IP属地：广东

何几时

Spark应用程序调试方法详解
简介 Spark是基于内存计算的开源分布式大数据计算框架。为了更好、更快地开发Spark应用程序，开发者不仅要掌握Spark的理论基础和实现原理，更需要掌握Spark应用程序...

达微
6254 0 2 1
何几时

博主写得很棒，清晰易懂！

Spark DataFrame中rollup和cube使用
我们平时在做报表的时候，经常会有各种分维度的汇总计算，在spark中我们最常用的就是groupBy操作，groupBy就是按照给定的字段名分组，后面接sum、count、av...

k_wzzc
5516 1 4

何几时

Spark DataFrame中rollup和cube使用
我们平时在做报表的时候，经常会有各种分维度的汇总计算，在spark中我们最常用的就是groupBy操作，groupBy就是按照给定的字段名分组，后面接sum、count、av...

k_wzzc
5516 1 4
何几时

Scala 学习笔记
Scala 学习笔记 1.函数式编程函数式编程：函数式编程把函数当作一等公民，充分利用函数，支持函数的多种使用方式。在scala中，函数可以像变量一样，既可以作为函数的参数...

k_wzzc
528 0 1
何几时

Spark Repartition 使用
看到一些同学的Spark代码中包含了很多repartition的操作，有一些不是很合理，非但没有增加处理的效率，反而降低了性能。这里做一个介绍。 repartition 从字...

pcqlegend
50874 0 17
何几时

M_lear
写了 66828 字，被 54 人关注，获得了 160 个喜欢

解除封印！！！！
何几时

理解Spark中Job-Stage-Task之间的关系
Spark-Job-Stage-Task之间的关系基本概念在开始之前需要先了解Spark中Application，Job，Stage等基本概念，官方给出的解释如下表： J...

由木人_番茄
11936 3 18

何几时

CoderJed
写了 231118 字，被 1243 人关注，获得了 863 个喜欢
何几时

很赞！行文流畅很过瘾

Fake data的使用和产生 - Python篇
什么是Fake data Fake data顾名思义假数据，是在真实产品数据无法使用的情况下，产生地接近于产品环境的数据，多用于开发和测试。 Fake data的使用场景有...

做测试的DanteYu
9195 1 4
何几时

Fake data的使用和产生 - Python篇
什么是Fake data Fake data顾名思义假数据，是在真实产品数据无法使用的情况下，产生地接近于产品环境的数据，多用于开发和测试。 Fake data的使用场景有...

做测试的DanteYu
9195 1 4
何几时

补充：一定要把 header 敲全，才会出现代码片段”HEADER“的提示

vscode snippets配置python头部注释
首先点击右下角的管理（齿轮形状的），选择其中的用户代码片段选择现有的python代码片段python.json 然后添加以下内容使用方法：在代码的头部输入header按回...

飞跑的蛤蟆
2987 1 1
何几时

vscode snippets配置python头部注释
首先点击右下角的管理（齿轮形状的），选择其中的用户代码片段选择现有的python代码片段python.json 然后添加以下内容使用方法：在代码的头部输入header按回...

飞跑的蛤蟆
2987 1 1

何几时

【矩阵变换】
前提数据源是六轴IMU的采集数据 Step 1 open() 打开文件存成二维数组 Step 2 把多个二维数组进行拼接场景：==单个IMU==的情况下，把单个 (100...

189 0 0
何几时

spark术语
术语定义 Application： Spark Application的概念和Hadoop MapReduce中的类似，指的是用户编写的Spark应用程序，包含了一个Driv...

九七学姐
635 0 1
何几时

【二叉树遍历】leetcode -- 127 最大路径和
资源汇总链接[https://leetcode-cn.com/problems/binary-tree-maximum-path-sum/]画二叉树示意图网站[http:/...

175 0 0
何几时

实现的代码可读性很高，赞👍🏻

python实现一个简易hashmap
python实现一个简易hashmap,不严谨、有问题之处请多多指出。。近日把数据结构翻出来看看，发现自己这方面的知识很欠缺，算是自己的记录，也希望给正在学习数据结构的老铁...

番茄树叶
14666 1 7
何几时

2021-08-10 Alibaba笔试
题意是给定一个数字n，再给定一个数组arr，求arr的子序列和刚好等于n，多组输入，能满足则打印"Yes"，否则打印"No"输入样例：输出样例：笔试入迷了写错循环条件，防...

128 0 0

何几时

【迭代】25 -- k个一组翻转链表
思路很重要的一点：完整代码

128 0 0

暂无个人介绍