圈半球 - 简书

发简信

31
关注
1
粉丝
12
文章
3897

字数
4

收获喜欢
0

总资产

IP属地：安徽

圈半球

利用flume采集日志写到HDFS
flume安装比较简单，直接解压就好。注意点：1，flume必须持有hadoop相关的包才能将数据输出到hdfs，将如下包上传到flume/lib下涉及到的包如下，以h...

838 0 0
圈半球

卡卡就发
2021年是我转行的第四年，非常感谢我的第一家公司大牛科技和我的领导阿政，给了我在这个行业继续发展的机会。今年是新的开始，也学学大佬们，记录些博客。 1.减肥计划，让肚子不...

178 0 0

圈半球

Spark--SparkCore面试知识点总结
整理于【Spark面试2000题】Spark core面试篇03 ，梅峰谷大数据 1.Spark使用parquet文件存储格式能带来哪些好处？如果说HDFS 是大数据时代分...

李小李的路
1655 0 14
圈半球

数仓--Hive-面试之Hive支持的文件格式和压缩格式及各自特点
Hive中的文件格式 1-TEXTFILE 文本格式，Hive的默认格式，数据不压缩，磁盘开销大、数据解析开销大。对应的hive API为：org.apache.hadoo...

李小李的路
4554 1 6
圈半球

感谢大佬，决定认认真真的跟着操作一遍。

数仓--Hive-面试之Hive手写SQL案例
既然是手写代码，那么就需要会手写，手写这个是重点 1-请详细描述将一个有结构的文本文件student.txt导入到一个hive表中的步骤，及其关键字假设student.tx...

李小李的路
5278 4 2
圈半球

李小李的路
写了 208066 字，被 551 人关注，获得了 806 个喜欢

李小李可不能落后呀
圈半球

50道SQL练习题及答案
网上流传这这样的50道练习题，以下是我的解法，仅供各位联系和参考数据表介绍 --1.学生表Student(SId,Sname,Sage,Ssex)--SId 学生编号,Sn...

一叶云秋
3303 2 31

圈半球

Scala操作HDFS
通过Scala对HDFS的一些操作，包括创建目录，删除目录，上传文件，文件读取，删除文件，Append文件等等；测试代码如下：

SunnyMore
6346 0 3
圈半球

Spark宽依赖和窄依赖深度剖析
RDD依赖关系与stage划分 Spark中RDD的高效与DAG图有着莫大的关系，在DAG调度中需要对计算过程划分stage，而划分依据就是RDD之间的依赖关系。 1. 窄...

SunnyMore
17866 0 13
圈半球

SunnyMore
写了 214261 字，被 156 人关注，获得了 340 个喜欢

All things are difficult before they are easy.
圈半球

金刚_30bf
写了 153038 字，被 55 人关注，获得了 133 个喜欢
圈半球

Spark2.4.0 DAG（DAGScheduler）源码分析
Spark的DAG(Directed Acyclic Graph)的生成实际上是Stage的划分，而Stage的划分依据是RDD的依赖关系。在程序提交后，Spark先将所有的...

井地儿
949 0 5

圈半球

Spark--数据倾斜解决方案
数据倾斜分为两大类：聚合倾斜和join倾斜，针对不同的倾斜类型采用不同解决方案数据倾斜解决方案上分为：缓解数据倾斜和彻底解决数据倾斜 1.数据倾斜表现形势导致数据倾斜的算...

李小李的路
1532 0 20
圈半球

Java程序员必逛的十大编程学习网站
作为开发人员而言，必需的除开对编码的激情也要有自身的一整套小技巧，另外必不可少的也是平常学习的网站。下列个人搜集的Java 开发者必不可少的网址，这些网址都可以提供信息内容、...

游戏原画设计
6278 2 77
圈半球

Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN
Spark SQL, DataFrames and Datasets Guide Overview SQL Datasets and DataFrames 开始入门起始点:...

草里有只羊
18357 0 85
圈半球

“Spark on YARN”模式下作业资源分配
spark-submit参数设置说明，即提交EMR集群的Spark作业资源调优，详见该链接：spark-submit 参数设置说明和该链接：Spark On YARN内存和...

就是杨宗
6006 1 3
圈半球

JavaSE笔记
Java的三大平台 Java语言特点变量：用于存储程序在计算过程中用到数据强制转换 Java中的运算符 +=的特殊情况比较运算符逻辑运算符短路问题字符串拼接三元...

陈先森mansplain
2513 2 26

暂无个人介绍