鸿乃江边鸟 - 简书

发简信

鸿乃江边鸟

92
关注
69
粉丝
66
文章
79466

字数
228

收获喜欢
63

总资产

IP属地：上海

鸿乃江边鸟

spark在生产中是否要禁止掉BHJ(BroadcastHashJoin)
背景本文基于spark 3.2driver内存 2G 问题描述在基于复杂的sql运行中，或者说是存在多个join操作的sql中，如果说driver内存不是很大的情况下，我...

1151 1 5
鸿乃江边鸟

spark hiveUDF transient的重要性
背景最近在写hiveUDF的时候，遇到了一些反序列的问题，具体的报错如下：分析我们的代码类似如下：其中spark的配置是使用kryo序列化，spark.seriali...

524 0 1

鸿乃江边鸟

AQE中的CoalesceShufflePartitions和OptimizeLocalShuffleReader
背景本文基于spark 3.1.2在之前的文章spark CTAS nuion all （union all的个数很多）导致超过spark.driver.maxResult...

872 0 1
鸿乃江边鸟

spark CTAS nuion all （union all的个数很多）导致超过spark.driver.maxResultSize配置（2G）
背景该sql运行在spark版本 3.1.2下的thrift server下现象在运行包含多个union 的spark sql的时候报错（该sql包含了50多个uino...

625 0 5
鸿乃江边鸟

spark outer join push down filter rule（spark 外连接中的下推规则
背景对于spark的不同的join操作来说，有些谓词是能下推，是有谓词是不能下推的，今天我们实地操作一番，从现象和源码级别分析一下，这到底是怎么回事。版本&环境 spar...

764 0 6
鸿乃江边鸟

Li_MAX
写了 82717 字，被 77 人关注，获得了 142 个喜欢

云原生开发爱好者，专注于云原生和AI领域，欢迎志同道合的人一起交流，💗：lunxin_996
鸿乃江边鸟

spark hive类总是优先记载应用里面的jar包,跟spark.{driver/executor}.userClassPathFirst 无关
背景最近在弄spark on k8s的时候，要集成同事的一些功能，其实这并没有什么，但是里面涉及到了hive的类问题（具体指这个org.apache.hadoop.hive...

516 0 1

鸿乃江边鸟

2021年北美数据+AI峰会重点
Zen项目 Zen项目在一年前开始启动，目标就是让spark对python用户更加友好类型提示重要的一步就是加了一些类型提示，例如他能够在IDE或者notebook中自动...

741 0 1
鸿乃江边鸟

Iceyett
写了 0 字，被 9 人关注，获得了 0 个喜欢
鸿乃江边鸟

spark on k8s的动态资源分配和external shuffle Service以及任务的队列资源管理
我们知道目前在spark on k8s的官网中[https://spark.apache.org/docs/3.1.2/running-on-kubernetes.html#...

798 0 4
鸿乃江边鸟

spark on k8s:apache YuniKorn（Incubating）的助力
背景为什么选择spark on k8s Apache Spark 作为一站式平台统一了批处理,实时处理,流分析，机器学习，以及交互式查询.虽然说spark 提供了多样的使用...

1155 0 2
鸿乃江边鸟

东庄闲客
写了 12518 字，被 1636 人关注，获得了 151 个喜欢

《简书之旅》记录简书那些事儿，进入生活那些事儿小岛，链接：<a href="https://www.jianshu.com/g/5825d64276c8644a" target="_blank">https://www.jianshu.com/g/5825d64276c8644a</a>，一起聊家常吧！进入简·收益小岛，链接：<a href="https://www.jianshu.com/g/fc11f96fe8e1fe74" target="_blank">https://www.jianshu.com/g/fc11f96fe8e1fe74</a>，我的专题：家常，链接：<a href="https://www.jianshu.com/c/26b9f0e17184" target="_blank">https://www.jianshu.com/c/26b9f0e17184</a>，简书说：<a href="https://www.jianshu.com/c/22189ccdf317" target="_blank">https://www.jianshu.com/c/22189ccdf317</a>，长篇小说，链接：<a href="https://www.jianshu.com/c/81de8e661ce5" target="_blank">https://www.jianshu.com/c/81de8e661ce5</a>，理财吧，链接：<a href="https://www.jianshu.com/c/f47c84fd77d4" target="_blank">https://www.jianshu.com/c/f47c84fd77d4</a>

鸿乃江边鸟

Spark
小黄鸭_ 编，88 篇文章，6 人关注

spark相关
鸿乃江边鸟

MattJacob
写了 0 字，被 1 人关注，获得了 0 个喜欢
鸿乃江边鸟

鹏哥手记
写了 134369 字，被 7541 人关注，获得了 48742 个喜欢

分享自媒体干货，帮你做知识变现 孵化个人IP，企业IP，知识博主 让无力者有力，让悲观者前行 简书会员入口<a href="https://www.jianshu.com/mobile/club?ref=893165dc" target="_blank">https://www.jianshu.com/mobile/club?ref=893165dc</a> 相信相信的力量！只要开始永远不晚！
鸿乃江边鸟

掌握spark 3.0中的查询计划
本文翻译自Mastering Query Plans in Spark 3.0[https://towardsdatascience.com/mastering-query-...

718 0 3
鸿乃江边鸟

关于page Cache和memory mappped Files 和zero copy
背景由于前段时间在学习mysql相关的知识，其中涉及到了wal redo log以及磁盘的问题，在此记录一下。 Page Cache page Cache 是现代操作系统为...

381 0 2

鸿乃江边鸟

伏帖圆舞曲
写了 54712 字，被 39 人关注，获得了 73 个喜欢

关注IT与运营相关的一切，作者，出版人，经纪人。
鸿乃江边鸟

默直
写了 31004 字，被 96 人关注，获得了 378 个喜欢
鸿乃江边鸟

基于 k8s 调度遇到的问题
pod的phase从Failed转换为了Succeeded一开始遇到这个问题的时候很是蒙，查了一系列的源码，也没有找到原因，线下也没有复现出来，后面查看kubenrete的G...

375 0 1