大空翼123 - 简书

发简信

1
关注
11
粉丝
70
文章
37474

字数
15

收获喜欢
2

总资产

IP属地：青海

大空翼123

冰菓_
写了 721804 字，被 405 人关注，获得了 760 个喜欢

Cousin who only knows SQL And Committed to the construction of data business intelligence system<br>&<br>Internet Garbage Maker<br>&<br>A Sqlboy with no future<br>&<br>(Go all out in the direction of web ) animation<br>&<br>mba
大空翼123

python连接有sasl认证的kafka
公司的kafka做了安全升级，加入了sasl认证。使用confluent_kafka 进行认证连接kafka 首先安装confluent_kafka pip install...

1648 0 0

大空翼123

impala中查询Kudu表不存在，无法新建问题
impala中查询kudu表提示：ERROR: AnalysisException: Could not resolve table reference 在impala中把...

1689 0 0
大空翼123

Nginx日志Hive分析
1.业务场景最新有一个新需求，需要对Nginx的log日志进行分析，日志每天以打包压缩上传HDFS上，采用可以用Hive直接解析，但是所有的日志信息都在一个字段下面，...

352 0 0
大空翼123

@宗恩感谢回复讨论

了解MPP数据库/MPP与Hadoop区别
什么是MPP？ MPP (Massively Parallel Processing)，即大规模并行处理。简单来说，MPP是将任务并行的分散到多个服务器和节点上，在每个节点上...

大空翼123
20012 2 1
大空翼123

数组
数组：连续内存空间的集合适合读多写少的场景时间复杂度 1.访问O（1） 2.搜索O（N） 3.插入O（N） 4.删除O（N）

210 0 0
大空翼123

链表
链表：非连续内存空间，链表中每个元素还有next指针指向下一个元素单端链表：只有next指针指向下一个双端链表：还有指针指向上一个链表适合读少写多时间复杂度 1.访问...

202 0 0

大空翼123

Hive调优
宏观调优思路 1.资源充足加内存 2.数据接入慢调优接入工具Sqoop/Datax 3.Hive参数调优 4.sql调优 5.调整模型，提高模型质量和复用度。减少join 6...

188 0 0
大空翼123

Flink数据倾斜

215 0 0
大空翼123

Spark数据倾斜
Spark数据倾斜表现 1.Executor lost,OOM,Shuffle过程出错 2.DriverOOM 3.任务卡在某个阶段 4.正常任务突然失败 Spark定位数据...

265 0 0
大空翼123

Hive数据倾斜解决
Hive自身走的是MR程序，Key值分布不均匀容易造成数据倾斜

213 0 0
大空翼123

Kafka高效读写
Kafka高效读写数据 1）Kafka本身是分布式集群，同时采用分区技术，并发度高。 2）顺序写磁盘 Kafka的producer生产数据，要写入到log文件中，写的过程是一...

509 0 0

大空翼123

数据结构-空间复杂度
什么是空间复杂度算法存储空间于输入值之间的关系常见空间复杂度 O(1) :常量 O(N):数组、列表、递归等 O(N²):数组、列表 O(logN)/O(mlogn)：不常用

191 0 0
大空翼123

数据倾斜--数据采集阶段
1.业务数据Sqoop导入数据时倾斜首先了解Sqoop两个参数-m和--split-by参数的使用: 1. 这俩参数一般是放在一起使用 2.-m:表明需要使用几个map任务...

769 0 0
大空翼123

数据结构-时间复杂度
什么是时间复杂度：算法的执行效率算法的执行时间和算法的输入值之间的关系一般关注for循环和while循环。采用O表示法，常量是O(1) 常见时间复杂度案例分析 O(1...

560 0 0
大空翼123

排序算法-插入排序
选择排序的思想是找位置，与选择排序不同，插入排序的思想是找一个有序的区间，保证这个区间内是有序的。通过一次次的遍历，逐渐扩大这个有序区间，直到区间大小等于数组大小，即数组全局...

329 0 0
大空翼123

Spark WordCount计算 TOP N
Scala写法使用spark算子 object Top3GroupBykey {def main(args: Array[String]):Unit = {val conf:...

357 0 0

大空翼123

Flink流式计算WordCountTopN
Flink流式计算WordCountTopN可以采用流处理编程和FlinkSql自定义UDTF函数的方式流处理编程方法： public class Flink05_WC_T...

664 0 0
大空翼123

牛客-SQL13 计算商城中2021年每月的GMV
场景逻辑说明：用户将购物车中多件商品一起下单时，订单总表会生成一个订单（但此时未付款，status-订单状态为0，表示待付款）；当用户支付完成时，在订单总表修改对应订单记...

2298 1 0
大空翼123

Flink容错机制-两阶段提交
Flink+Kafka 实现端到端严格一次我们知道，端到端的状态一致性的实现，需要每一个组件都实现，对于Flink + Kafka的数据管道系统（Kafka进、Kafka出...

2309 0 1

暂无个人介绍