点典 - 简书

点典

IP属地：天津

spark序列化问题
1.Spark的transformation操作为什么需要序列化？ Spark是分布式执行引擎，其核心抽象是弹性分布式数据集RDD，其代表了分布...

2116 0 0
hive优化
1. 2. 3.

249 0 0

hive基本操作之二
1.查找数据到本地 insert overwrite local directory '/home/mydir/mydir' select ....

186 0 0
hive基本操作之一
1.hive表中的基本数据类型 2,hive创建分区表 2.1内部表建表语句： create table table_name( F...

3351 2 0
shell入门
awk sed grep expr let

219 0 0
hive调优
1，参数调优 hive.map.aggr = true hive.groupby.skewindata =true 2,

114 0 0
spark内核启动流程
1.，用户提交Application 2，启动Driver进程 3，注册Application 4，启动Executor 5，启动Task执行 ...

166 0 0