240 发简信
IP属地:江苏
  • hive删除分区

    alter table name drop if exists partition(date=xxx)

  • kafka

    消息队列 系统解耦 异步 一个主题多个分区 生产消费 tps

  • with as SQL子查询

    WITH A AS(SELECT * FROM TABLE1) SELECT * FROM A a join A b on a.id=b.id

  • hive的空字符串与null

    int与string类型,null底层默认存储为\N,查询显示为null。导出文件会以存储格式导出。若导出为null,存储的字符串就是null。...

  • SQL左连接

    左连接后的数量不一定以左表为准,在一对零或一对一的情况下,数量以左表为准,但在一对多的情况下,右边有几个算几个,数量会多于左表,这时反应出的现象...

  • 新手spark踩坑

    总想把rdd转成list,再配合for循环,面相对象式思维,无函数式编程思想。map,reduce函数完全不会用。分布式多线程完全不理解。

  • hive 行转列后怎么去重且有序

    select id,concat_ws(',',sort_array(collect_list(name))) name from table ...

  • hive新增字段Bug

    最近工作中遇到一个问题: 对于分区表添加字段,向已存在分区中插入数据,结果新增字段的值全部为null。 注:是已存在分区,新的分区并不会产生该问...