240 发简信
IP属地:广东
  • Hive数组嵌套JSON如何取需要的数据

    数据大致格式如下,需求:求当前公司等于P的角色(JSON中的R字段) company_namecase_role江苏XXXX集团有限公司[{"P...

  • Resize,w 360,h 240
    Docker新手练习

    一、练习网址 无需安装Docker直接通过网址进行Docker的学习,访问以下网址直接点击以docker登录https://labs.play-...

  • SparkSQL统计新增用户

    原始数据,放置在IDEA的data文件夹下的log1.txt 通过SparkSQL读取文件,注册成一张零食表 log1TODO 统计每日日活用户...

  • Mac Kylin 启动报错

    检查hive/hbase/spark/kafka依赖是报错,找不到对应的lib Mac不支持printf '%p,需要改成awk所以find-h...

  • Scala的case class究竟默认实现了哪些方法?

    首先写一个样例类Demo 运行后,使用反编译打开,会发现一个样例类 Dollar会生成Dollar$.class和Dollar.class文件 ...

  • Hive连续系列2

    有score表,字段分别为年份,课程,学生,成绩 需求1:求每年每门课程排名第一的学生成绩 方式1:常规方式group by 注:结果含义,20...

  • Resize,w 360,h 240
    Hive连续系列1

    现有数据如下 需求:求连续出现三次的数字number 方法一:根据肉眼可以看出连续出现三次的number是1和3,那么用SQL如何实现呢?第一种...

  • Resize,w 360,h 240
    Hive分组TopN

    People表明细如下: 需求:按照性别分组,求分组后年龄最大的两个年龄的人员信息 学生技能表如下 需求:按照技能分组,求分组后年龄最大的两个学...