1.处理时间处理场景 2.事件时间处理场景 注:flink版本为1.14,低版本时间函数使用方式不同
1.处理时间处理场景 2.事件时间处理场景 注:flink版本为1.14,低版本时间函数使用方式不同
总结: {}表示次数 []表示一个字符 ()表示一个整体
将20201212减一天
添加依赖 当字符串为空串时候: 当字符串为null时候: 3.jdk8特性,空指针? empty() : of(value);
一、Linux环境下git SSH配置 1.配置用户名和邮箱 2.配置公钥和私钥 3.复制公钥到仓库中设置选项的get ssh 4.在自己的目录下新建一个.git-ssh.s...
反斜线使用注意: 执行结果
1.下载安装
2.1异常分析: 失败原因: NameNode作为JournalNode的客户端发起连接请求,但是失败了,然后NameNode又向其他节点依次发起了请求都失败了,直至到了最大...
前言 由于目前发现hive3.0.0版本对tez0.92在beeline模式下出现不兼容现象,暂时未解决,还由于spark2.3对流式处理优化但是对hive离线并未有太大影响...
https://www.jianshu.com/p/e01738be4f8d[https://www.jianshu.com/p/e01738be4f8d]
Datax3.0使用说明 原文链接:https://github.com/alibaba/DataX/blob/master/introduction.md[https://...
编译 tez 下载 apache-tez-0.9.2-src 并解压到/opt下 设置环境变量 1.环境要求 可参考官方的编译与安装步骤http://tez.apache.o...
1.parquet Hive 0.10 - 0.12 Hive 0.13 and later 2.lzo 3.orc 转换成lzo或者忘lzo表里insert 4.avro ...
1、进入数据库 hive中执行以下 5 条 SQL 语句 (1)修改表字段注解和表注解 (2)修改分区字段注解 (3)修改索引注解 2、修改 metastore 的连接 UR...
一.环境准备 1. 下载、安装并编译lzo和lzop 1.安装LZO 2.安装LZOP 最好root用户下操作否则make instasll权限不够) 3.把lzop复制到/...
一、flume安装 二、Ganglia安装和部署 1.安装阿里云yum源 sudo wget -O /etc/yum.repos.d/CentOS-Base.repo htt...
内存调优 Hadoop处理数据时,出现内存溢出的处理方法?(内存调优) 1、Mapper/Reducer阶段JVM内存溢出(一般都是堆) 1)JVM堆(Heap)内存溢出:堆...
Hive调优(语法与参数层面优化)一、简介作为企业Hadoop应用的核心产品,Hive承载着FaceBook、淘宝等大佬 95%以上的离线统计,很多企业里的离线统计甚至全由H...
1.数据倾斜产生原因? 原因:由于数据本身原因或者是使用filter算子过滤后导致分区内数据量相差太大,有的分区多,有的分区少 解决方案:可以使用saprkWeb端口4040...