前言 近两年,KUDU 在大数据平台的应用越来越广泛。在阿里、小米、网易等公司的大数据架构中,KUDU 都有着不可替代的地位。本文通过分析 KUDU 的设计, 试图解释为什么...
前言 近两年,KUDU 在大数据平台的应用越来越广泛。在阿里、小米、网易等公司的大数据架构中,KUDU 都有着不可替代的地位。本文通过分析 KUDU 的设计, 试图解释为什么...
我们都知道,Hive[https://www.iteblog.com/archives/tag/hive/]内部提供了大量的内置函数用于处理各种类型的需求,参见官方文档:Hi...
分位数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值。如果将全部数据分成相等的两部分,它就是中位数;如果分成四等分,就是四分位数;四分位数也称为四分位点,它是将全...
一. 列表的应用场景 思考:有一个人的姓名(TOM)怎么书写存储程序? 答:变量。 思考:如果一个班级100位学生,每个人的姓名都要存储,应该如何书写程序?声明100个变量吗...
一. 认识字符串 字符串是 Python 中最常用的数据类型。我们一般使用引号来创建字符串。创建字符串很简单,只要为变量分配一个值即可。 注意:控制台显示结果为<class ...
1 安装包下载 下载jdk8 http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2...
使用minimal镜像 安装虚拟机把该虚拟机当做模板机对模板机进行配置,然后基于模板机进行克隆模板机配置配置主机名vi /etc/sysconfig/network注意:如果...
修改ip地址1,图形化界面2,setup 命令虚拟界面3,修改配置文件(以网络方式为NAT示例)vi /etc/sysconfig/network-scripts/ifcfg...
1 Linux常用命令 命令格式:命令 [-选项] [参数] 如:ls -la /usr **说明: ** 大部分命令遵从该格式 多个选项时,可以一起写 eg:ls –l...
1. Anaconda 与 Conda 是什么? 1.1 什么是 Anaconda Anaconda 是一个用于python/R科学计算和机器学习的开源工具(也称为Pytho...
JupyterLab简介 JupyterLab是Jupyter主打的最新数据科学生产工具,某种意义上,它的出现是为了取代Jupyter Notebook。不过不用担心Jupy...
一.筛选类函数 二.逻辑与逻辑判断函数 三.时间日期类函数 统计聚合函数 四.文本函数
add_monthsadd_months(start_date, num_months) - Returns the date that is num_months afte...
时间类 如果要用内置的通配符, 请在{}内不要加空格, 请在{}内不要加空格, 请在{}内不要加空格基础时间通配符 时间格式 1,定义:Unix时间戳(Unix timest...
「简书」作为一款「写作软件」在诞生之初就支持了 Markdown,Markdown 是一种「电子邮件」风格的「标记语言」,我们强烈推荐所有写作者学习和掌握该语言。为什么?可以...