1. 日志文件加载案例: 需求描述:在日志文件目录中,按天建文件夹,并且在每个天文件夹中,每小时有一个日志文件。程序自动每天将这些文件load到...
1. 日志文件加载案例: 需求描述:在日志文件目录中,按天建文件夹,并且在每个天文件夹中,每小时有一个日志文件。程序自动每天将这些文件load到...
1.大数据协作框架: 大数据协作框架是Hadoop 2.x生态系统中几个辅助框架。最为常见的是以下几个: 数据转换工具Sqoop 文件收集库框架...
1.Hive数据导入的六种类型: 以下面两个表来实验: 1.从本地文件系统导入到hive表中: 使用load data语句可以直接导入本地文件到...
1. Hive基本介绍和基础: Facebook公司最早完成并开源了hive框架,可以将sql语句直接翻译成MapReduce程序。Hive是基...
1. HDFS Federation架构介绍: 1. HDFS介绍: HDFS包含两层,分别是Namespace (命名空间)和 Block S...
1. Zookeeper介绍: 1.基本介绍: Zookeeper: 为分布式应用提供分布式协作(协调)服务。使用类似文件系统的树形结构。目的是...
1.虚拟机VMware Tools安装: 安装VMWare Tools非常简单,右键一个虚拟机,选择“安装VMware Tools” (其实,这...
1. 新建虚拟机 为了学习Hadoop,使用虚拟机来实验Hadoop集群环境。 使用VMWare来安装CentOS 7 操作系统。 (1)新建虚...
1. Hadoop常用组件: 1. hadoop commons :hadoop基础模块。 2. HDFS:存储数据(读-写),一次写入、多次读...
1. HDFS架构: 1. 架构综述: HDFS是master/slave架构。HDFS集群包含一个namenode和多个datanode;na...
专题公告
学习积累路程