Sqoop是一种用于在Hadoop和关系数据库或大型机之间传输数据的工具。您可以使用Sqoop从关系数据库管理系统(RDBMS)(如MySQL、Oracle或大型机)导入数据...
Sqoop是一种用于在Hadoop和关系数据库或大型机之间传输数据的工具。您可以使用Sqoop从关系数据库管理系统(RDBMS)(如MySQL、Oracle或大型机)导入数据...
1.Hive (1) 数据仓库Hive 的本质其实就相当于将 HDFS 中已经存储的文件在 Mysql 中做了一个双射关系,以方便使用 HQL 去管理查询。(2) 用于数据分...
1.1 什么是HBase ①HBase 是个的分布式存储系统,利用HBASE 技术可在廉价 PC Server 上搭建起大规模结构化存储集群②HBase 的目标是存储并处理大...
2.1 Zookeeper 正常部署首先保证 Zookeeper 集群的正常部署,并启动之:[user@hadoop102 zookeeper-3.4.10]$ bin/zk...
官方文档:https://clickhouse.yandex ClickHouse是什么?有什么?能做什么? 为什么用? 如何使用? 寻找一堆黑人问号的答案 一、ClickH...
也可以用ip a命令😄
Linux命令①切换 root 用户:su - root ②修改主机名: sudo vim /etc/hostname 映射:sudo vi /etc/hosts ③查看主机名:ho...
一:Hbase 创建数据库表 1.进入hbase shell2.创建数据库表的命令:create '表名', '列族名1','列族名2','列族名N'3.如果想查看所有数据库...
1.Region定位 Region按大小分割,每个表以开始只有一个region,随着数据不断地插入表,region不断增大,当增大到一定阈值时,HBase会根据一定规则将表进...
1.增加RegionServer节点 ①修改conf目录下的regionservers文件,添加新节点的主机名;②复制该文件到集群中的所有机器;③启动该机器: 1.mas...
1.虚拟 CPU 个数计算方法 CPU 个数 * 单个 CPU 核数 * 单个 CPU 核的超线程数 为了避免资源浪费, 虚拟 CPU 与内存需满足线性比例: 1 : 4 G...
1. Hadoop 数据管理 Hadoop 的数据管理,主要包括 Hadoop 的分布式文件系统 HDFS、分布式数据库 HBase 和数据仓库工具 Hive。 (1)HDF...
(1)避免使用 swap 分区 swap 分区指的系统的物理内存不够用的时候,把物理内存中的一部分空间释放 出来,以供当前运行的程序使用。 通过 vm.swappiness ...
通过一个 MapReduce 程序测试 Hadoop,统计 HDFS 中/input/data.txt 文件内单词出现 的次数。 (1)在 Ubuntu 操作系统的~目录下,...
*注:这些配置文件的路径均在 ${HADOOP_HOME}/ etc/hadoop 目录下 (1)hadoop-env.sh #添加export JAVA_HOME=/hom...
三种安装模式简介 (1)关闭防火墙 查看防火墙状态:sudo ufw status 关闭防火墙:sudo ufw disable (2) SSH安装 客...