
1.Region定位 Region按大小分割,每个表以开始只有一个region,随着数据不断地插入表,region不断增大,当增大到一定阈值时,...
1.增加RegionServer节点 ①修改conf目录下的regionservers文件,添加新节点的主机名;②复制该文件到集群中的所有机器;...
1.虚拟 CPU 个数计算方法 CPU 个数 * 单个 CPU 核数 * 单个 CPU 核的超线程数 为了避免资源浪费, 虚拟 CPU 与内存需...
1. Hadoop 数据管理 Hadoop 的数据管理,主要包括 Hadoop 的分布式文件系统 HDFS、分布式数据库 HBase 和数据仓库...
(1)避免使用 swap 分区 swap 分区指的系统的物理内存不够用的时候,把物理内存中的一部分空间释放 出来,以供当前运行的程序使用。 通过...
通过一个 MapReduce 程序测试 Hadoop,统计 HDFS 中/input/data.txt 文件内单词出现 的次数。 (1)在 Ub...
*注:这些配置文件的路径均在 ${HADOOP_HOME}/ etc/hadoop 目录下 (1)hadoop-env.sh #添加export...
三种安装模式简介 (1)关闭防火墙 查看防火墙状态:sudo ufw status 关闭防火墙:sudo ufw disab...
①切换 root 用户:su - root ②修改主机名: sudo vim /etc/hostname 映射:sudo vi /etc/...
文集作者