概述
对于数据库优化,相信大家都会说给表分个区查询速度就快了;那么,什么是分区、如何分区、分区真的会使性能提升嘛?不知道大家有没有考虑过;这里为大家介绍一下数据库的分区操作,顺便也科普一下,并不是所有的数据库设计都适合分区操作;
分区介绍
首先大家需要明确一点就是,分区功能并不是存储引擎层完成的,因此并不只有常用的InnoDB存储引擎支持分区,其中MyISAM、NDB等都支持,但也并不是所有的存储引擎都支持分区。
分区的过程是将一个表或索引分解为多个更小、更可管理的部分。MySQL数据库仅支持水平分区。可以通过以下命令查看当前数据库是否启用了分区功能:
mysql>SHOW PLUGINS;
*********
Name:partition
Status:ACTIVE
Type:STORAGE ENGINE
Library:Null
License:GPL
*********
分区类型
Mysql数据库支持Range、List、Hash、Key分区,不论创建何种类型的分区,如果表中存在主键或唯一索引时,分区列必须是唯一索引的一个组成部分。
Range分区
范围分区是最常用的一种分区类型,主要用于日期列的分区;Range分区的查询,优化器只能对YEAR()、TO_DAYS()、TO_SECONDS()、UNIX_TIMESTAMP()这类函数进行优化选择。
mysql>CREATE TABLE sales(
money INT UNSIGNED NOT NULL,
date DATETO,E
) ENGINE=INNODB
PARTITION by range (TO_DAYS(date))(
PARTITION p201001 VALUES LESS THEN (TO_DAYS('2019-10-01'))),
PARTITION p201002 VALUES LESS THEN (TO_DAYS('2019-11-01'));
List分区
List分区和Range分区非常相似,只是分区列的值是离散的,而非连续的。且不同于Range分区中定义的VALUES LESS THAN语句,List分区使用VALUES IN。
mysql> CREATE TABLE t(
a INT,
b INT) ENGINE=INNODB
PARTITION BY LIST(b)(
PARTITION p0 VALUES IN (1,3,5,7,9),
PARTITION p1 VALUES IN (0,2,4,6,8)
);
Hash分区
Hash分区的目的是将数据均匀的分布到预先定义的各个分区中,保证分区的数据数量大致都一样。对于连续的值(例如,自增主键),可以较好的将数据进行平均分布。
除了Hash分区,还有一种Linear Hash分区。Linear Hash分区优点在于,增加、删除、合并和拆分分区将变得更加快捷,它的缺点则是与Hash分区相比,各个分区间数据的分布可能不大均衡。
mysql>CREATE TABLE t_hash (
a INT,
b DATETIME
)ENGINE=InnoDB
PARTITION BY HASH (YEAR(b))
PARTITIONS 4;
Key分区
Key分区和Hash分区相似,不同之处在于Hash分区使用用户自定义的函数进行分区,Key分区使用MySQL数据库提供的函数进行分区。
mysql>CREATE TABLE t_key(
a INT,
b DATETIME) ENGINE=InnoDB
PARTITION BY KEY (b)
PARTITIONS 4;
Columns分区
前面四种分区条件是数据必须是整型,如果不是整型,那么需要通过函数将其转换成整型,而Columns可以看做Range分区和List分区的一种进化,直接使用非整型的数据进行分区。
mysql>CREATE TABLE t_columns_1(
a INT,
b DATETIME
) ENGINE=InnoDB
PARTITION BY RANGE COLUMNS (b)(
PARTITION p0 VALUES LESS THAN ('2018-01-01'),
PARTITION p1 VALUES LESS THAN ('2019-01-01')
);
子分区
子分区(subpartitioning)是在分区的基础上再进行分区,有时也称这种分区为复合分区(composite partitioning),如在Range和List分区上再进行Hash或Key的子分区。
Null值的处理
数据库允许对NULL值做分区,但各个分区的处理方式都不同;
1、Range分区,如果向分区列插入了Null值,则MySQL数据库会将该值放入最左边的分区。
2、List分区下要使用Null值,则必须显式的指出哪个分区中放入Null值,否则报错。
3、Hash和Key分区任何分区函数都会将含有Null值得记录返回为0。
分区和性能
数据库应用分两种:一种OLTP(在线事务处理),如Blog、电子商务、网络游戏等;另一种OLAP(在线分析处理),如数据仓库、日志报表。
然而对于OLTP的应用,分区应该特别注意。在这种应用下,通常不可能会获取一张大表中10%的数据,大部分都是通过索引返回几条记录即可。而根据B+树索引的原理可知,对于一张大表,一版B+树需要2~3次磁盘IO。因此B+树索引可以很好的完成操作,不需要分区帮助,并且设计不好的分区会带来严重的性能问题。
分区和表数据交换
MySQL开始支持ALTER TABLE ···EXCHANGE PARTITION语法。该语句允许分区或子分区中的数据与另一个非分区的表中的数据进行交换。如果非分区表中的数据为空,那么将分区中的数据移动到非分区表中。