知道Mysql很多年了,也用了很多年了,但是没有真正深入了解过,这次开始通过《高性能Mysql》学习Mysql,下面的内容大部分来自这本书。
MySql的架构
虽然我们经常叫Mysql是数据库,但是通过这张图应该能清楚,它是数据库管理系统,虽然都可以简称为数据库,但是功能上有差别的。
从图上我们知道Mysql分为3层架构:
- 第一层线程服务,用来接受处理访问mysql的请求
- 第二层是Mysql的核心服务,提供查询解析、分析、优化等功能
- 第三层是储存引擎,引擎主要负责数据读写,Mysql通过接口方式与引擎进行通信,这样就可以根据不同的需求使用不同的引擎。
并发控制
并发控制通过名字就能知道是用来处理并发的,当多个请求同时使用同一个资源时,就需要并发控制,来避免资源的数据发生错误。
锁
锁是处理并发的基本工具,在Mysql中有两种锁类别,一种叫读锁,也叫做共享锁,一种叫做写锁,也叫做排他锁。
读锁(共享锁)
当一个请求是读操作时,会获得一个读锁,当其他请求也是读操作时,会共享这个锁,互相不阻塞。在读锁释放前,无法获取写锁。
写锁(排他锁)
当一个请求是写操作时(增,删,改),会获取一个写锁,这时候其他线程无论是读操作还是写操作,都会被阻塞。
锁粒度
锁粒度是用来决定锁的资源大小,范围太大,会导致并发性能变低,范围太小会导致系统资源占用过大。
表锁
表锁是Mysql最基本的锁策略,并且是开销最小的策略。他会锁定整张表,当有人对这张表读操作时,会获得一个读锁,会将整张表锁住,当有另外也是读操作时,可以共享读锁进行读操作,但是如果写操作,就需要等读锁释放后,才能获得写锁。写锁比读锁高优先级,所以如果两个请求分别是写和读,那么写会先执行。
尽管存储引擎可以管理自己的锁,Mysql本身还是可以使用各种有效的表锁来实现不同的目的。
例如:Alter Table之类的语句会使用表锁,而忽略存储引擎的锁机制。所以如果在一张大表中使用Alter Table要慎重,因为会影响整体服务并发性能。
行锁
行锁可以最大程度地支持并发处理,并且是开销最大的策略。通过语义可以知道,是针对行的锁,在InnoDB和一些存储引擎中有实现行锁。行锁只在存储引擎中实现,Mysql服务器层没有实现。
事务
事务是一个独立工作单元,在单元中包含着一组任务,要么都成功,要么都失败。
ACID
原子性(atomicity)
一个事务必须被当成一个原子,不可被分割,要么都成功,要么都失败。一致性(consistency)
数据库总是从一个一致性的状态转换到另外一个一致性的状态。我对一致性的理解是数据库里的数据永远都是正确的。事务失败和系统崩溃不会导致数据中有脏数据。隔离性(isolation)
通常来说,一个事务所做的修改在最终提交以前,对其他事务是不可见的。但是不同的隔离级别,对于隔离性的要求是不同的。持久性(durability)
一旦事务提交,则其所做的修改就会永久保存到数据库中.
一个运行良好的事务处理系统,必须满足ACID。
隔离级别
在SQL标准中定义了四种隔离级别,每一种级别都规定了一个事务所做的修改,哪些在事务内和事务间是可见的。降低级别低的隔离通常可以获得更好的并发,系统的开销也更低。
在Mysql中,可以通过select @@global.tx_isolation,@@tx_isolation;
来查看当前的隔离级别
READ UNCOMMITTED(未提交读)
在该级别中,即使事务还没有提交,其他事务也能读取到没有提交的数据,这也被称为脏读。如果该事务失败了,其他事务就会读到在数据库不存在的数据。这个级别在实际应用中很少应用。
READ COMMITTED(提交读)
一个事务在提交前,所做的任何修改,在其他事务中都无法可见的。但是同一个事务的两次读取数据,可能获取不同的数据,因为第二次读取数据前,另一个事务已经添加一个在范围内增加一条记录,并且提交了。所以该级别也称为不可重复读(nonrepeatable read)
REPEATABLE READ(可重复读)
该级别是Mysql的默认隔离级别,该级别解决了脏读的问题,也保证了同一个事务中多次读取到记录的结果是一样的。但是理论上,该级别解决不了幻读的问题。所谓幻读是指当某个事务在读取某个范围内的记录时,另外一个事务又在该范围中插入一条新的新的记录,当之前事务再次读取该范围的记录时,就会出现幻行。所谓幻行,就是在当前事务读取不到,但是他却真实存在,会导致无法在当前事务再插入同样的记录。
在事务1,因为在事务2中因为已经插入一条记录,但是在事务1中却无法读取到,并且也无法插入,整个事务已经无法继续执行下去了,只能全部回滚了。
SEARIALIABLE(可串行化)
该级别是最高的级别,他通过强制事务串行执行,避免了前面说的幻读。也就是把所有涉及的行,全部加了锁,所以其他事务就无法对相关的资源进行操作了,这样就能避免幻行,但是并行性能非常差,除非有特殊场景,不然很少用到该隔离级别。
死锁
既然有锁,就有可能造成死锁,死锁就是多个事务对同一资源相互占用,从而造成恶性循环的现象。
begin;
update user set name="robinwu1" wehre id=1;
update user set name="robinwu2" where id=2;
commit;
begin;
update user set name="robinwu2" wehre id=2;
update user set name="robinwu1" where id=1;
commit;
在上面的例子中,当两个事务中在执行了第一行语句后,分别占用id=1和id=2的行,这时候在第二行语句想去修改对方事务占用的行,就会造成死锁。
锁的行为和顺序是和存储引擎相关的。以同样的循序执行语句,有些存储引擎会造成死锁,有些不会。
我的环境是Mysql,InnoDB,在执行上述语句时会造成死锁,但是很快就会检测到死锁,然后让其中一个事务报错,自动结束事务。
多版本并发控制(MVCC)
多版本并发控制的实现通过保存数据的在某个时刻的快照来实现的。通过该技术方案可以解决幻读的问题。该配置只能在REPEATABLE READ和READ COMMITTED两个隔离级别下工作。
存储引擎
因为Mysql是通过接口的方式跟引擎进行通信,那么我们就根据不同的需求使用不同的存储引擎,但是不建议不同的表使用不同存储引擎。
MyISAM
在Mysql 5.1及以前的版本,是默认的存储引擎。
优点:
- 提供全文索引、压缩、空间函数等功能
- 占用空间大小比较小
缺点:
- 不支持事务和行级锁
- 崩溃后数据难恢复
InnoDB
InnoDB是Mysql默认的事务性引擎,也是目前使用最广泛的存储引擎。
优点:
- 支持事务和行级锁
- 并发性能高
- 可以实现热备份
- 崩溃后很容易恢复数据
缺点:
- 对硬件性能要求比较高
- 占用空间大小比较大
其他引擎
还有很多其他引擎,包括官方的和非官方,我也不是很了解,所以就不在这边说了。
结尾
初识Mysql,只能整理出自己觉得挺重要的,并且理解的一些点。当然还有很多细节,我会在后面的阅读中整理出来。或许等我看完整本书后,会有其他的理解。