引自《美团点评团队——不可不说的Java“锁事”》
1.前言
Java中往往按照是否含有某一特性来定义锁,我们通过特性将锁进行分组归类,如下图所示:
2.乐观锁VS悲观锁
对于同一个数据的并发操作,悲观锁认为自己在使用数据的时候一定有别的线程来修改数据,因此在获取数据的时候会先加锁,确保数据不会被别的线程修改。
Java中,synchronized关键字和Lock的实现类都是悲观锁。
而乐观锁认为自己在使用数据时不会有别的线程修改数据,所以不会添加锁,只是在更新数据的时候去判断之前有没有别的线程更新了这个数据。如果这个数据没有被更新,当前线程将自己修改的数据成功写入。如果数据已经被其他线程更新,则根据不同的实现方式执行不同的操作(例如报错或自动重试)。
乐观锁在Java中是通过无锁编程来实现,最常曹勇CAS算法,Java原子类中的递增操作就通过CAS自旋实现的。
通过两者特性可以得出:
- 悲观锁适合写操作多的场景,先加锁可以保证写操作时数据正确;
-
乐观锁适合读操作多的场景,不加锁能够使其读操作性能大幅提升。
为什么乐观锁能够做到不锁定同步资源也可以正确实现线程同步呢?我们通过介绍乐观锁的主要实现方式“CAS”的技术原理来回答。
CAS(Compare And Swap,比较与交换),是一种无锁算法。在不适用锁(没有线程阻塞)的情况下实现多线程之间的变量同步。java.util.concurrent包中的原子类就是通过CAS实现了乐观锁。
CAS算法设计三个操作数:
- 需要读写的内存值V。
- 进行比较的值A。
- 要写入的新值B。
当且仅当V的值等于A时,CAS通过原子方式用新值B来更新V的值,否则不执行任何操作。一般情况下,“更新”是一个不断重试的操作。
CAS虽然很高效,但是存在三大问题:
- ABA问题
- 循环时间长开销大:CAS操作如果长时间不成功,会导致其一直自旋,给CPU带来非常大的开销。
- 只能保证一个共享变量的原子操作
3.自旋锁 VS 适应性自旋锁
以下为一些前提知识:
阻塞或唤醒一个Java线程需要操作系统切换CPU状态来完成,这种状态转换需要耗费处理器时间。如果同步代码块中的内容过于简单,状态转换消耗的时间有可能比用户代码执行的时间还要长。
很多场景中,同步资源的锁定时间很短,为了一小段时间去切换线程,其花费可能会得不偿失。如果物理机器有多个处理器,能够让两个或以上的线程同步并行执行,我们可以让后面那个请求锁的线程不放弃CPU的执行时间,看看持有锁的线程是否很快就会释放锁。
为了让当前线程“稍等一下”,需让其进行自旋,如果在自旋完成后前面锁定同步资源的线程已经释放了锁,那么当前线程就可以不必阻塞而是直接获取同步资源,从而避免切换线程的开销。这就是自旋锁。
自旋锁不能代替阻塞,虽然其避免了线程切换的开销,但是它占用处理器时间。如果锁被占用的时间很短,自旋等待的效果会非常好。反之,自旋的线程会白白浪费掉处理器资源。所以,自旋时间应该有限度,如果超过限定次数(默认10次,-XX:PreBlockSpin来更改)没有成功获得锁,就应挂起线程。
自旋锁的实现原理也是CAS。在JDK 6中默认开启,且引入了自适应自旋锁。
自适应意味着自旋的时间(次数)不再固定,而是由前一次在同一个锁上的自旋时间及锁的拥有者的状态来决定。如果在同一个锁对象上,自旋等待刚刚成功获得过锁,且持有锁的线程正在运行中,那么虚拟机就会认为这次自旋也很有可能再次成功,进而允许自旋等待持续相对长的时间。如果对于某个锁,自旋很少成功获得过,那在以后尝试获取这个锁时可能省略掉自旋过程,直接阻塞线程,避免浪费处理器资源。
4.无锁VS偏向锁VS轻量级锁VS重量级锁
这四种指的是锁的状态,专门针对synchronized。
前提知识:
- 为什么synchronized能实现线程同步?我们需要了解两个重要的概念(“Java对象头,“Monitor””)
Java对象头
synchronized是悲观锁,在操作同步资源之前需要给同步资源先加锁,这把锁就是存在Java对象头中的。Java对象头是什么?
以Hotspot虚拟机为例,其对象头主要包含两部分数据:Mark Word(标记字段)、Klass Pointer(类型指针)。
Mark Word:默认存储对象的HashCode,分代年龄和锁标志位信息。这些信息都是与对象自身定义无关的数据,所以Mark Word被设计成一个非固定的数据结构以便在极小的空间内存存储尽量多的数据。它会根据对象的状态复用自己的存储空间,也就是说在运行期间Mark Word里存储的数据会随着锁标志位的变化而变化。
Klass Point:对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象时哪个类的实例。
Monitor
Monitor可以理解为一个同步工具或一种同步机制,通常被描述为一个对象。每个Java对象都有一把看不见的锁,称为内部锁或Monitor锁。
Monitor是线程私有的数据结构,每一个线程都有一个可用monitor record列表,同时还有一个全局的可用列表。每一个被锁住的对象都会和一个monitor对象关联,同时monitor中有一个Owner字段存放拥有该锁的线程的唯一标识,标识该锁被这个线程占用。
将话题回到synchronized。synchronized通过Monitor来实现线程同步,Monitor是依赖于底层的操作系统的Mutex Lock(互斥锁)来实现的线程同步。
这种依赖于操作系统Mutex Lock所实现的锁我们称之为“重量级锁”,JDK 6中为了减少获得锁和释放锁带来的性能消耗,引入了“偏向锁”和“轻量级锁”。
目前锁一共有4种状态,级别从低到高依次是:无锁、偏向锁、轻量级锁和重量级锁,锁状态只能升级不能降级。
以下是四种锁状态对应的Mark Word内容:
无锁
无锁没有对资源进行锁定,所有线程都能访问并修改同一个资源,但同时只有一个线程能修改成功。
无锁的特点是修改操作在循环中进行,线程不断的尝试修改共享资源。如果没有冲突就修改成功并退出,否则就会继续循环尝试。如果有多个线程修改同一个值,必定会有一个线程能修改成功,而其他修改失败的线程会不断重试直到修改成功。CAS原理即是无锁的实现。无锁无法全面代替有锁,但无锁在某些场合下的性能是非常高的。
偏向锁
偏向锁是指一段同步代码一直被一个线程所访问,那么该线程会自动获取锁,降低锁的代价。
多数情况下,锁总是由同一线程多次获得,不存在多线程竞争,所以出现了偏向锁。其目标就是在只有一个线程执行同步代码块时能够提高性能。
当一个线程访问同步代码块并获取锁时,会在Mark Word里存储锁偏向的线程ID。在线程进入和退出同步块时不再通过CAS操作来加锁和解锁,而是检测Mark Word里是否存储着指向当前线程的偏向锁。引入偏向锁时为了在无多线程竞争的情况下尽量减少不必要的轻量级锁执行路径,因为轻量级锁的获取及释放依赖多次CAS原子指令,而偏向锁只需要再置换ThreadID的时候依赖一次CAS原子指令即可。
偏向锁只有遇到其他线程尝试竞争偏向锁时,持有偏向锁的线程才会释放锁,线程不会主动释放偏向锁。偏向锁的撤销,需要等待全局安全点(在这个时间点上没有字节码正在执行),它会首先暂停拥有偏向锁的线程,判断锁对象是否处于被锁定状态。撤销偏向锁后恢复到无锁(标志位为“01”)或轻量级锁(标志位为“00”)的状态。
偏向锁在JDK 6及以后的JVM里是默认启用的。可以通过JVM参数关闭偏向锁:-XX:UseBiasedLocking=false,关闭之后程序默认进入轻量级锁状态。
轻量级锁
是指当锁是偏向锁的时候,被另外的线程所访问,偏向锁就会升级为轻量级锁,其他线程会通过自旋的形式尝试获取锁,不会阻塞,从而提高性能。
在代码进入同步块的时候,如果同步对象锁状态为无锁状态(锁标志位为“01”状态,是否为偏向锁为“0”),虚拟机首先将在当前线程的栈帧中建立一个名为锁记录(Lock Record)的空间,用于存储锁对象目前的Mark Word的拷贝,然后拷贝对象头中的Mark Word复制到锁记录中。
拷贝成功后,虚拟机将使用CAS操作尝试将对象的Mark Word更新为指向Lock Record的指针,并将Lock Record里的owner指针指向对象的Mark Word。
如果这个更新动作成功了,那么这个线程就拥有了该对象的锁,并且对象Mark Word的锁标志位设置为“00”,表示此对象处于轻量级锁定状态。
如果轻量级锁的更新操作失败了,虚拟机首先会检查对象的Mark Word是否指向当前线程的栈帧,如果是就说明当前线程已经拥有了这个对象的锁,那就可以直接进入同步块继续执行,否则说明多个线程竞争锁。
若当前只有一个等待线程,则该线程通过自旋进行等待。但是当自旋超过一定的次数,或者一个线程在持有锁,一个在自旋,又有第三个来访时,轻量级锁升级为重量级锁。
重量级锁
升级为重量级锁时,锁标志的状态值变为“10”,此时Mark Word中存储的是指向重量级锁的指针,此时等待锁的线程都会进入阻塞状态。
整体锁状态升级流程如下:
综上,偏向锁通过对比Mark Word解决加锁问题,避免执行CAS操作。而轻量级锁是通过用CAS操作和自旋来解决加锁问题,避免线程阻塞和唤醒而影响性能。重量级锁是将除了拥有锁的线程以外的线程都阻塞。
5.公平锁VS非公平锁
公平锁是指多个线程按照申请锁的顺序来获取锁,线程直接进入队列中排队,队列中的第一个线程才能获得锁。其优点使等待锁的线程不会饿死,缺点是整体吞吐效率比非公平锁要低,等待队列中除第一个线程以外的所有线程都会阻塞,CPU唤醒阻塞线程的开销比非公平锁大。
非公平锁是多个线程加锁时直接尝试获取锁,获取不到才会到等待队列的队尾等待。但如果此时锁刚好可用,这个线程可以无需阻塞直接获取到锁,所以非公平锁可能出现后申请锁的线程先获取锁的场景。非公平锁的优点是可以减少唤起线程的开销,整体的吞吐效率高,因为线程有几率不阻塞直接获得锁,CPU不必唤醒所有线程。缺点是处于等待队列中的线程可能会饿死,或者等很久才会获得锁。
下图为公平锁图示:
下图为非公平锁图示:
6.可重入锁VS非可重入锁
可重入锁又名递归锁,是指在同一个线程在外层方法获取锁的时候,再进入该线程的内层方法会自动获取锁(前提锁对象是同一个对象或class),不会因为之前已经获取过还没释放而阻塞。Java中ReentrantLock和synchronized都是可重入锁,其优点是可一定程度避免死锁。
为什么可重入锁在嵌套调用时可以自动获取锁呢?
但如果是非可重入锁的话,此时管理员只允许锁和同一个人的一个水桶绑定。第一个水桶和锁绑定打完水之后并不会释放锁,导致第二个水桶不能和锁绑定也无法打水。当前线程出现死锁,整个等待队列中的所有线程都无法被唤醒。
可重入锁和非可重入锁在Java中的实现分别是ReentrantLock和NonReentrantLock。
7.独享锁VS共享锁
独享锁和共享锁在Java中的实现分别是ReentrantLock和ReentrantReadWriteLock。
独享锁也叫排他锁,是指该锁一次只能被一个线程所持有。如果线程T对数据A加上排它锁后,其他线程不能再对A加任何类型的锁。获得排他锁的线程既能读数据又能修改数据。
共享锁是指该锁可以被多个线程所持有。如果线程T对数据A加上共享锁后,其他线程只能对A再加共享锁,不能加排它锁。获得共享锁的线程只能读数据,不能修改数据。
独享锁与共享锁也是通过AQS来实现的,通过实现不同的方法,来实现独享或者共享。