多线程是一个神奇的东西,难以捉摸,代码也不好理解。
为什么关注多线程呢?首先是面试经常被问到,然后是有很多并发工具类可以使用,如果理解不好,稀里糊涂的使用更可怕。所以,多线程就像是个大山,层层迷雾,我不得要领,然而每次受挫,下一回又继续。
我对于多线程的认识,来源有许多。一个是免费公开课,粗略的讲多线程,而我要傻傻的记住wait()方法是释放锁在哪里等待,sleep(arg)是持有锁在睡觉,还有很多要记。那岂不是每次使用都要来复习一遍,简直太可怕了。另一种就是收费课程,主讲并发包中的类,然后来上一通源码分析,各种CAS,队列,复杂的代码逻辑。这种课程,就像是水过了一遍沙子,没什么印象。第三种就是网上的知识片段了,有讲的很细的,比如synchronized这种锁,有很有优化机制,比如轻量级锁,偏向锁,重量级锁。以及随之而来的锁膨胀,偏向锁撤销等等,那种细节确实不错,但是在没有更大的上下文和知识的情况下,只能让人拜服多线程是多么复杂难懂。
但事情也许不该是这样的,我们不是设计虚拟机,也不会设计java的api。我们只是拿着现成的api和造好的工具来使用,何况还有各种最佳实践的体式,一切不该这么玄乎和复杂才对。
最近读了一本《Java并发编程的艺术》这本书,书本以简单和浅显的方式给我们说明了原理和应用,顿时觉得多线程不是那么不可逾越。下面文章的内容是这本书的摘抄,有兴趣的读着可以找原书来读。
多线程有啥好处和不好处这种就不说了。先说一下计算机的架构:
对于单个cpu,它是这样的,cup内部有各种寄存机和运算单元、控制单元,用于计算和暂存中间结果,与cpu很紧密相接的就是高速缓存,一级缓存,二级缓存,三级缓存等等,高速缓存连接着数据总线,数据总线连接着内存。对于多cpu来说,依然是每个cpu有自己的缓存或者某些cpu共用高速缓存。对于线程同步,就是发送一些指令,当cpu对数据写完之后,立即刷新到主存,其余的线程读数据的时候,一看是加锁的数据,就不从自己的缓存中读了,而从主存中读取最新的数据。因此关键就是弄一个机制保证数据的读写是有一定的顺序的,且是最新的。比如可以锁总线,在任意时刻,只能有一个线程操作内存中的某个数据,操作完立马写入内存,也可以通过锁定缓存,来保证数据是最新的。总之,这些都是计算机内部的协议,或者说是一些指令,jvm在代码执行的合适地方,插入这些指令,就实现了同步的效果。
然后说一下“内存可见性”,我总会读到这样的句子,当一个线程修改了变量,通过某种同步机制,这个修改对另一个线程是可见的。其实过程就是这个线程把某个变量修改后的值放入高速缓存,且通过一个指令,高速计算机要把这些变量立马同步到内存中。另一个线程如何可见呢?就是发现执行的代码中有类似loadload的指令,告诉它不要从高速缓存中取该变量的值,而是要从内存中去取,这个过程简称为“另一个线程看到了最新的值”,或者线程可见。还有一个疑问是,如果之前的线程正在将要内存中写值,另一个线程已经开始读了,这怎么办?这种情况我们不要想太多,因为不论是计算机还是java内存模型,都规定了指令执行的一些顺序。即使后一个线程正要读,但是发现这个内存区域是有保护的,那么它要等之前的线程把值放入内存。总之,这些麻烦的,或者细碎的东西,在JMM,happens-before规则中已经做了明确的规定,简化我们的开发。
"在多线程并发编程中synchronized和volatile都扮演着重要的角色,volatile是轻量级的同步,它在多处理器开发中保证了共享变量的“可见性”。可见性的意思是当一个线程修改一个共享变量时,另外一个线程能读到这个修改的值。如果volatile变量修饰符使用恰当的话,它比synchronized的使用和执行成本更低,因为它不会引起线程上下文的切换和调度"。
不同的是volatile仅针对单个变量,但synchronized确可以针对代码块,方法等更大范围的同步。
volatile是通过内存屏障指令来实现的,比如立马将数据写入内存,从内存中读取数据等等。
“代码块同步是使用monitorenter和monitorexit指令实现的,而方法同步是使用另外一种方式实现的,细节在JVM规范里并没有详细说明。但是,方法的同步同样可以使用这两个指令来实现。”
"monitorenter指令是在编译后插入到同步代码块的开始位置,而monitorexit是插入到方法结束处和异常处,JVM要保证每个monitorenter必须有对应的monitorexit与之配对。任何对象都有一个monitor与之关联,当且一个monitor被持有后,它将处于锁定状态。线程执行到monitorenter
指令时,将会尝试获取对象所对应的monitor的所有权,即尝试获得对象的锁"。
CAS:比较并交换,对应的硬件层面有与之对应的指令,比较当前线程栈上的变量值和从内存中取出的变量值是否一致,如果一致就说明没有其余线程进行修改,那么可以将该变量值的值修改为指定的新值。这个比较并且修改成新值是一个原子操作,由硬件支持的。
synchronized用的锁是存在Java对象头里的,具体来说是对象头里面的MarkWord中。对象头是什么呢?其实就是一种数据结构,存放class元信息,MarkWord等信息。Mark Word里默认存储对象的HashCode、分代年龄和锁标记位。
"Java SE 1.6为了减少获得锁和释放锁带来的性能消耗,引入了“偏向锁”和“轻量级锁”,在Java SE 1.6中,锁一共有4种状态,级别从低到高依次是:无锁状态、偏向锁状态、轻量级锁状态和重量级锁状态,这几个状态会随着竞争情况逐渐升级。锁可以升级但不能降级,意味着偏向锁升级成轻量级锁后不能降级成偏向锁。这种锁升级却不能降级的策略,目的是为了提高获得锁和释放锁的效率"。
"当一个线程访问同步块并获取锁时,会在对象头和栈帧中的锁记录里存储锁偏向的线程ID,以后该线程在进入和退出同步块时不需要进行CAS操作来加锁和解锁,只需简单地测试一下对象头的Mark Word里是否存储着指向当前线程的偏向锁。如果测试成功,表示线程已经获得了锁。如果测试失败,则需要再测试一下Mark Word中偏向锁的标识是否设置成1(表示当前是偏向锁):如果没有设置,则使用CAS竞争锁;如果设置了,则尝试使用CAS将对象头的偏向锁指向当前线程。偏向锁使用了一种等到竞争出现才释放锁的机制,所以当其他线程尝试竞争偏向锁时,持有偏向锁的线程才会释放锁。"
"线程在执行同步块之前,JVM会先在当前线程的栈桢中创建用于存储锁记录的空间,并将对象头中的Mark Word复制到锁记录中,官方称Displaced Mark Word。然后线程尝试使用CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功,当前线程获得锁,如果失败,表示其他线程竞争锁,当前线程便尝试使用自旋来获取锁"。
"轻量级解锁时,会使用原子的CAS操作将Displaced Mark Word替换回到对象头,如果成功,则表示没有竞争发生。如果失败,表示当前锁存在竞争,锁就会膨胀成重量级锁"。
"因为自旋会消耗CPU,为了避免无用的自旋(比如获得锁的线程被阻塞住了),一旦锁升级成重量级锁,就不会再恢复到轻量级锁状态。当锁处于这个状态下,其他线程试图获取锁时,都会被阻塞住,当持有锁的线程释放锁之后会唤醒这些线程,被唤醒的线程就会进行新一轮的夺锁之争"。
到这里,我们看到,保证原子性的方式有以下几种:
1 通过总线锁保证原子性;
2 通过缓存锁定来保证原子性。
Java中实现原子操作的方法:
1 使用循环CAS实现原子操作;
2 使用锁机制实现原子操作。
CAS的不足:
1 ABA问题;
2 循环时间长开销大;
3 只能保证一个共享变量的原子操作。