volatile 的定义与实现原理
Java语言规范第3版中对volatile的定义如下:Java编程语言允许线程访问共享变量,为了确保共享变量能被准确和一致地更新,线程应该确保通过排他锁单独获得这个变量。 Java 语言提供了volatile,在某些情况下比锁要更加方便。如果一个字段被声明成volatile, Java 线程内存模型确保所有线程看到这个变量的值是一致的。
volatile 是如何来保证可见性的呢? 让我们在 X86 处理器下通过工具获取JIT 编译器生成的汇编指令来查看对 volatile 进行写操作时,CPU 会做什么事情。Java 代码如下。
//instance 是 volatile 变量
instance = new Singleton();
转变成汇编代码,如下。
0x0la3deld: movb 50 x0,0X1104800 (tesi) ;0x01a3de24: lock agdl sox0, (esp) ;
有 volatile 变量修饰的共享变量进行写操作的时候会多出第二行汇编代码,通过查 IA-32架构软件开发者手册可知,Lock 前缀的指令在多核处理器下会引发了两件事情。
1)将当前处理器缓存行的数据写回到系统内存
2)这个写回内存的操作会使在其他 CPU 里缓存了该内存地址的数据无效
为了提高处理速度,处理器不直接和内存进行通信,而是先将系统内存的数据读到内部缓存(L1,L2 或其他)后再进行操作,但操作完不知道何时会写到内存。如果对声明了volatile 的变量进行写操作,JVM 就会向处理器发送一条 Lock 前缀的指令,将这个变量所在缓存行的数据写回到系统内存。但是,就算写回到内存,如果其他处理器缓存的值还是旧的,再执行计算操作就会有问题。所以,在多处理器下,为了保证各个处理器的缓存是一致的,就会实现缓存一致性协议,每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了,当处理器发现自己缓存行对应的内存地址被修改,就会将当前处理器的缓行设置成无效状态,当处理器对这个数据进行修改操作的时候,会重新从系统内存中把数据读到处理器缓存里。