JVM与DVM ——(7)Java 内存模型与线程

Java 内存模型( Java Memory Model),简称 JMM,它所描述的是多线程并发、CPU 缓存等方面的内容,与 JVM 内存结构并不是一个概念。

为什么有 Java 内存模型

先来看一张图:

img

上图意思是,在每一个线程中,都会有一块内部的工作内存(working memory)。这块工作内存保存了主内存共享数据的拷贝副本。在 JVM 内存结构中有一块线程独享的内存空间——虚拟机栈,但虚拟机栈和线程的工作内存并不是一个概念。在 Java 线程中并不存在所谓的工作内存(working memory),它只是对 CPU 寄存器和高速缓存的抽象描述

CPU 普及

线程是 CPU 调度的最小单位,线程中的字节码指令最终都是在 CPU 中执行的。CPU在执行的时候,要和各种数据打交道,而 Java 中所有数据都是存放在主内存(RAM)当中的,这一过程可以参考下图:

img

随着 CPU 技术的发展,CPU 的执行速度越来越快,但内存的技术并没有太大的变化,所以在内存中读取和写入数据的过程和 CPU 的执行速度比起来差距会越来越大,也就是上图中箭头部分。CPU 对主内存的访问需要等待较长的时间,这样就体现不出 CPU 超强运算能力的优势了。

因此,为了“压榨”处理性能,达到“高并发”的效果,在 CPU 中添加了高速缓存 (cache)来作为缓冲。

img

在执行任务时,CPU 会先将运算所需要使用到的数据复制到高速缓存中,让运算能够快速进行,当运算完成之后,再将缓存中的结果刷回(flush back)主内存,这样 CPU 就不用等待主内存的读写操作了。

一切看起来很美好,但是问题也随之而来。每个处理器都有自己的高速缓存,同时又共同操作同一块主内存,当多个处理器同时操作主内存时,可能导致数据不一致,这就是是缓存一致性问题。

缓存一致性问题

现在的手机通常有两个或者多个 CPU,其中一些 CPU 还有多核。每个 CPU 在某一时刻都能运行一个线程,这就意味着,如果你的 Java 程序是多线程的,那么就有可能存在多个线程在同一时刻被不同的CPU执行的情况。

比如我们有如下一段代码:

img

这里定义了两个变量 x 和 y ,它们的初始值都为 0。

在线程 p1 中,将 x 赋值给局部变量 r1,然后将 y 重新设为 1 。

在线程 p2 中,将 y 赋值给局部变量 r2,然后将 x 重新设为 2。

假设我们的一台设备上有 2 个 CPU,分别为 C1 和 C2,将上面这段代码执行在这台设备上,最后打印出的 r1 和 r2 值分别是多少? 答案是不确定的。

r1 = 0,r2 = 1

假设 p1 先在 C1 中执行完毕,并成功刷新回主内存中,此时 r1 = 0, x = 0, y = 1。

然后 p2 在 C2 中执行,从主内存中加载 y = 1 并赋值给 r2,此时 r2 = 1, x = 2, y = 1

r1 = 2,r2 = 0

假设 p2 先在 C1 中执行完毕,并成功刷新回主内存中,此时 r2 = 0, x = 2, y = 0。

然后 p1 在 C2 中执行,从主内存中加载 y = 1 并赋值给 r2,此时 r1 = 2, x = 2, y = 1。

上述两种情况比较明显,当某些情况下还会出现另一种情况:

r1 = 0,r2 = 0

x 和 y 的值分别缓存在 C1 和 C2 的缓存中 。

首先 p1 在 C1 中执行完毕,但是并未将结果刷新回主内存中,此时主内存中的 x = 0,y = 0。

然后 p2 在 C2 中执行,缓存中的 y = 0,将其赋值给 r2,此时 r2 = 0, x = 2, y = 1

如下图所示:

img

可以看出,虽然在 C1 和 C2 的缓存中,分别修改了 x 和 y 的值,但是并未将它们刷新回主内存中,这就是缓存一致性问题。

指令重排

除了缓存一致性问题,还存在另外一种硬件问题,也比较重要:为了使 CPU 内部的运算单元能够尽量被充分利用,处理器可能会对输入的字节码指令进行重排序处理,也就是处理器优化。除了 CPU 之外,很多编程语言的编译器也会有类似的优化,比如 Java虚拟机的即时编译器(JIT)也会做指令重排。

以下面的代码为例:

img

编译之后的字节码指令如下:

img

可以看出在上述指令中,有两处指令表达的是同样的语义,并且指令 7 并不依赖指令 2 和指令 3。在这种情况下,CPU 会对指令的顺序做优化,如下:

img

从 Java 语言的角度看这层优化就是:

img

也就是说在 CPU 层面,有时候代码并不会严格按照 Java 文件中的顺序去执行。再看一下之前 r1/r2 的示例,刚才我们分析会有 3 种情况发生,其实在极端情况下,还会出现第 4 种情况:

r1 = 2,r2 = 1

线程 p2 中的代码经过 CPU 优化之后,会被重排序为:

img

经过优化之后,p2 线程将 x 赋值为 2,这时 CPU 将时间片段分配给线程 p1,线程 p1 在执行过程中,将 r1 赋值为 x,此时 x = 2,所以 r1 的值为 2。然后将 y 赋值为 1,此时 CPU 再将时间片段重新分配给 p2。

代码回到 p2 中,将 y 值赋值给 r2,此时 y = 1,所以 r2 = 1,整个过程如下图所示:

img

图中红色图标代表代码执行的顺序。

上面两小部分内容表明,如果我们任由 CPU 优化或者编译器指令重排,那我们编写的 Java 代码最终执行效果可能会极大的出乎意料。为了解决这个问题,让 Java 代码在不同硬件、不同操作系统中,输出的结果达到一致,Java 虚拟机规范提出了一套机制——Java 内存模型。

什么是内存模型

内存模型是一套共享内存系统中多线程读写操作行为的规范,这套规范屏蔽了底层各种硬件和操作系统的内存访问差异,解决了 CPU 多级缓存、CPU 优化、指令重排等导致的内存访问问题,从而保证 Java 程序(尤其是多线程程序)在各种平台下对内存的访问效果一致。

在 Java 内存模型中,我们统一用工作内存(working memory)来当作 CPU 中寄存器或高速缓存的抽象。线程之间的共享变量存储在主内存(main memory)中,每个线程都有一个私有工作内存(类比 CPU 中的寄存器或者高速缓存),本地工作内存中存储了该线程读/写共享变量的副本。

在这套规范中,有一个非常重要的规则——happens-before。

happens-before 先行发生原则

happens-before 用于描述两个操作的内存可见性,通过保证可见性的机制可以让应用程序免于数据竞争干扰。它的定义如下:

如果一个操作 A happens-before 另一个操作 B,那么操作 A 的执行结果将对操作 B 可见。

上述定义我们也可以反过来理解:如果操作 A 的结果需要对另外一个操作 B 可见,那么操作 A 必须 happens-before 操作 B。

用以下代码来举例:

img

假设 setValue 就是操作 A,getValue 就是操作 B。如果我们先后在两个线程中调用 A 和 B,那最后在 B 操作中返回的 value 值是多少呢?有以下两种情况:

如果 A happens-before B 不成立

也就是说当线程调用操作 B(getValue)时,即使操作 A(setValue)已经在其他线程中被调用过,并且 value 也被成功设置为 1,但这个修改对于操作 B(getValue)仍然是不可见的。根据之前我们介绍的 CPU 缓存,value 值有可能返回 0,也有可能返回 1。

如果 A happens-before B 成立

根据 happens-before 的定义,先行发生动作的结果,对后续发生动作是可见的。也就是说如果我们先在一个线程中调用了操作 A(setValue)方法,那么这个修改后的结果对后续的操作 B(getValue)始终可见。因此如果先调用 setValue 将 value 赋值为 1 后,后续在其他线程中调用 getValue 的值一定是 1。

那在 Java 中的两个操作如何就算符合 happens-before 规则了呢? JMM 中定义了以下几种情况是自动符合 happens-before 规则的:

程序次序规则

在单线程内部,如果一段代码的字节码顺序也隐式符合 happens-before 原则,那么逻辑顺序靠前的字节码执行结果一定是对后续逻辑字节码可见,只是后续逻辑中不一定用到而已。比如以下代码:

int a = 10; // 1
b = b + 1; // 2

当代码执行到 2 处时,a = 10 这个结果已经是公之于众的,至于用没用到 a 这个结果则不一定。比如上面代码就没有用到 a = 10 的结果,说明 b 对 a 的结果没有依赖,这样就有可能发生指令重排。

但是如果将代码改为如下则不会发生指令重排优化:

int a = 10; // 1
b = b + a; // 2

锁定规则

无论是在单线程环境还是多线程环境,一个锁如果处于被锁定状态,那么必须先执行 unlock 操作后才能进行 lock 操作。

变量规则

volatile 保证了线程可见性。通俗讲就是如果一个线程先写了一个 volatile 变量,然后另外一个线程去读这个变量,那么这个写操作一定是 happens-before 读操作的。

线程启动规则

Thread 对象的 start() 方法先行发生于此线程的每一个动作。假定线程 A 在执行过程中,通过执行 ThreadB.start() 来启动线程 B,那么线程 A 对共享变量的修改在线程 B 开始执行后确保对线程 B 可见。

线程中断规则

对线程 interrupt() 方法的调用先行发生于被中断线程的代码检测,直到中断事件的发生。

线程终结规则

线程中所有的操作都发生在线程的终止检测之前,我们可以通过 Thread.join() 方法结束、Thread.isAlive() 的返回值等方法检测线程是否终止执行。假定线程 A 在执行的过程中,通过调用 ThreadB.join() 等待线程 B 终止,那么线程 B 在终止之前对共享变量的修改在线程 A 等待返回后可见。

对象终结规则

一个对象的初始化完成发生在它的 finalize() 方法开始前。

此外, happens-before 原则还具有传递性:如果操作 A happens-before 操作 B,而操作 B happens-before 操作 C,则操作 A 一定 happens-before 操作 C。

Java 内存模型应用

上面介绍的 happens-before 原则非常重要,它是判断数据是否存在竞争、线程是否安全的主要依据,根据这个原则,我们能够解决在并发环境下操作之间是否可能存在冲突的所有问题。在此基础上,我们可以通过 Java 提供的一系列关键字,将我们自己实现的多线程操作“happens-before 化”。

"happens-before 化”就是将本来不符合 happens-before 原则的某些操作,通过某种手段使它们符合 happens-before 原则。

比如我还是用上面的 setValue 和 getValue 举例,本来这两个操作是不符合 happens-before 原则的,但是我们可以通过以下两种方式,使它们符合 happens-before 原则。

使用 volatile 修饰 value
img
使用synchronized关键字修饰操作
img

通过以上两种方式,都可以使 setValue 和 getValue 符合 happens-before 原则——当在某一线程中调用 setValue 后,再在其他线程中调用 getValue 获取的值一定是 1。

总结

  • Java 内存模型的来源:主要是因为 CPU 缓存和指令重排等优化会造成多线程程序结果不可控。
  • Java 内存模型是什么:本质上它就是一套规范,在这套规范中有一条最重要的 happens-before 原则。
  • Java 内存模型的使用,其中简单介绍了两种方式:volatile 和 synchronized。其实除了这两种方式,Java 还提供了很多关键字来实现 happens-before 原则,会在后面进行学习。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容