@lemonguge
2015-07-10T05:13:55.000000Z
字数 9007
阅读 392
Concurrency
Java内存模型规范了Java虚拟机与计算机内存是如何协同工作的。Java虚拟机是一个完整的计算机的一个模型,因此这个模型自然也包含一个内存模型——又称为Java内存模型。
如果想设计表现良好的并发程序,理解Java内存模型是非常重要的。Java内存模型规定了如何和何时可以看到由其他线程修改过后的共享变量的值,以及在必须时如何同步的访问共享变量。
Java内存模型把Java虚拟机内部划分为线程栈和堆。下面这张图演示了Java内存模型的逻辑视图。

每一个运行在Java虚拟机里的线程都拥有自己的线程栈,这个线程栈包含了这个线程调用的方法当前执行点相关的信息。一个线程仅能访问自己的线程栈。一个线程创建的本地变量对其它线程不可见,仅自己可见。即使两个线程执行同样的代码,这两个线程会在自己的线程栈中来创建本地变量,因此每个线程拥有每个本地变量的独有版本。
所有原始类型(基本数据类型)的本地变量都存放在线程栈上,因此对其它线程不可见。一个线程可能向另一个线程传递一个原始类型变量的拷贝(基本数据类型属于值传递),但是它不能共享这个原始类型变量自身。
下面这张图演示了调用栈和本地变量存放在线程栈上,对象存放在堆上。

存放在堆上的对象可以被所有持有对这个对象引用的线程访问。当一个线程可以访问一个对象时,它也可以访问这个对象的成员(成员变量和成员函数)。如果两个线程同时调用同一个对象上的同一个方法,每一个线程都拥有这个本地变量的私有拷贝。下图演示了上面提到的点:

其中这两个线程栈的一个本地变量(Local Variable 2)指向堆上的一个共享对象(Object 3)。这两个线程分别拥有同一个对象的不同引用,这些引用都是本地变量,因此存放在各自线程的线程栈上。
注意,这个共享对象(Object 3)持有Object2 和Object4 的引用作为其成员变量(如图中Object3 指向Object2 和Object4 的箭头)。通过在Object3 中这些成员变量引用,这两个线程就可以访问Object2 和Object4。
以下Java代码会导致上面的内存图:
class MySharedObject {public static final MySharedObject sharedInstance = new MySharedObject();public Integer object2 = new Integer(22);public Integer object4 = new Integer(44);}public class MyRunnable implements Runnable{@Overridepublic void run() { methodOne(); } // 线程任务public void methodOne() {int localVariable1 = 45;MySharedObject localVariable2 = MySharedObject.sharedInstance;methodTwo();}public void methodTwo() {Integer localVariable1 = new Integer(99);}}
如果两个线程同时开启后执行run()方法,就会出现上图所示的情景。run()方法会调用methodOne()方法,methodOne()会调用methodTwo()方法。
每个线程执行methodOne()都会在它们对应的线程栈上创建一个基本数据类型int的本地变量localVariable1和一个引用数据类型MySharedObject的本地变量localVariable2的私有拷贝。
localVariable1变量彼此完全独立,仅“生活”在每个线程的线程栈上。一个线程看不到另一个线程对它的localVariable1私有拷贝做出的修改。localVariable2拷贝,然而两个localVariable2的不同拷贝都指向堆上的同一个对象MySharedObject.sharedInstance,对应着上图中的Object 3。MySharedObject类也包含两个成员变量,这些成员变量随着这个对象存放在堆上。这两个成员变量指向另外两个Integer对象。这些Integer对象对应于上图中的Object2和Object4。methodTwo()创建一个名为localVariable的本地变量,这个成员变量是一个指向一个Integer对象的对象引用。两个线程执行这个方法将会创建两个不同的Integer实例。methodTwo方法创建的Integer对象对应于上图中的Object1和Object5。
现代硬件内存模型与Java内存模型有一些不同。理解内存模型架构以及Java内存模型如何与它协同工作也是非常重要的,这部分描述了通用的硬件内存架构。下面是现代计算机硬件架构的简单图示:

一个现代计算机通常由两个或者多个CPU,其中一些CPU还有多核。从这一点可以看出,在一个有两个或者多个CPU的现代计算机上同时运行多个线程是可能的。每个CPU在某一时刻运行一个线程是没有问题的,这意味着如果你的Java程序是多线程的,在你的Java程序中每个CPU上一个线程可能同时(是并发不是并行)执行。
CPU访问寄存器的速度远大于主存,CPU访问缓存层的速度快于访问主存的速度,但通常比访问内部寄存器的速度还要慢一点。
通常情况下,当一个CPU需要读取主存时,它会将主存的部分读到CPU缓存中。它甚至可能将缓存中的部分内容读到它的内部寄存器中,然后在寄存器中执行操作。当CPU需要将结果写回到主存中去时,它会将内部寄存器的值刷新到缓存中,然后在某个时间点将值刷新回主存。
硬件内存架构没有区分线程栈和堆,所以Java内存模型与硬件内存架构之间存在差异。对于硬件,所有的线程栈和堆都分布在主内中,部分线程栈和堆可能有时候会出现在CPU缓存中和CPU内部的寄存器中。如下图所示:

当对象和变量被存放在计算机中各种不同的内存区域中时,就可能会出现一些具体的问题。主要包括如下两个方面:
如果两个或者更多的线程在没有正确的使用volatile声明或者同步的情况下共享一个对象,一个线程更新这个共享对象可能对其它线程来说是不可见的。
想象一下,共享对象被初始化在主存中。跑在CPU上的一个线程将这个共享对象读到CPU缓存中,然后修改了这个对象。只要CPU缓存没有被刷新回主存,对象修改后的版本对跑在其它CPU上的线程都是不可见的。这种方式可能导致每个线程拥有这个共享对象的私有拷贝,每个拷贝停留在不同的CPU缓存中。下图示意了这种情形:

跑在左边CPU的线程拷贝这个共享对象到它的CPU缓存中,然后将count变量的值修改(类似set()方法)为2。这个修改对跑在右边CPU上的其它线程是不可见的,因为修改后的count的值还没有被刷新回主存中去。
解决这个问题你可以使用Java中的volatile关键字。volatile关键字可以保证直接从主存中读取一个变量,如果这个变量被修改后,总是会被立即写回到主存中去。
voltile只能保证可见性,并不能保证线程安全。
在上一篇文章中介绍过了竞态条件,在这里将结合示图进行讲述,想象一下,如果线程A读一个共享对象的变量count到它的CPU缓存中,线程B也做了同样的事情,但是往一个不同的CPU缓存中。现在线程A将count加1,线程B也做了同样的事情。现在count已经被增在了两个,每个CPU缓存中一次。如果这些增加(类似add()方法)操作被顺序的执行,变量count应该被增加两次,然后原值+2被写回到主存中去。
然而,两次增加都是在没有适当的同步下并发执行的。无论是线程A还是线程B将count修改后的版本写回到主存中取,尽管增加了两次,修改后的值仅会被原值大1。如下图所示:

解决这个问题可以使用Java同步块。一个同步块可以保证在同一时刻仅有一个线程可以进入代码的临界区。同步块还可以保证代码块中所有被访问的变量将会从主存中读入,当线程退出同步代码块时,所有被更新的变量都会被刷新回主存中去,不管这个变量是否被声明为volatile。
在临界区中使用适当Java同步块就可以避免竞态条件。
Java中的同步块用synchronized关键字标记,同步块在Java中是同步在某个对象上,一般我们也将那个对象称为锁。在同步块中,我们也把锁称为监视器对象。
所有同步在一个对象上的同步块,同时只能被一个线程(该线程拥有了锁)进入并执行操作,所有其他等待进入该同步块的线程将被阻塞(拥有锁的那个线程也会因为CPU运行切换导致失去执行权而处于临时阻塞状态,但是只有该线程拥有锁,所以也只有它才能处于运行状态;虽然其他线程也会获取到CPU执行权,但是因为没有锁不能进入),直到执行该同步块中的线程退出。
在成员函数的返回值之前使用synchronized关键字,这告诉Java该方法是同步的。使用这种方式,锁为调用方法的那个对象this。
class Bank {private volatile int sum;public synchronized void add(int num) { // 同步sum += num;System.out.println(Thread.currentThread().getName() + " sum=" + sum);}}class Customer implements Runnable {private Bank bank;public Customer(Bank bank) { this.bank = bank; }@Overridepublic void run() {for (int i = 0; i < 3; i++)bank.add(100);}}public class BankDemo {public static void main(String[] args) {Bank bank = new Bank();Customer a = new Customer(bank);Customer b = new Customer(bank);new Thread(a, "a").start();new Thread(b, "b").start();}} /* Output: // 输出顺序并不确定,以下是一种输出顺序b sum=100a sum=200a sum=300a sum=400b sum=500b sum=600*///:~
以上代码,比之前的银行存钱的代码相比,就是在add()方法声明中加上了synchronized关键字,输出顺序不一定,但一定是从100到600的逐步递增,这才是我们所期望的。每次只允许一个线程调用add()方法,另外一个线程必须要等到持有锁的那个线程退出add()方法时,才能继续执行add()方法(被阻塞)。
有时你不需要同步整个方法,而是同步方法中的一部分。Java可以对方法的一部分进行同步,Java同步块构造器用括号将对象(锁)括起来。
class Bank {private volatile int sum;private Object obj = new Object(); // 自定义锁对象public void add(int num) {synchronized (obj) { // 锁或监视器对象sum += num;System.out.println(Thread.currentThread().getName() + " sum=" + sum);}}}class Customer implements Runnable {private Bank bank;public Customer(Bank bank) { this.bank = bank; }@Overridepublic void run() {for (int i = 0; i < 3; i++)bank.add(100);}}public class BankDemo {public static void main(String[] args) {Bank bank = new Bank();Customer a = new Customer(bank);Customer b = new Customer(bank);new Thread(a, "a").start();new Thread(b, "b").start();}} /* Output: // 输出顺序并不确定,以下是一种输出顺序a sum=100a sum=200a sum=300b sum=400b sum=500b sum=600*///:~
静态函数的同步声明和成员函数的同步声明一样,值得注意的是,静态函数同步块的锁为该函数所属字节码文件对象Class。
如果需要卖电影票,票总共有120张,现在有很多渠道可以买票,我们可以上网买,也可以通过窗口买票,还可以电话订票。于是我们需要考虑这么一个问题,如何防止一张票被重复卖掉。
class Ticket implements Runnable {private int num = 120; // 120张票,共享资源@Overridepublic void run() {sell();}public synchronized void sell() {while (num > 0) {System.out.println(Thread.currentThread().getName() + ":" + num);num--;}}}public class TicketDemo {public static void main(String[] args) {Ticket ticket = new Ticket();new Thread(ticket, "电话售票").start();new Thread(ticket, "网络售票").start();new Thread(ticket, "窗口售票").start();}} /* Output: // 输出顺序并不确定,以下是一种输出顺序电话售票:120电话售票:119...电话售票:1*///:~
虽然没有出现卖出同一张票的情况,但是我们可以发现,每次运行只有一个窗口在卖票,其他窗口不能卖票,这明显是不符合我们所期望的。现在我们来分析一下这种情况是怎么出现的,当电话卖票线程获取了锁后,便一直会处于while循环里,直到运行完成后,才会释放锁,此时已经没有票了。所以我们应该对任意一个线程,只要卖掉一张票就应该释放锁。
class Ticket implements Runnable {private int num = 120; // 共享资源@Overridepublic void run() {while (true) {synchronized (this) {if (num > 0)sell();elsebreak;}}}public synchronized void sell() {System.out.println(Thread.currentThread().getName() + ":" + num);num--;}}public class TicketDemo {public static void main(String[] args) {Ticket ticket = new Ticket();new Thread(ticket, "电话售票").start();new Thread(ticket, "网络售票").start();new Thread(ticket, "窗口售票").start();}} /* Output: // 输出顺序并不确定,以下是一种输出顺序电话售票:120窗口售票:119...网络售票:1*///:~
之前讲解了使用同步块来使得一个线程不会干涉另一个线程正在操作的共享资源(多线程处理同一任务),接下来我们来学习如何使得任务彼此之间可以协作,以使得多个任务可以一起工作去解决某个问题(多线程的任务不同)。现在的问题不是彼此之间的干涉,而是彼此之间的协调,因为在一些问题中,某些部分必须在其他部分被解决之前解决。
举个例子,烤鸭店和消费者,烤鸭店还没有烤好鸭子,消费者是不能进行消费的。因此在消费者消费之前,至少要有一只烤鸭准备好了。
线程间发送信号的一个简单方式是在共享对象的变量里设置信号值。多个线程必须获得指向一个共享实例的引用,以便进行通信。如果它们持有的引用指向不同的实例,那么彼此将不能检测到对方的信号。
// 共享资源代表烤鸭class Resource{boolean flag; // 通过标志位判断烤鸭是否做好了}
现在我们考虑这么一种情况:烤鸭店当发现没有鸭子了便会去生产一只鸭子,如果有鸭子就不生产,消费者每次消费一只鸭子。我们可以这么来实现,当没有鸭子时,将标志位flag设为false,烤鸭店便去生产一只鸭子,之后将flag设为true。消费者发现有鸭子了,就去消费一只flag为false,以下是代码实现:
import java.io.BufferedOutputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.PrintStream;// 资源代表烤鸭class Resource{boolean flag; // 通过标志位判断烤鸭是否做好了}// 生产者代表餐厅class Producer implements Runnable{private Resource res;public Producer(Resource res) {this.res = res;}@Overridepublic void run() {while (true)synchronized (res) { // 给临界区加上同步块if (!res.flag) {System.out.println("Producer run.."); // 生产烤鸭res.flag = true;} else {System.out.println("Resource exist!"); // 烤鸭未消费,不生产}}}}// 消费者class Consumer implements Runnable{private Resource res;public Consumer(Resource res) {this.res = res;}@Overridepublic void run() {while (true)synchronized (res) { // 临界区if (res.flag) {System.out.println("Consumer eat.."); // 消费烤鸭res.flag = false;} else {System.out.println("Waitting Resource!"); // 没有烤鸭,等待中}}}}public class OneToOne {public static void main(String[] args) throws InterruptedException {PrintStream ps = logger(); // 开启日志Resource res = new Resource(); // 共享资源,也是两个线程的锁(监视器)Producer pro = new Producer(res); // 生产者Consumer con = new Consumer(res); // 消费者Thread t1 = new Thread(pro,"生产者");Thread t2 = new Thread(con,"消费者");t1.start();t2.start();Thread.sleep(10); // 记录10ms内的输出结果ps.close();}// 由于输出很多,为了看到全部的输出,将输出打印到文件中,在当前项目的log.txt可以查看输出结果public static PrintStream logger(){PrintStream ps = null;try {ps = new PrintStream(new BufferedOutputStream(new FileOutputStream("log.txt")),true);} catch (FileNotFoundException e) {e.printStackTrace();}System.setOut(ps);return ps;}} /* Output: // 输出顺序并不确定,以下log.txt文件中的一部分...Resource exist!Consumer eat..Waitting Resource!Waitting Resource!Producer run..Resource exist!Resource exist!Resource exist!Resource exist!Resource exist!Resource exist!Resource exist!Resource exist!Consumer eat..Waitting Resource!Waitting Resource!Producer run..Resource exist!Resource exist!...*///:~
通过上面是输出结果可以发现,虽然输出结果正确,但是不太符合我们所期望,我们期望的输出语句应该是"Producer run.."和"Consumer eat.."这两中语句,每生产一只烤鸭就应该通知消费者,可以去消费了,而不是自己一直去看看鸭子还在不在,鸭子在不在应该由消费者告诉烤鸭店:“老板,烤鸭没啦!”在下一篇,笔者会讲解如何解决这个问题。