我们平时编码时使用集合类,都是new 一个 ArrayList 或者 HashSet 或者 HashMap就直接开用,好像也没遇到啥问题。那这里为什么说集合不安全呢?下面一 一道来。
欢迎大家关注我的公众号 javawebkf,目前正在慢慢地将简书文章搬到公众号,以后简书和公众号文章将同步更新,且简书上的付费文章在公众号上将免费。
一、集合不安全之List
1、故障现象:
先看下面一段代码:
List<String> list = new ArrayList<>();
for (int x = 0; x < 30; x ++){
new Thread( () -> {
list.add("哈哈");
}).start();
}
System.out.println(list.toString());
这段代码很简单,就是创建30个线程,每个线程往list集合add元素,看似没啥问题,看代码的运行结果:
运行抛异常了,这便是并发修改异常。
2、导致原因:
并发修改异常是因为线程并发争抢修改导致。举个例子:上课的时候老师拿了一份名单要点名,说来了的同学就上去签自己的名字。这份名单就是集合,每个同学就是一个线程。上去签名就是往集合中添加元素的add操作。当张三同学上去签名的时候,刚写完 “张” 字,李四同学就上来把笔抢了去,结果就是张三同学的名只签了一半。这就是并发修改异常。
3、解决方案:
- 第一种办法,可以使用线程安全的Vector类,它的方法都加了锁,可以保证线程安全。不过Vector现在很少人用,因为并发性不好。
- 第二种办法,使用Collections工具类。如下:
List<String> list = Collections.synchronizedList(new ArrayList<>());
这个方法顾名思义,就是可以把ArrayList变成安全的。所以它也可以解决并发修改异常。
- 第三种办法,使用JUC包中的CopyOnWriteArrayList类。CopyOnWrite的意思是写时复制。看看如何使用它解决并发修改异常。
List<String> list = new CopyOnWriteArrayList<>();
就是new 一个 CopyOnWriteArrayList就可以了。那么这个类为什么能保证线程安全呢?看一下它的源码:
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}
所谓写时复制,就是写的时候不是直接在原来的数组中写,而是先复制一份,写完后再引用这个新的。还是签名的例子:老师说同学们一个个地上来签名。张三上去了,把那份名单copy了一份,签上了自己的名字。在张三签名的过程中,其他同学还是可以读老师的那份名单的。当张三签完了,然后再告诉同学们,之前那份名单作废了,现在用这份新的。这就是整个过程,对应了上面的代码。首先用lock锁住这段代码,即张三签名过程中其他同学不能再来抢笔了;然后获取到原来的数组,定义一个新数组,长度为原来的数组加1,把原数组内容复制到新数组中,这是张三复制名单的过程;然后将要add的元素添加到新数组的最后,这就是张三写自己名字的过程;再后来将引用指向新数组,这是张三告诉大家用这份新名单的过程;最后释放锁,也就是张三把笔放下,下一个同学可以去签名了。
这也就是读写分离的思想,写的时候复制原来的,写操作完成前,读数据还是读原来的,写完成后,读新的。
二、集合不安全之Set
- 在说Set不安全之前先简单地说一下HashSet底层是数据结构:
HashSet底层是由HashMap实现的,HashMap的key就是set集合add的元素,而HashMap的value是一个Object类型的常量。
1、故障现象:
ist<String> set = new HashSet<>();
for (int x = 0; x < 30; x ++){
new Thread( () -> {
set.add("哈哈");
}).start();
}
System.out.println(set.toString());
把上面的ArrayList换成HashSet,一样会报并发修改异常。导致原因也是一样的,下面直接看看解决原因。
2、解决方案:
- 使用Collections工具类的synchronizedSet方法。
- 使用CopyOnWriteArraySet类。注意这个类,实际上还是CopyOnWriteArrayList类。看它构造方法的源码就可以知道了。构造方法如下:
public CopyOnWriteArraySet() {
al = new CopyOnWriteArrayList<E>();
}
三、集合不安全之Map
Map集合同样会出现上述问题。很容易让人想到解决方案也是和上面一样,其实有点区别。首先,的确可以使用Collections工具类的synchronizedMap方法,其次,也可以使用HashTable。HashTable所有的方法都加了锁,所以可以保证安全。但是也正因它所有方法都加了锁,并发性不好,所以不推荐使用。第三种办法,可能会想到写时复制,其实java没有为map提供写时复制的类。我们可以使用ConcurrentHashMap,这个也是线程安全的,而且性能还不错。它是使用了CAS来保证安全性。我另一篇文章《Java源码解读---HashMap&ConcurrentHashMap》中有介绍,大家可以参考一下。
- Collections.synchronizedXxx原理:
上面说到解决List、Set、Map的安全问题都可以使用Collections工具类,那么它原理是什么呢?来看一下源码(拿synchronizedList来说明):
public static <T> List<T> synchronizedList(List<T> list) {
return (list instanceof RandomAccess ?
new SynchronizedRandomAccessList<>(list) :
new SynchronizedList<>(list));
}
首先它判断你new的集合有没有实现RandomAccess接口 (这个接口是一个标记接口,ArrayList就实现了这个接口。作用就是,如果实现了这个接口,那么就说明支持快速随机访问,如果支持快速随机方法,那么取元素的时候就用for循环,否则就用迭代器。这是因为,如果不支持快速随机访问,用迭代器获取元素效率会更高。ArrayList由数组实现,可以通过索引获取元素,显然是支持快速随机访问) 。然后 new SynchronizedRandomAccessList<>(list);其实就是对传进去的list的方法加上了同步代码块,所以可以保证线程安全。它和Vector、HashTable的区别也就在于,它使用的是同步代码块,而后两者使用的是同步方法。
总结:
在多线程环境中,List、Set、Map都是不安全的,会出现并发修改异常,需要使用JUC包中对应的类进行处理。