HashMap继承于AbstractMap,实现了Map、Cloneable、java.io.Serializable接口。它的key、value都可以为null,映射不是有序的。 Hashmap不是同步的,如果想要线程安全的HashMap,可以通过Collections类的静态方法synchronizedMap获得线程安全的HashMap。
HashMap中有两个重要的参数:初识容量、加载因子。
容量:哈希表中bucket数量,初识容量是哈希表在创建时的容量
加载因子:是哈希表在容量自动增加前可达到多满的一种尺度。当哈希表中的条目数量超出了加载因子与当前容量的乘积时,就要对该哈希表进行rehash操作(重建内部结构,bucket*2)。加载因子大,填满的元素就越多,空间利用率高,冲突的机会加大;否则相反。
在读HashMap 源码前,里面的一些关键成员变量以及知识点,先捋一遍。
1、initialCapacity:初始容量。指的是 HashMap 集合初始化的时候自身的容量。可以在构造方法中指定;如果不指定的话,总容量默认值是 16 。需要注意的是初始容量必须是 2 的幂次方(为什么是2的幂次方请看)
2、size:当前 HashMap 中已经存储着的键值对数量,即 HashMap.size()
3、loadFactor:加载因子。所谓的加载因子就是 HashMap (当前的容量/总容量) 到达一定值的时候,HashMap 会实施扩容。加载因子也可以通过构造方法中指定,默认的值是 0.75 。举个例子,假设有一个 HashMap 的初始容量为 16 ,那么扩容的阀值就是 0.75 * 16 = 12 。也就是说,在你打算存入第 13 个值的时候,HashMap 会先执行扩容。
4、threshold:扩容阀值。扩容阀值 = HashMap 总容量 * 加载因子。当前 HashMap 的容量大于或等于扩容阀值的时候就会去执行扩容。扩容的容量为当前 HashMap 总容量的两倍。比如,当前 HashMap 的总容量为 16 ,那么扩容之后为 32。
5、table:Entry 数组。我们都知道 HashMap 内部存储 key/value 是通过 Entry 这个介质来实现的。而 table 就是 Entry 数组。
6、在 Java 1.7 中,HashMap 的实现方法是数组 + 链表的形式。上面的 table 就是数组,而数组中的每个元素,都是链表的第一个结点。即如下图所示:
源码分析:
构造函数:HashMap 的所有构造方法最后都会去调用 HashMap(int initialCapacity, float loadFactor) 。在其内部去设置初始容量和加载因子。而最后的 init() 是空方法。如下图:
put 方法
根据以上源码,我们知道
1、如果 table 数组为空时先创建数组,并且设置扩容阀值;
2、如果 key 为空时,调用 putForNullKey 方法特殊处理;
3、计算 key 的哈希值;
4、根据第三步计算出来的哈希值和当前数组的长度来计算得到该 key 在数组中的索引,其实索引最后的值就等于 hash%table.length ;
5、遍历该数组索引下的整条链表,如果之前已经有一样的 key ,那么直接覆盖 value ;
6、如果该 key 之前没有,那么就进入 addEntry 方法。
addEntry方法
在addEntry方法中,需要注意
1、如果当前 HashMap 的存储容量到达阀值的时候,会去进行 resize(int newCapacity) 扩容
2、在createEntry方法中新增节点
resize方法
createEntry 方法
创建节点的方法中,如果发现 e 是空的,之前没有存值,那么直接把值存进去就行了;如果是之前 e 有值的,即发生 hash 碰撞的情况,就以单链表头插入的方式存储。
get 方法
getEntry方法
7、JDK 1.8 HashMap的不同实现
1、在 Java 1.8 中,如果链表的长度超过了 8 ,那么链表将转化为红黑树;
2、发生 hash 碰撞时,Java 1.7 会在链表头部插入,而 Java 1.8 会在链表尾部插入;
3、在 Java 1.8 中,Entry 被 Node 代替(换了一个马甲)。