【老实李】HashMap的底层原理探索

通过几个问题来学习HashMap

前提大家都知道,HashMap是由哈希表实现的,哈希表就是由数组和链表组成的。

给出一个很形象的数据结构图。

image.png

问题1.既然HashMap是数组+链表实现的,数组开始的时候一定是有一个固定长度的,那HashMap中的数组默认长度是多少呢?

默认情况下,内部数组的长度就是16,这个可以从HashMap的底层源码的构造函数中看到。下面我们就开始HashMap的源码阅读之旅。

HashMap的构造函数有三个。默认我们都是不会传这个initialCapacity的,如果不传的话,那么就会使用默认为4的DEFAULT_INITIAL_CAPACITY


DEFAULT_INITIAL_CAPACITY
HashMap的构造函数

然后将initialCapacity的值赋给了threshold,我们会在put方法中判断,如果是第一次put数据就会初始化Table,也就使用到了这个threshold。

put

那么是怎么初始化的呢?就是拿到这个threshold对其做一下平方。(roundUpToPowerOf2就是对2的幂次幂)

image.png
roundUpToPowerOf2就是对2的幂次幂

一步步追踪源代码,发现最后是返回的默认的4的平方的数组长度。

问题2.HashMap既然底层是一个线性的数组,那么是怎么实现的随机存取呢?

(因为是随机存取,所以是有些索引位置是没有元素的,会产生一些空间的浪费,但是这其实就是空间换时间,让HashMap既有数组的查询快,又有链表的增删快的优点)

// 存储时:
int hash = key.hashCode(); 
int index = hash % Entry[].length;
Entry[index] = value;

// 取值时:
int hash = key.hashCode();
int index = hash % Entry[].length;
return Entry[index];

存储的时候就是拿到key的hash值然后对HashMap底层数组的长度取余,取余的结果就是存储的索引。
取值的时候一样是拿到key的hash值然后对HashMap底层数组的长度取余,得到索引直接去数组里面取就行了。取出来是一个链表的封装类Entry,然后遍历一下Entry中的值取出我们要的就行了。


image.png
image.png

总结:元素存储的规则 hash(key)%len, 就是key的hash值对HashMap底层数组的长度取余,这个公式一定要记住。

问题3.通过上面的问题我们了解了HashMap的存取,但是我们要知道Hash算法其实就是把任意长度的输入变换成固定长度的输出,这种转换是一种压缩映射,也就是说,Hash值的空间远小于输入的空间,不同的输入可能会Hash成相同的输出。而且我们又对HashMap默认size 16的数组长度取余,所以不同的key就更是有很大概率返回相同的索引了,那会不会就把之前存的数据给覆盖了呢?

答案当然是否定的。不然谁还敢用HashMap存数据呢。

HashMap我们知道是数组+链表实现的,前面我们是只看到了数组,链表呢就是在这使用的。这里HashMap里面用到链式数据结构的一个概念。上面我们提到过Entry类里面有一个next属性,作用是指向下一个Entry。打个比方, 第一个键值对A进来,通过计算其key的hash得到的index=0,记做:Entry[0] = A。一会后又进来一个键值对B,通过计算其index也等于0,现在怎么办?HashMap会这样做:B.next = A,Entry[0] = B,如果又进来C,index也等于0,那么C.next = B,Entry[0] = C;这样我们发现index=0的地方其实存取了A,B,C三个键值对,他们通过next这个属性链接在一起。也就是说数组中存储的是最后插入的元素。(数组中只会存一个Entry元素,这一个元素的next就会指向下一个元素,这样循环)

问题4.我们前面看到数组的默认长度是16,可以说很小,那他会不会扩容呢?

答案是肯定的。默认HashMap内部数组的长度为16,负载因子为0.75,就是在构造函数里面传的两个值。阈值就是12(16*0.75=12),这样当第十三个元素加入时,底层数组就会扩容。扩容为原数组大小的两倍。

image.png

resize(2*table.length)就是扩容的操作。扩容为原数组的两倍。

扩容为原数组的两倍
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 201,784评论 5 474
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,745评论 2 378
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 148,702评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,229评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,245评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,376评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,798评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,471评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,655评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,485评论 2 318
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,535评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,235评论 3 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,793评论 3 304
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,863评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,096评论 1 258
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,654评论 2 348
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,233评论 2 341

推荐阅读更多精彩内容

  • 1.HashMap是一个数组+链表/红黑树的结构,数组的下标在HashMap中称为Bucket值,每个数组项对应的...
    谁在烽烟彼岸阅读 1,005评论 2 2
  • 实际上,HashSet 和 HashMap 之间有很多相似之处,对于 HashSet 而言,系统采用 Hash 算...
    曹振华阅读 2,507评论 1 37
  • 今天感觉突然想不出主题了,上课时倒是听到老师说的很多有触动的话,今天就先说这句吧。 “如果文章写不下去了,怎么办?...
    小小恙阅读 422评论 0 0