数组:
一片物理上连续的大小确定的储存空间
特性:没法动态添加或删除元素
线性表:ArrayList
物理上连续,逻辑上连续,大小可动态增加数组 查找修改快 增删慢,好比是铁丝
链表:
物理上不连续,逻辑上连续 可动态添加和删除节点 删除增加元素快,查找慢,好比是铁链
Hash表:
顺序表+链表的功能, 好比是烤炉上放置羊肉串,烤炉是顺序表羊肉串是链表
key :获取hash值
hash算法:任何类型的key转换为一个int值
获取的key 与上次的相同, hash冲突 (不同的对象计算出来的index是相同)会使用链表实现
table 默认构造函数的长度为16 , 如果传长度的构造函数则默认最小长度为4最大为传入的大小
如果计算出的值相同,链表是无线延长的吗?不会,大于百分之75时会添加tab长度(2倍),扩容非常耗时,需要重新计算 , 那么如何提高效率呢?
hash 表中key 是唯一的;
HashMap中key和value都允许为null。key为null的键值对永远都放在以table[0]为头结点的链表中
如何尽量避免冲突? 使用链表方式解决
图中,紫色部分即代表哈希表,也称为哈希数组,数组的每个元素都是一个单链表的头节点,链表是用来解决冲突的,如果不同的key映射到了数组的同一位置处,就将其放入单链表中。
HashMap内存储数据的Entry数组默认是16,如果没有对Entry扩容机制的话,当存储的数据一多,Entry内部的链表会很长,这就失去了HashMap的存储意义了。所以HasnMap内部有自己的扩容机制。HashMap内部有:
变量size,它记录HashMap的底层数组中已用槽的数量;
变量threshold,它是HashMap的阈值,用于判断是否需要调整HashMap的容量(threshold = 容量*加载因子)
变量DEFAULT_LOAD_FACTOR = 0.75f,默认加载因子为0.75
HashMap扩容的条件是:当size大于threshold时,对HashMap进行扩容
扩容是是新建了一个HashMap的底层数组,而后调用transfer方法,将就HashMap的全部元素添加到新的HashMap中(要重新计算元素在新的数组中的索引位置)。 很明显,扩容是一个相当耗时的操作,因为它需要重新计算这些元素在新的数组中的位置并进行复制处理。因此,我们在用HashMap的时,最好能提前预估下HashMap中元素的个数,这样有助于提高HashMap的性能。
HashMap共有四个构造方法。构造方法中提到了两个很重要的参数:初始容量和加载因子。这两个参数是影响HashMap性能的重要参数,其中容量表示哈希表中槽的数量(即哈希数组的长度),初始容量是创建哈希表时的容量(从构造函数中可以看出,如果不指明,则默认为16),加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度,当哈希表中的条目数超出了加载因子与当前容量的乘积时,则要对该哈希表进行 resize 操作(即扩容)。
下面说下加载因子,如果加载因子越大,对空间的利用更充分,但是查找效率会降低(链表长度会越来越长);如果加载因子太小,那么表中的数据将过于稀疏(很多空间还没用,就开始扩容了),对空间造成严重浪费。如果我们在构造方法中不指定,则系统默认加载因子为0.75,这是一个比较理想的值,一般情况下我们是无需修改的。
另外,无论我们指定的容量为多少,构造方法都会将实际容量设为不小于指定容量的2的次方的一个数,且最大值不能超过2的30次方