哈希表的实现原理
-
还是利用数组来实现,直接下标查找,增加,删除,效率较高
思路:将字符串转成下标值,根据下标直接查找、增加和修改数据
-
找到一种合适的编码方式
- 方案一:每个字符代表的数字相加构成字符串对应数值(生成的数字很大可能重复)
- 方案二:幂的连乘(得到的数字又较大,浪费空间)
-
哈希化
需要一种压缩方法,把幂的连乘方案得到的巨大整数范围压缩到可以接受的数组范围
- 取余操作(得到的余数也会有重复,但概率小了许多)
概念:将大数字转化成数组范围内下标的过程,我们就称之为哈希化
-
哈希函数
概念:将字符串转成大数字,大数字再进行哈希化的代码实现放在一个函数中,我们称这个函数为哈希函数
-
哈希表
概念:最终我们将得到的数据插入到这个数组,对整个结构的封装,我们称之为一个哈希表
-
针对取余后仍有重复的数字(称之为冲突)的解决方法
-
方案一:链地址法(拉链法)
将数字对应的下标存入成一个数组或者链表,不再是单数字的形式,插入到首端(使用链表),插入到末端(使用数组)
-
方案二:开放地址法
寻找空白的单元格来存储重复的数据
-
线性探测
线性查找空白的的位置,步长为1,逐个查找,在查找过程中遇到空白位置就停止,
删除一个位置的数据项时不能设置为null,会影响后续的查找,可以将它进行特殊处理(比如设置为-1)
存在聚集的问题,影响性能,需要查找很长才能找到空白位置
-
二次探测
主要优化探测时的步长(1,4,9...这样很规律的查找)
-
再哈希法
把关键字用另一个哈希函数,再做一次哈希化,用这次哈希化的结果作为步长
这个哈希函数的要求:
- 和第一个哈希函数不同
- 不能输出为0
-
stepSize = constant - (key % constant)
,constant是质数,且小于数组的容量
-
-
-
装填因子
概念:装填因子 = 总数据项 / 哈希表的长度
装填因子决定了哈希表的效率
-
哈希函数的要求
-
快速的计算
j尽量减少乘法与除法,使用霍纳法则
-
均匀的分布
使用质数作为哈希表的长度
-
-
JavaScript代码实现
// 哈希表的实现 class HashTable { constructor(storage=[], count=0, limit=7){ this.storage = storage this.count = count this.limit = limit } // 实现哈希函数 hashFunc(str, size) { // 定义hashCode变量 var hashCode = 0 // 霍纳法则,计算hashCode的值 for(var i=0; i<str.length; i++) { hashCode = 37 * hashCode + str.charCodeAt(i) } // 取余操作 var index = hashCode % size return index } // 判断某个数字是否是质数(素数) isPrime(num) { // 获取num平方根 var temp = parseInt(Math.sqrt(num)) // 循环判断 for(var i=0; i<=temp; i++) { if(num % i === 0) { return false } } return false } // 获取质数的方法 getPrime(num) { while(!this.isPrime(num)) { num++ } return num } // 插入&修改操作 put(key, value) { // 1. 根据key获取索引值,将数据插入到对应位置 var index = this.hashFunc(key, this.limit) // console.log(index) // 2. 根据索引值取出bucket(桶) var bucket = this.storage[index] // console.log(this.storage[index]) // 2.1 如果bucket不存在,就创建,并且放在该索引的位置 if (bucket == null) { bucket = [] this.storage[index] = bucket // console.log(this.storage[index]) } // 3. 判断是新增还是修改原来的值,遍历 // 3.1 如果已经有值,就进行修改操作,如果没有,就执行后续的添加操作 for(var i=0; i<bucket.length; i++) { var tuple = bucket[i] if (tuple[0] == key) { tuple[1] = value return } } // 4. 新增操作 bucket.push([key, value]) this.count += 1 // 5. 判断是否需要扩容操作 if(this.count > this.limit * 0.75) { var newSize = this.limit * 2 var newPrime = this.gerPrime(newSize) this.resize(newPrime) } } // 获取操作 get(key) { // 1. 根据key获取对应的index var index = this.hashFunc(key, this.limit) // 2. 根据index获取对应bucket var bucket = this.storage[index] // 3. 判断bucket是否为null,如果为null,直接返回 if (bucket == null) return null // 4. 线性查找 bucket中每一个key是否等于传入的key for (var i=0; i<bucket.length; i++) { var tuple = bucket[i] // 4.1 如果等于,那么直接返回对应的value if (tuple[0] === key) { return tuple[1] } } // 5. 依然没有找到,返回 null return null } // 删除操作 remove(key) { // 1. 根据key获取对应的index var index = this.hashFunc(key, this.limit) // 2. 根据index获取对应bucket var bucket = this.storage[index] // 3. 判断bucket是否为nll,如果为null,直接返回 if (bucket == null) return null // 4. 线性查找 bucket中每一个key,寻找到对应数据删除 value for (var i=0; i<bucket.length; i++) { var tuple = bucket[i] if (tuple[0] === key) { bucket.splice(i, 1) this.count -- return tuple[1] // 缩小容量 if(this.limit > 7 && this.count < this.limit * 0.25) { var newSize = Math.floor(this.limit / 2) var newPrime = this.getPrime(newSize) this.resize(newPrime) } } } // 5. 依然没有找到,返回 null return null } // 判断哈希表是否为空 isEmpty() { return this.count === 0 } // 获取哈希表中元素的个数 size() { return this.count } // 哈希表的扩容/缩容 resize(newLimit) { // 1. 保存数组的内容 var oldStorage = this.storage // 2. 重置所有属性 this.storage = [] this.count = 0 this.limit = newLimit // 3. 遍历oldStorage中有bucket for(var i=0; i<oldStorage.length; i++){ // 3.1 取出对应bucket var bucket = oldStorage[i] // 3.2 如果bucket为空,继续下一次循环 if(bucket == null) { continue } // 3.3 bucket中有数据,取出数据,重新插入 for(var j=0; j<bucket.length; j++) { var tuple = bucket[i] this.put(tuple[0], tuple[i]) } } } } // 测试 var ht = new HashTable() // 添加操作 ht.put('abc','123') ht.put('cba','321') ht.put('nba','521') ht.put('mba','520') // 获取操作 console.log(ht.get('cba')) // 修改操作 ht.put('nba', '111') console.log(ht.get('cba')) // 删除操作 ht.remove('cba') console.log(ht.get('cba')) ht.isEmpty() ht.size()