散列表的原理与实现

哈希表的实现原理

  • 还是利用数组来实现,直接下标查找,增加,删除,效率较高

    思路:将字符串转成下标值,根据下标直接查找、增加和修改数据

  • 找到一种合适的编码方式

    • 方案一:每个字符代表的数字相加构成字符串对应数值(生成的数字很大可能重复)
    • 方案二:幂的连乘(得到的数字又较大,浪费空间)
  • 哈希化

    需要一种压缩方法,把幂的连乘方案得到的巨大整数范围压缩到可以接受的数组范围

    • 取余操作(得到的余数也会有重复,但概率小了许多)

    概念:将大数字转化成数组范围内下标的过程,我们就称之为哈希化

  • 哈希函数

    概念:将字符串转成大数字,大数字再进行哈希化的代码实现放在一个函数中,我们称这个函数为哈希函数

  • 哈希表

    概念:最终我们将得到的数据插入到这个数组,对整个结构的封装,我们称之为一个哈希表

  • 针对取余后仍有重复的数字(称之为冲突)的解决方法

    • 方案一:链地址法(拉链法)

      将数字对应的下标存入成一个数组或者链表,不再是单数字的形式,插入到首端(使用链表),插入到末端(使用数组)

    • 方案二:开放地址法

      寻找空白的单元格来存储重复的数据

      • 线性探测

        线性查找空白的的位置,步长为1,逐个查找,在查找过程中遇到空白位置就停止,

        删除一个位置的数据项时不能设置为null,会影响后续的查找,可以将它进行特殊处理(比如设置为-1)

        存在聚集的问题,影响性能,需要查找很长才能找到空白位置

      • 二次探测

        主要优化探测时的步长(1,4,9...这样很规律的查找)

      • 再哈希法

        把关键字用另一个哈希函数,再做一次哈希化,用这次哈希化的结果作为步长

        这个哈希函数的要求:

        1. 和第一个哈希函数不同
        2. 不能输出为0
        3. stepSize = constant - (key % constant),constant是质数,且小于数组的容量
  • 装填因子

    概念:装填因子 = 总数据项 / 哈希表的长度

    装填因子决定了哈希表的效率

  • 哈希函数的要求

    • 快速的计算

      j尽量减少乘法与除法,使用霍纳法则

    • 均匀的分布

      使用质数作为哈希表的长度

  • JavaScript代码实现

    // 哈希表的实现
    class HashTable {
        constructor(storage=[], count=0, limit=7){
            this.storage = storage
            this.count = count
            this.limit = limit
        }
        // 实现哈希函数
        hashFunc(str, size) {
            // 定义hashCode变量
            var hashCode = 0
            // 霍纳法则,计算hashCode的值
            for(var i=0; i<str.length; i++) {
                hashCode = 37 * hashCode + str.charCodeAt(i)
            }
            // 取余操作
            var index = hashCode % size
            return index
        }
        
        // 判断某个数字是否是质数(素数)
        isPrime(num) {
            // 获取num平方根
            var temp = parseInt(Math.sqrt(num))
            // 循环判断
            for(var i=0; i<=temp; i++) {
                  if(num % i === 0) {
                    return false
                }          
            }
            return false
        }
        
        // 获取质数的方法
        getPrime(num) {
            while(!this.isPrime(num)) {
                num++
            }
            return num
        }
        
        // 插入&修改操作
        put(key, value) {
            // 1. 根据key获取索引值,将数据插入到对应位置
            var index = this.hashFunc(key, this.limit)
            // console.log(index)
            // 2. 根据索引值取出bucket(桶)
            var bucket = this.storage[index]
            // console.log(this.storage[index])
            //  2.1 如果bucket不存在,就创建,并且放在该索引的位置
            if (bucket == null) {
                bucket = []
                this.storage[index] = bucket
                // console.log(this.storage[index])
            }
    
            // 3. 判断是新增还是修改原来的值,遍历
            // 3.1 如果已经有值,就进行修改操作,如果没有,就执行后续的添加操作
            for(var i=0; i<bucket.length; i++) {
                var tuple = bucket[i]
                if (tuple[0] == key) {
                    tuple[1] = value
                    return
                }
            }
            // 4. 新增操作
            bucket.push([key, value])
            this.count += 1
            
            // 5. 判断是否需要扩容操作
            if(this.count > this.limit * 0.75) {
                var newSize = this.limit * 2
                var newPrime = this.gerPrime(newSize)
                this.resize(newPrime)
            }
        }
        // 获取操作
        get(key) {
            // 1. 根据key获取对应的index
            var index = this.hashFunc(key, this.limit)
            // 2. 根据index获取对应bucket
            var bucket = this.storage[index]
            // 3. 判断bucket是否为null,如果为null,直接返回
            if (bucket == null) return null
            // 4. 线性查找 bucket中每一个key是否等于传入的key
            for (var i=0; i<bucket.length; i++) {
                var tuple = bucket[i]
                //  4.1 如果等于,那么直接返回对应的value
                if (tuple[0] === key) {
                    return tuple[1]
                }
            }
            //  5. 依然没有找到,返回 null
            return null
        }
        // 删除操作
        remove(key) {
            // 1. 根据key获取对应的index
            var index = this.hashFunc(key, this.limit)
            // 2. 根据index获取对应bucket
            var bucket = this.storage[index]
            // 3. 判断bucket是否为nll,如果为null,直接返回
            if (bucket == null) return null
            // 4. 线性查找 bucket中每一个key,寻找到对应数据删除 value
            for (var i=0; i<bucket.length; i++) {
                var tuple = bucket[i]
                if (tuple[0] === key) {
                    bucket.splice(i, 1)
                    this.count --
                    return tuple[1]
                    
                   // 缩小容量
                    if(this.limit > 7 && this.count < this.limit * 0.25) {
                        var newSize = Math.floor(this.limit / 2)
                        var newPrime = this.getPrime(newSize)
                        this.resize(newPrime)
                    }
                }
            }
            //  5. 依然没有找到,返回 null
            return null
      }
        // 判断哈希表是否为空
        isEmpty() {
            return this.count === 0
        }
        // 获取哈希表中元素的个数
        size() {
            return this.count
        }
        // 哈希表的扩容/缩容
        resize(newLimit) {
              // 1. 保存数组的内容
              var oldStorage = this.storage
              // 2. 重置所有属性
              this.storage = []
            this.count = 0
            this.limit = newLimit
            // 3. 遍历oldStorage中有bucket
            for(var i=0; i<oldStorage.length; i++){
                // 3.1 取出对应bucket
                var bucket = oldStorage[i]
                // 3.2 如果bucket为空,继续下一次循环
              if(bucket == null) {
                  continue
              }
                // 3.3 bucket中有数据,取出数据,重新插入
                for(var j=0; j<bucket.length; j++) {
                  var tuple = bucket[i]
                    this.put(tuple[0], tuple[i])
                }
            }
        }
    
    }
    
    // 测试
    var ht = new HashTable()
    
    // 添加操作
    ht.put('abc','123')
    ht.put('cba','321')
    ht.put('nba','521')
    ht.put('mba','520')
    
    // 获取操作
    console.log(ht.get('cba'))
    
    // 修改操作
    ht.put('nba', '111')
    console.log(ht.get('cba'))
    
    // 删除操作
    ht.remove('cba')
    console.log(ht.get('cba'))
    
    ht.isEmpty()
    
    ht.size()
    
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342