浅谈安卓和iOS使用的hash

前言

哈希(Hash)或者说散列表,它是一种基础数据结构。Hash 表是一种特殊的数据结构,它同数组、链表以及二叉排序树等相比较有很明显的区别,但它又是是数组和链表的基础上演化而来,既具有数组的有点,又具有链表的有点。能够快速定位到想要查找的记录,而不是与表中存在的记录的关键字进行比较来进行查找。应用了函数映射的思想将记录的存储位置与记录的关键字关联起来,从而能够很快速地进行查找。

哈希表定义

哈希表(hash table,也叫散列表),是根据键(key)直接访问访问在内存储存位置的数据结构。

哈希表本质是一个数组,数组中的每一个元素成为一个箱子,箱子中存放的是键值对。根据下标index从数组中取value。关键是如何获取index,这就需要一个固定的函数(哈希函数),将key转换成index。不论哈希函数设计的如何完美,都可能出现不同的key经过hash处理后得到相同的hash值,这时候就需要处理哈希冲突。

哈希表优缺点

优点 :哈希表可以提供快速的操作。

缺点 :哈希表通常是基于数组的,数组创建后难于扩展。也没有一种简便的方法可以以任何一种顺序〔例如从小到大)遍历表中的数据项。

哈希表,典型的【空间换时间】

它是如何实现高效处理数据的? put("kwok", 121); put("steve",23242 ); put("jobs", 2132); 添加、搜索、删除的流程都是类似的

  1. 利用哈希函数生成key对应的index【O(1)】

  2. 根据index操作定位数组元素【O(1)】

image-20200422160109703.png

哈希函数

哈希表中哈希函数的实现步骤大概如下

  1. 先生成key的哈希值(必须是整数)

  2. 再让key的哈希值跟数组的大小进行相关运算,生成一个索引值

func HashCode(key string) int  {
    return hashCode(key) % len(table)
}

为了提高效率,可以使用 & 位运算取代 % 运算【前提:将数组的长度设计为 2 的幂(2n)】

func HashCode(key string) int  {
   return hashCode(key) & (len(table) -1)
}

良好的哈希函数
让哈希值更加均匀分布 → 减少哈希冲突次数 → 提升哈希表的性能

如何生成key的哈希值

key 的常见种类可能有
整数、浮点数、字符串、自定义对象
不同种类的 key,哈希值的生成方式不一样,但目标是一致的
尽量让每个 key 的哈希值是唯一的
尽量让 key 的所有信息参与运算

在Java中,HashMap 的 key 必须实现 hashCode、equals 方法,也允许 key 为 null

Integer hash 值就是值的本身

/**
 * Returns a hash code for this {@code Integer}.
 *
 * @return  a hash code value for this object, equal to the
 *  primitive {@code int} value represented by this
 *  {@code Integer} object.
 */
@Override
public int hashCode() {
return Integer.hashCode(value);
}

Float 将存储的二进制格式转为整数值

/**
 * Returns a hash code for this {@code Float} object. The
 * result is the integer bit representation, exactly as produced
 * by the method {@link #floatToIntBits(float)}, of the primitive
 * {@code float} value represented by this {@code Float}
 * object.
 *
 * @return a hash code value for this object.
 */
@Override
public int hashCode() {
return Float.hashCode(value);
}
/**
 * Returns a hash code for a {@code float} value; compatible with
 * {@code Float.hashCode()}.
 *
 * @param value the value to hash
 * @return a hash code value for a {@code float} value.
 * @since 1.8
 */
public static int hashCode(float value) {
return floatToIntBits(value);
}

double 和long 哈希值

/**
 * Returns a hash code for a {@code long} value; compatible with
 * {@code Long.hashCode()}.
 *
 * @param value the value to hash
 * @return a hash code value for a {@code long} value.
 * @since 1.8
 */
public static int hashCode(long value) {
return (int)(value ^ (value >>> 32));
}

/**
 * Returns a hash code for a {@code double} value; compatible with
 * {@code Double.hashCode()}.
 *
 * @param value the value to hash
 * @return a hash code value for a {@code double} value.
 * @since 1.8
 */
public static int hashCode(double value) {
long bits = doubleToLongBits(value);
return (int)(bits ^ (bits >>> 32));
}

>> 和 ^ 的作用是?
高32bit 和 低32bit 混合计算出 32bit 的哈希值
充分利用所有信息计算出哈希值


image-20200422171256111.png

字符串hash 值

整数 5489 是如何计算出来的?
5*10^3 +4*10^2 +8*10^1 +9*10^0
字符串是由若干个字符组成的
比如字符串 jack,由 s、t、e、v、e 五个字符组成(字符的本质就是一个整数) 因此,steve的哈希值可以表示为s*n^4 + t*n^3 +e*n^2 +v*n^1 +e*n^0,等价于[(j*n+a)

public int hashCode() {
    int h = hash;
    final int len = length();
    if (h == 0 && len > 0) {
        for (int i = 0; i < len; i++) {
            h = 31 * h + charAt(i);//31 是一个奇素数,JVM会将 31 * i 优化成 (i << 5) – i
        }
        hash = h;
    }
    return h;
}
public int hashCode() {
    int h = hash;
    final int len = length();
    if (h == 0 && len > 0) {
        for (int i = 0; i < len; i++) {
            h = (h << 5) -h  + charAt(i);
        }
        hash = h;
    }
    return h;
}

自定义对象的hash值

package main

import "fmt"

type MyString string
type MyInt int
type Student struct {
   Name    MyString
   Age     MyInt
   ID      MyString
   Address MyString
}

func (s MyString) hashCode() int {
   h := 0
   for _, c := range string(s) {
      h = (h << 16) - h + int(c)
   }
   return h
}

func (i MyInt) hashCode() int {
   return int(i)
}
func (s Student) hashCode() int {
   hash := 0
   hash = (hash << 16) - hash + s.Name.hashCode()
   hash = (hash << 16) - hash + s.Age.hashCode()
   hash = (hash << 16) - hash + s.ID.hashCode()
   hash = (hash << 16) - hash + s.Address.hashCode()
   return hash
}
func main() {
   s1 := Student{
      Name: "steve",
      Age: 23,
      Address: "北京市海淀区",
      ID: "2011234010303",
   }
   fmt.Println(s1.hashCode())

}

自定义对象作为key

自定义对象作为 key,最好同时重写 hashCode 、equals 方法
equals :用以判断 2 个 key 是否为同一个 key

  1. 自反性:对于任何非null 的x,x.equals(x)必须返回true
  2. 对称性:对于任何非 null 的 x、y,如果 y.equals(x) 返回 true,x.equals(y) 必须返回 true
  3. 传递性:对于任何非 null 的 x、y、z,如果 x.equals(y)、y.equals(z) 返回 true,那么x.equals(z) 必须 返回 true
  4. 一致性:对于任何非 null 的 x、y,只要 equals 的比较操作在对象中所用的信息没有被修改,多次调用 x.equals(y) 就会一致地返回 true,或者一致地返回 false
  • 对于任何非 null 的 x,x.equals(null) 必须返回 false
  • hashCode :必须保证 equals 为 true 的 2 个 key 的哈希值一样
  • 反过来 hashCode 相等的 key,不一定 equals 为 true

不重写 hashCode 方法只重写 equals 会有什么后果?
可能会导致 2 个 equals 为 true 的 key 同时存在哈希表中

iOS 中的哈希值使用 (- (BOOL)isEqual:(id)object; @property** (readonly) NSUInteger hash; ) 待续

安卓中哈希值使用(主要是讲解java 中hash map 源码)待续

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,529评论 5 475
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,015评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,409评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,385评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,387评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,466评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,880评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,528评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,727评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,528评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,602评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,302评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,873评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,890评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,132评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,777评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,310评论 2 342

推荐阅读更多精彩内容

  • Hash表也叫散列表,是一张非常重要的数据结构,很多缓存技术的核心就是在内存中维护一张大的Hash表 简单回顾其他...
    Mr_Guo_Coding阅读 2,116评论 0 3
  • TreeMap分析 时间复杂度(平均)添加,删除,搜索:O(logn) 特点Key必须具备可比较性元素的分布是有序...
    ducktobey阅读 496评论 0 0
  • Java所有类的父类Object类拥有如下重要的方法: equals 方法 和 == 在比较对象时,操作符 == ...
    mrjunwang阅读 325评论 0 0
  • equals()和hashCode()区别? equals():反映的是对象或变量具体的值,即两个对象里面包含的值...
    半路和尚怎么出家阅读 521评论 0 2
  • 以下是我看到的一篇好文章,摘抄过来。的确可以使人对于HashMap有更深的理解。理论看完了,接下来就要看一下源码实...
    willcoder阅读 178评论 0 1