博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
HashMap原理总结
阅读量:5984 次
发布时间:2019-06-20

本文共 4085 字,大约阅读时间需要 13 分钟。

 

  来总结一下HashMap的原理

1.HashMap当中有一个内部类,它叫Node,然后这个Node呢,它其实是实现了Map.Entry接口,这个接口当中有几个抽象的方法和几个具体的方法。其中Map.Entry<K,V>是一个泛型的元组。

2.Map.Entry接口中有如下抽象方法:

  • getKey()
  • getValue()
  • setValue()
  • hashCode()
  • equals

3.Node的私有变量如下:

  • hash
  • key
  • value
  • Next node

其中HashMap的核心是hashcode的生成算法,hashCode的生成算法如下:

Objects.hashCode(key) ^ Objects.hashCode(value);

它是先通过得到Key和value的hashcode,然后对2个值进行异或操作后得到的值。

其中Object.hashCode是一个native的方法。

public native int hashCode();

其中Node的equals方法,传入的对象是object,只有当object的类型是map.entry并且,当前对象的key和value都和传入的key,value一致,那样才会返回相等。

下面的这个方法,是计算hash值的方法。它是通过key去计算,然后把拿到的hashcode和它右移16位的结果进行异或操作,具体回头再看为什么,我也不知道。

static final int hash(Object key) {        int h;        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);    }

hashMap里面还有一个entrySet的成员变量,它是一个set 的集合,这里面的transient关键字不太懂,回头再看看。

transient Set
> entrySet;

HashMap里面有一个非常重要的方法,叫做putVal()方法。这算是里面最核心的一个方法了,弄懂了这个方法,80%的HashMap相关的知识都能弄懂了

首先是有2个Node的声明,一个是tab,一个是p.

Node
[] tab; Node
p; int n, i;

下面我们来解析一下PutVal方法,如果table为空,或者table的长度为0,重置table的长度。

if ((tab = table) == null || (n = tab.length) == 0)            n = (tab = resize()).length;

首先是下面的代码会利用到上面的代码,n得出了一个结果,那就是resize()后的结果,下面的n-1就是“”最后“”一个元素

if ((p = tab[i = (n - 1) & hash]) == null)            tab[i] = newNode(hash, key, value, null);

下面的代码就是上面的tabl[x]里面的逻辑,这里面用到了按位与的一个运算:为什么要这么做?不知道。

来做一个小小的补充,这里要先复习一下按位与的结果操作,什么时候获取什么值,如果hash是一个负数,那又是什么情况呢?

 

(n - 1) & hash

我猜想的是,如果“”找到的“”元素为null,那么新建一个node元素。并且这个node元素的next为空。否则执行else里面的逻辑。

----------------------------------------我是分割线---------------------------------------------

首先putVal方法会去计算这个key的hash值。

首先我觉得要明白hash算法的真谛,网上找的这句话,说得不错:要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的可以检验数据的完整性。

当第一次进入putval方法的时候,table是空的,所以肯定要进行一个resize操作,不光是table,连threshold都是0,所有的东西都未能初始化的情况下,这个时候,应该进入如下逻辑:

newCap = DEFAULT_INITIAL_CAPACITY;            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);

这个时候,newCapicity的话就变成了初始值16,newThr变成了初始化的Threhold,如果是这种情况下的话,就会新建一个长度为16的Node<K,V>[]数组,最后返回newTable,注意,resize操作的返回对象。

Node
[] newTab = (Node
[])new Node[newCap];

在下面的例子中,hash值是一个非常大的值,换算成2进制,它是32位长度的一个2进制,用按位与的操作是最快的,因为计算机内部结构就是二进制的。

if ((p = tab[i = (n - 1) & hash]) == null)

 注意!!!它先填充的是tab[10]的内容,也就是说,并没有从0开始填充,这是违背我们直觉的一件事情。

 

 

然后让modCount++,

最后,如果负载因子小于size,那么,hashmap会自动扩容。

if (++size > threshold)            resize();

随后执行afterNodeInsertion方法,这个方法在Hashmap当中是一个空的方法,API里面介绍的是为LinkedHashMap所用,所以这里不再做讨论。还有注意下,如果是新建的hashMap第一次putval,那么它的返回值为null.

 要注意一点,新建一个HashMap,它并不是独立存在的,在你把你的key添加进去之前,它还会添加非常多的其他的KEY,也就是我们所说的:系统路径,所以最后得出的结果就是,如果你是一个新的HashMap,那么,你添加了一个KEY,肯定这里面不止一个KEY。

 大家可以观察到,当SIZE=13的时候,

其实是自动进入了resize这个方法的,你看我断点都进来了。这就证明了hashmap的自动扩容机制。

 

 那么为什么会有这么多的Node被添加进来呢?原因只有一个,就是我们用idea启动项目的时候,一些类其实是用到了HashMap的,它优于我们调试的时候进入的HashMap,所以刚才大家才会看到那么多的节点被添加到hashMap当中去。

 当我把在putVal上的断点去掉以后,就进入了如下代码块,验证了我的猜想。

 

另外还有一个很有趣现象,我用单元测试,新建了一个HashMap,结果。。。你发现没有,jdk里面已经填充了4项了,原来,我们认为的Hashmap,有多少项,就add多少项的观点其实是错误的!!!

下面我们再来看看如下代码,传入的hash和之前的hash进行对比,这里面可能大家有一些迷糊,当然包括我也看不懂,不过从这里可以获取一个非常重要的信息,这么做的方式就是为了避免一个hashmap钟可能出现“相同”的hash对象,我是这么理解的,如果有高人,可以来解释下为什么这样。

if (p.hash == hash &&                ((k = p.key) == key || (key != null && key.equals(k))))                e = p;

下面的代码也很明白了,如果不是上面都 ,那么如果是树节点,那么就执行下面的逻辑,此处不再深究。

else if (p instanceof TreeNode)                e = ((TreeNode
)p).putTreeVal(this, tab, hash, key, value);

下面的代码的含义是,如果p.next为空的话,那么新建一个节点,并追加到尾部,这种情况,就是当p指向最后一个节点的时候才会出现的情况。

for (int binCount = 0; ; ++binCount) {                    if ((e = p.next) == null) {                        p.next = newNode(hash, key, value, null);                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st                            treeifyBin(tab, hash);                        break;                    }                    if (e.hash == hash &&                        ((k = e.key) == key || (key != null && key.equals(k))))                        break;                    p = e;                }

后面的代码有点感觉太难啃了,先暂时就这样吧,今天的HashMap分析得还不太完整,并且不太合理,希望大家能多提宝贵建议。

 

转载于:https://www.cnblogs.com/kmsfan/p/8027184.html

你可能感兴趣的文章
Boolean.valueOf("true")的用法
查看>>
python——内置函数、匿名函数
查看>>
[Leetcode]538. Convert BST to Greater Tree
查看>>
git 教程资源
查看>>
jvm垃圾回收器与内存分配策略
查看>>
机器学习之svm---cv wiki svm
查看>>
多媒体开发之播放器---一个基于FFmpeg、libtorrent的P2P播放器实现
查看>>
淘宝数据魔方技术架构解析阅读心得
查看>>
python 文件操作
查看>>
寄存器的概念
查看>>
复习java基础第七天(反射)
查看>>
poj3660 cow contest
查看>>
下载 ....aar jitpack.io 打不开。
查看>>
c语言显示八进制和十六进制数
查看>>
Opera技术布道专家谢子斌谈HTML5
查看>>
一起谈.NET技术,Discuz!NT 缓存设计简析 [原创]
查看>>
browser-sync默认地址如何转成127.0.0.1
查看>>
学习php脚本
查看>>
Git使用
查看>>
Spark之键值RDD转换(转载)
查看>>