HashMap源码浅析-白红宇

HashMap源码浅析

阅读量：7098 次

发布时间：2019-06-28

本文共 6521 字，大约阅读时间需要 21 分钟。

HashMap是Java中使用频率最高处理键值对的集合，本文将对HashMap的源码进行理解学习（基于JDK1.8）。

在学习HashMap之前，先需要理解什么是哈希表。

哈希表，也称为散列表。是一种使用非常频繁的数据结构，它能根据键（Key）直接访问内存的存储位置。本质上维护了一种键值对关系。

Hash表的做法其实很简单，它通过某种Hash算法计算出键（Key）的hash值，然后对存储值（Value）的数组进行取模运算，取模结果就作为数组下标，将值（Value）存储在计算出的位置。因而也和数组一样，通过数组下标就可以直接操作，速度很快。

HashMap的底层是用的就是哈希表，在JDK1.8中HashMap的底层存储结构是：数组+链表+红黑树，如下图所示：

通过读源码，可以知道HashMap中使用一个静态内部类来保存哈希表中键值对的关系：

//哈希桶数组，存储键值对    transient Node
     
      [] table;        static class Node
      
        implements Map.Entry
       
         {        final int hash;     //用来定位数组索引位置        final K key;        V value;        Node
        
          next;     //链表下个节点的引用    }

其中最后一个属性，指向了链表的下一节点。

下面，再来看一下HashMap的hash算法：

static final int hash(Object key) {        int h;        //key为null的时候，hash为0        //1、h为key的hashCode值        //2、h >>> 16        //3、将1和2中的结果进行异或运算        //hash值高16位不变，低16位与高16位异或作为key的最终hash值        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);    }

这个方法就决定了一个Entry键值对在哈希桶数组中的存储位置。

在1.8版本的HashMap中，

/**     * 返回一个比给定整数大且最接近的2的幂次方整数     * 这个算法不断的把第一个1开始后面的位变成1     */    static final int tableSizeFor(int cap) {        int n = cap - 1;        n |= n >>> 1;        n |= n >>> 2;        n |= n >>> 4;        n |= n >>> 8;        n |= n >>> 16;        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;    }

HashMap的构造方法：

HashMap的put方法：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,                   boolean evict) {        Node
     
      [] tab; Node
      
        p; int n, i;        //将当前hash桶指向tab，判断tab是否为null        //计算hash桶的长度n，判断n是否为0        if ((tab = table) == null || (n = tab.length) == 0)            n = (tab = resize()).length;            //对hash桶进行扩容，并将新的长度指向n        if ((p = tab[i = (n - 1) & hash]) == null)  //计算元素存放位置p，并判断hash桶该索引处是否为null            tab[i] = newNode(hash, key, value, null);   //将需要存储的k-v对存放在该hash桶第i个位置        else {      //计算出的存储位置处已经有了元素，转为链或者树            Node
       
         e; K k;            //校验链表首节点元素key的hash值是否与插入值相等，key是否相等            if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))                e = p;                      //将p赋给e            else if (p instanceof TreeNode) //树                e = ((TreeNode
        
         )p).putTreeVal(this, tab, hash, key, value);            else {                          //链表                //循环，                for (int binCount = 0; ; ++binCount) {                    //依次判断下一节点是否为null，为null时，就将k-v数据插入到链表末尾                    if ((e = p.next) == null) {                        p.next = newNode(hash, key, value, null);                        if (binCount >= TREEIFY_THRESHOLD - 1)  //当插入第8个节点的时候，结构转化为树                            treeifyBin(tab, hash);                        break;                    }                    //判断此处链表是否存在此key，如果存在，将e指向它                    if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))                        break;                    p = e;                }            }            //链表或树中已经存在了此key，条件符合时替换value            if (e != null) { // existing mapping for key                V oldValue = e.value;                //onlyIfAbsent为true表示不修改已经存在的值                if (!onlyIfAbsent || oldValue == null)                    e.value = value;                afterNodeAccess(e);                return oldValue;            }        }        ++modCount;        //判断是否需要扩容        if (++size > threshold)            resize();        afterNodeInsertion(evict);        return null;    }

HashMap的扩容：

final Node
     
      [] resize() {        Node
      
       [] oldTab = table;        int oldCap = (oldTab == null) ? 0 : oldTab.length;      //旧hash桶长度        int oldThr = threshold;                                 //旧阈值        int newCap, newThr = 0;        if (oldCap > 0) {       //旧hash桶长度大于0时            if (oldCap >= MAXIMUM_CAPACITY) {                threshold = Integer.MAX_VALUE;                return oldTab;            }            //如果就hash桶长度的2倍小于最大容量，并且旧容量大于默认初始容量16，就将新hash桶长度扩为以前的2倍            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY)                newThr = oldThr << 1; // double threshold       //新阈值为旧阈值的2倍        }        //旧阈值大于0，新hash桶容量就是阈值        else if (oldThr > 0)        //initial capacity was placed in threshold            newCap = oldThr;        else {                      // zero initial threshold signifies using defaults 零初始阈值表示使用默认值            //否则使用默认值            newCap = DEFAULT_INITIAL_CAPACITY;            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);        }        if (newThr == 0) {            float ft = (float)newCap * loadFactor;      //计算新阈值            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE);        }        threshold = newThr;         //计算新阈值        @SuppressWarnings({"rawtypes","unchecked"})        Node
       
        [] newTab = (Node
        
         [])new Node[newCap];     //新创建一个数组        table = newTab;         //将新数组作为hash桶        if (oldTab != null) {            for (int j = 0; j < oldCap; ++j) {                Node
         
           e;        //声明一个节点e                if ((e = oldTab[j]) != null) {          //循环整个hash桶数组，将非空元素进行复制                    oldTab[j] = null;                    if (e.next == null)                 //这条链上只有一个节点元素时                        newTab[e.hash & (newCap - 1)] = e;  //确定该节点元素在新的hash桶的位置                    else if (e instanceof TreeNode)     //如果hash桶数组此处是红黑树                        ((TreeNode
          
           )e).split(this, newTab, j, oldCap); else { // preserve order //hash桶数组此处是链表 // 进行链表复制 // 方法比较特殊： 它并没有重新计算元素在数组中的位置 // 而是采用了 原始位置加原数组长度的方法计算得到位置 Node
           
             loHead = null, loTail = null; Node
            
              hiHead = null, hiTail = null; Node
             
               next; do { //循环链表 next = e.next; if ((e.hash & oldCap) == 0) { //e.hash & oldCap计算节点e是否需要移动 if (loTail == null) //链表尾巴为bull，则链表为null loHead = e; //设置首节点 else loTail.next = e; loTail = e; //否则就将节点e作为链表尾节点 } else { //需要移动 if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); //循环条件为e节点的下一节点不为null if (loTail != null) { //源链表尾巴不为null时 loTail.next = null; //将尾节点的下一节点设为null newTab[j] = loHead; //首节点赋值 } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; //hash桶数组新增链表元素的首节点赋值 } } } } } return newTab; }

JDK1.7中HashMap在多线程环境下可能发送死循环问题：

HashMap小结：

转载于:https://www.cnblogs.com/fcml/p/10561562.html

你可能感兴趣的文章

Android IOS WebRTC 音视频开发总结（二八）-- 多人视频方案介绍