java 中说一下 HashMap 的实现原理？

畫卷琴夢 2025-09-29 00:00:00 次阅读

HashMap基于数组+链表/红黑树实现，通过哈希计算与扰动减少冲突，(n-1)&hash确定索引，扩容时rehash，非线程安全，put/get操作平均O(1)时间复杂度。

HashMap 在 Java 中是一

种基于哈希表实现的键值对集合，它允许存储 null 的 key 和 value，不保证元素的顺序，并且是非线程安全的。它的核心原理是通过数组 + 链表（或红黑树）来实现高效的数据存取。

HashMap 内部维护一个 Node[] 数组，每个数组元素是一个链表的头节点。Node 是实现了 Map.Entry 接口的静态内部类，包含 key、value、next 指针和 hash 值。

当发生哈希冲突（即不同的 key 计算出相同的数组下标）时，HashMap 使用链表将冲突的元素串起来。从 JDK 1.8 开始，当链表长度超过 8 且数组长度大于等于 64 时，链表会转换为红黑树，以提高查找效率；当红黑树节点少于 6 时，又会转回链表。

HashMap 通过 key 的 hashCode() 方法获取原始哈希值，然后进行扰动处理（高位运算），目的是减少哈希碰撞：

hash = (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);

然后通过“(n - 1) & hash”来确定元素在数组中的位置，其中 n 是数组长度，必须是 2 的幂次。这种方式比取模运算更快，等效于 hash % n。

初始容量是 16，默认负载因子是 0.75。当元素数量超过“容量 × 负载因子”时，就会触发扩容。扩容后容量变为原来的两倍。

扩容时会创建一个新的数组，并将旧数组中的所有元素重新计算位置放入新数组。这个过程叫做“rehash”。因为数组长度变化，原来冲突的元素可能不再冲突，也可能出现新的分布。

需要注意的是，在多线程环境下同时进行 put 操作可能导致链表成环，引发死循环，因此 HashMap 不是线程安全的。

put 流程：

get 流程：

基本上就这些。HashMap 的设计目标是实现平均 O(1) 的存取时间，关键在于合理的哈希函数、负载因子控制和冲突处理机制。

上一篇文章

如何在Eclipse中配置Java开发环境

2025-09-29 1893次阅读

下一篇文章

2025-09-29 1528次阅读