从源代码看 HashMap 的加载因子和容量分配

本贴最后更新于 1961 天前,其中的信息可能已经水流花落

一直知道 HashMap 有默认的容量和加载因子,今天想看看源代码,希望能了解的更清楚一些。 



我们先看看默认的构造器吧,以下为我本机的 JDK6.0 的源代码. 


  1.     /**
  2.      * 默认的初始化的容量,必须是2的幂次数<br>
  3.      * The default initial capacity - MUST be a power of two.
  4.      */
  5.     static final int DEFAULT_INITIAL_CAPACITY = 16;

  6.     /**
  7.      * 默认的加载因子
  8.      */
  9.     static final float DEFAULT_LOAD_FACTOR = 0.75f;

  10.     /**
  11.      * 下一个需要重新分配的尺寸值。等于容量乘以加载因子。<br>
  12.      * 也就是说,一旦容量到了这个数值,将重新分配容器的尺寸。
  13.      * The next size value at which to resize (capacity * load factor).
  14.      * @serial
  15.      */
  16.     int threshold;

  17.     public HashMap() {
  18.         this.loadFactor = DEFAULT_LOAD_FACTOR; 
  19.         threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);
  20.         table = new Entry[DEFAULT_INITIAL_CAPACITY];
  21.         init();
  22.     }


从代码可以看出,默认的容量是16,而 threshold是16*0.75 = 12; 
我们来看看增加的部分代码。 
  1.     public V put(K key, V value) {
  2.         // 我们忽略掉这部分的代码,只看我们这里最关心的部分
  3.         addEntry(hash, key, value, i); // 这里增加了一个Entry,我们看看代码
  4.         return null;
  5.     }

  6.     void addEntry(int hash, K key, V value, int bucketIndex) {
  7.     Entry<K,V> e = table[bucketIndex];
  8.         table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
  9.         if (size++ >= threshold) // 这里是关键,一旦大于等于threshold的数值
  10.             resize(2 * table.length); // 将会引起容量2倍的扩大
  11.     }

  12.     void resize(int newCapacity) {
  13.         Entry[] oldTable = table;
  14.         int oldCapacity = oldTable.length;
  15.         if (oldCapacity == MAXIMUM_CAPACITY) {
  16.             threshold = Integer.MAX_VALUE;
  17.             return;
  18.         }

  19.         Entry[] newTable = new Entry[newCapacity]; // 新的容器空间
  20.         transfer(newTable); // 复制数据过去
  21.         table = newTable;
  22.         threshold = (int)(newCapacity * loadFactor); // 重新计算threshold的值
  23.     }
好了,我想我们已经清楚大部分了。 
其中有一点,起始容量必须是2的幂次,这如何保证呢?我们来看看其构造方法
  1.     public HashMap(int initialCapacity, float loadFactor) {
  2.         // 忽略掉一部分代码....

  3.         // Find a power of 2 >= initialCapacity
  4.         // 重新查找不比指定数值大的最大的2的幂次数
  5.         int capacity = 1;
  6.         while (capacity < initialCapacity)
  7.             capacity <<= 1;
  8.         // 其它的初始化代码 ...
  9.     }
好了,关于起始容量和加载因子的探讨我们就到这里了。我们应该有了一定的了解了。 

总结: 
    相对准确的估算数据量,将极大的影响HashMap的性能,因为resize是一个重新分配的过程,耗时应该是里面最大的。 
    加载因子较小,会有更多的空间空闲,我不知道这个0.75是不是一个折中方案。也许0.9也是一个不错的选择,特别是那些数据量虽然很大,但不是经常变化的地方,比如公司人员,城市列表等相对比较固定的数据

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • someone756

    能不能好好排排版?直接粘贴复制真的好么???????????????!!!!!!!!!!!!!!!!!!!

  • someone756

    有意义么?????

推荐标签 标签

  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    39 引用 • 24 回帖
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    103 引用 • 294 回帖
  • 创造

    你创造的作品可能会帮助到很多人,如果是开源项目的话就更赞了!

    173 引用 • 990 回帖 • 1 关注
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    85 引用 • 895 回帖
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 1 关注
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    164 引用 • 594 回帖
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖 • 5 关注
  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 232 回帖 • 6 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 559 关注
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    5 引用 • 15 回帖 • 222 关注
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 636 关注
  • 电影

    这是一个不能说的秘密。

    120 引用 • 597 回帖
  • Ngui

    Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
    Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。

    7 引用 • 9 回帖 • 345 关注
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖 • 2 关注
  • golang

    Go 语言是 Google 推出的一种全新的编程语言,可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说:我们之所以开发 Go,是因为过去 10 多年间软件开发的难度令人沮丧。Go 是谷歌 2009 发布的第二款编程语言。

    492 引用 • 1383 回帖 • 375 关注
  • 倾城之链
    23 引用 • 66 回帖 • 100 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 697 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    207 引用 • 2031 回帖
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    25 引用 • 215 回帖 • 165 关注
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    131 引用 • 3639 回帖
  • flomo

    flomo 是新一代 「卡片笔记」 ,专注在碎片化时代,促进你的记录,帮你积累更多知识资产。

    3 引用 • 80 回帖 • 2 关注
  • 博客

    记录并分享人生的经历。

    270 引用 • 2386 回帖
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 21 关注
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    915 引用 • 931 回帖
  • RESTful

    一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。

    30 引用 • 114 回帖
  • abitmean

    有点意思就行了

    22 关注