HashBufferedInputStream: 实现 InputStream 在使用中同时计算 Hash 值

本贴最后更新于 2550 天前,其中的信息可能已经东海扬尘

需求:

  • 文件上传的同时计算 hash 值
  • 输入流使用是计算 hash

实现:

上面两个需求其实都是一致的 都是 处理 InputStream 同时计算 Hash 值

我们知道 Java IO 是使用的 装饰模式, 那么我们只需要对 BufferedInputStream 进行封装即可

重点是 Override public int read(final byte[] anB) throws IOException

这样仅支持连续完整的使用 public int read(final byte[] anB) throws IOException 读取完 流的情况,所以还是有很大局限性。

package me.vanlin.test;

import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.HashSet;
import java.util.Set;

import org.apache.commons.io.IOUtils;

/**
 * @author liuwl
 *
 */
public class HashBufferedInputStream extends BufferedInputStream {
    private final MessageDigest messageDigest;

    private static final Set<String> algorithms = new HashSet<>();

    static {
        algorithms.add("MD5");
        algorithms.add("SHA-1");
        algorithms.add("SHA-256");
        algorithms.add("SHA-512");
    }

    /**
     * @param anIn
     * @throws NoSuchAlgorithmException
     */
    public HashBufferedInputStream(final InputStream anIn, final String algorithm) throws NoSuchAlgorithmException {
        super(anIn);
        if (!algorithms.contains(algorithm)) {
            throw new RuntimeException("algorithm not support");
        }
        messageDigest = MessageDigest.getInstance(algorithm);
    }

    /**
     * @param anIn
     * @param anSize
     * @throws NoSuchAlgorithmException
     */
    public HashBufferedInputStream(final InputStream anIn, final int anSize, final String algorithm) throws NoSuchAlgorithmException {
        super(anIn, anSize);
        if (!algorithms.contains(algorithm)) {
            throw new RuntimeException("algorithm not support");
        }
        messageDigest = MessageDigest.getInstance(algorithm);
    }

    @Override
    public int read(final byte[] anB) throws IOException {
        final int result = super.read(anB);
        if (result != -1) {
            messageDigest.update(anB, 0, result);
        }
        return result;
    }

    public String getHash() {
        final byte byteBuffer[] = messageDigest.digest();
        final StringBuffer hexStr = new StringBuffer();
        for (final byte element : byteBuffer) {
            final String hex = Integer.toHexString(0xff & element);
            if (hex.length() == 1) {
                hexStr.append('0');
            }
            hexStr.append(hex);
        }
        return hexStr.toString();
    }

    public static void main(final String[] args) throws NoSuchAlgorithmException, IOException {
        final File file = new File("E:\\me\\front-end.tar.gz");
        try (final FileInputStream inputStream = new FileInputStream(file);
                final HashBufferedInputStream hashBufferedInputStream = new HashBufferedInputStream(inputStream, "MD5");
                final FileOutputStream outputStream = new FileOutputStream("E://me//testtesttest.tar.gz");
                final BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(outputStream);) {
            IOUtils.copy(hashBufferedInputStream, bufferedOutputStream);
            System.out.println(hashBufferedInputStream.getHash());
        }

    }
}

代码如有纰漏请不吝赐教。

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    40 引用 • 24 回帖
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 36 关注
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 11 关注
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 625 关注
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 2 关注
  • gRpc
    10 引用 • 8 回帖 • 54 关注
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    10 引用 • 85 回帖
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 396 关注
  • Telegram

    Telegram 是一个非盈利性、基于云端的即时消息服务。它提供了支持各大操作系统平台的开源的客户端,也提供了很多强大的 APIs 给开发者创建自己的客户端和机器人。

    5 引用 • 35 回帖
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 634 关注
  • 倾城之链
    23 引用 • 66 回帖 • 104 关注
  • OnlyOffice
    4 引用 • 19 关注
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3169 引用 • 8207 回帖
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 154 关注
  • 反馈

    Communication channel for makers and users.

    123 引用 • 906 回帖 • 195 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    103 引用 • 294 回帖
  • 音乐

    你听到信仰的声音了么?

    59 引用 • 509 回帖
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 455 关注
  • Oracle

    Oracle(甲骨文)公司,全称甲骨文股份有限公司(甲骨文软件系统有限公司),是全球最大的企业级软件公司,总部位于美国加利福尼亚州的红木滩。1989 年正式进入中国市场。2013 年,甲骨文已超越 IBM,成为继 Microsoft 后全球第二大软件公司。

    103 引用 • 126 回帖 • 446 关注
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖 • 10 关注
  • sts
    2 引用 • 2 回帖 • 152 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 463 关注
  • 职场

    找到自己的位置,萌新烦恼少。

    126 引用 • 1699 回帖
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    915 引用 • 931 回帖
  • PostgreSQL

    PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。

    22 引用 • 22 回帖 • 2 关注