java 实现 PDF 文件下载到服务器

本贴最后更新于 2691 天前,其中的信息可能已经事过景迁

目前负责的项目遇到下载 pdf 文件到本地的需求,有 http 请求和 https 请求发个帖记录一下!


1.http 请求 pdf 文件地址并下载到本地,别的不太会说,直接粘代码了

package cn.com.test;

import java.io.DataInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.URL;

import javax.net.ssl.HttpsURLConnection;

/**
 * 
 * @ClassName: HttpDownloaderPDF
 * @Description: 下载pdf文件到本地
 * @author Stone
 * @date 2016年12月1日
 * 
 */
public class HttpDownloaderPDF {
	
	String remoteFileUrl = "";//pdf文件请求地址
	String localFilePath = "";//本地存放pdf文件路径

	public void httpDownloader(String remoteFileUrl, String localFilePath) {
		try {
			URL url = new URL(remoteFileUrl);

			HttpURLConnection httpURLConnection = (HttpsURLConnection) url.openConnection();
			httpURLConnection.setConnectTimeout(5 * 1000); // 5000 自定义连接超时毫秒数
			httpURLConnection.connect(); // 连接
			System.out.println("connect URL success!");

			int fileLenght = httpURLConnection.getContentLength();
			System.out.println("file size:" + (fileLenght / 1024.0) + " KB");

			System.out.println("start the download...");
			try (DataInputStream dis = new DataInputStream(
					httpURLConnection.getInputStream());
					FileOutputStream fos = new FileOutputStream(localFilePath)) {
				byte[] buf = new byte[10240]; // 根据实际情况自定义 buf 大小
				for (int readSize; (readSize = dis.read(buf)) > 0;) {
					fos.write(buf, 0, readSize);
				}
				System.out.println("download is complete!");
			} catch (IOException ex) {
				System.out.println("download is error");
			}

			httpURLConnection.disconnect();
		} catch (IOException ex) {
			ex.printStackTrace();
			System.out.println("URL Does not exist or connection timeout!");
		}
	}

}

class PDFTest {
	public static void main(String[] args) {
		HttpDownloaderPDF hdl = new HttpDownloaderPDF();
		hdl.httpDownloader("requestURL", "/home/Stone/Downloader/file.pdf");
	}
	
}


2.有 http 请求就应该考虑 https 请求,还是简单粗暴直接粘代码

package cn.com.test;

import java.io.DataInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.URL;
import java.security.cert.X509Certificate;

import javax.net.ssl.HostnameVerifier;
import javax.net.ssl.HttpsURLConnection;
import javax.net.ssl.SSLContext;
import javax.net.ssl.SSLSession;
import javax.net.ssl.TrustManager;
import javax.net.ssl.X509TrustManager;

/**
 * 
 * @ClassName: HttpDownloaderPDF
 * @Description: 下载pdf文件到本地
 * @author Stone
 * @date 2016年12月1日
 * 
 */
public class HttpDownloaderPDF {

	/**
	 * 验证证书
	 */
	final static HostnameVerifier DO_NOT_VERIFY = new HostnameVerifier() {
		public boolean verify(String hostname, SSLSession session) {
			return true;
		}
	};

	private static void trustAllHosts() {
		// 创建信任管理器跃过证书校验
		TrustManager[] trustAllCerts = new TrustManager[] { new X509TrustManager() {
			public java.security.cert.X509Certificate[] getAcceptedIssuers() {
				return new java.security.cert.X509Certificate[] {};
			}
			public void checkClientTrusted(X509Certificate[] chain, String authType) {
				
			}
			public void checkServerTrusted(X509Certificate[] chain, String authType) {
				
			}
		} };

		// 安装 all-trusting 信托管理
		try {
			SSLContext sc = SSLContext.getInstance("TLS");
			sc.init(null, trustAllCerts, new java.security.SecureRandom());
			HttpsURLConnection.setDefaultSSLSocketFactory(sc.getSocketFactory());
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

	public void httpDownloader(String remoteFileUrl, String localFilePath) {
		try {
			trustAllHosts();
			URL url = new URL(remoteFileUrl);

			HttpsURLConnection https = (HttpsURLConnection) url.openConnection();
			https.setHostnameVerifier(DO_NOT_VERIFY);

			HttpURLConnection httpURLConnection = https;
			httpURLConnection.setConnectTimeout(5 * 1000); // 5000 自定义连接超时毫秒数
			httpURLConnection.connect(); // 连接
			System.out.println("connect URL success!");

			int fileLenght = httpURLConnection.getContentLength();
			System.out.println("file size:" + (fileLenght / 1024.0) + " KB");

			System.out.println("start the download...");
			try (DataInputStream dis = new DataInputStream(
					httpURLConnection.getInputStream());
					FileOutputStream fos = new FileOutputStream(localFilePath)) {
				byte[] buf = new byte[10240]; // 根据实际情况自定义 buf 大小
				for (int readSize; (readSize = dis.read(buf)) > 0;) {
					fos.write(buf, 0, readSize);
				}
				System.out.println("download is complete!");
			} catch (IOException ex) {
				System.out.println("download is error");
			}

			httpURLConnection.disconnect();
		} catch (IOException ex) {
			ex.printStackTrace();
			System.out.println("URL Does not exist or connection timeout!");
		}
	}

}

class PDFTest {
	public static void main(String[] args) {
		HttpDownloaderPDF hdl = new HttpDownloaderPDF();
		hdl.httpDownloader("requestURL", "/home/Stone/Downloader/file.pdf");
	}
	
}


注意:记得在服务器自定义目录下(不要在需要权限的目录下创建,很麻烦还要授权)创建你存文件的文件夹,不然的话程序顺利执行完,但是你要的文件不一定能下载成功!就好比你告诉我,石头哥哥晚上我请你吃饭记得来我家哈!说的挺好听,你不告诉我你家地址和门牌号,我怎么知道去哪里找你,所以啊写程序也得多点儿真诚少点儿套路 0.0

版权声明:本文为本人原创文章,转载请注明出处 java 实现 PDF 文件下载到服务器谢谢!

  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3167 引用 • 8207 回帖
  • PDF
    26 引用 • 36 回帖 • 1 关注
  • HTTP
    75 引用 • 127 回帖 • 1 关注
  • HTTPS
    98 引用 • 271 回帖 • 3 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    69 引用 • 190 回帖 • 492 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖 • 3 关注
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 620 关注
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 383 回帖 • 3 关注
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 404 关注
  • 负能量

    上帝为你关上了一扇门,然后就去睡觉了....努力不一定能成功,但不努力一定很轻松 (° ー °〃)

    85 引用 • 1201 回帖 • 455 关注
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 293 关注
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    18600 引用 • 69242 回帖 • 1 关注
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    139 引用 • 441 回帖
  • Eclipse

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。

    75 引用 • 258 回帖 • 629 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    261 引用 • 662 回帖
  • wolai

    我来 wolai:不仅仅是未来的云端笔记!

    1 引用 • 11 回帖 • 1 关注
  • Ngui

    Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
    Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。

    7 引用 • 9 回帖 • 346 关注
  • CSS

    CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。

    180 引用 • 447 回帖 • 1 关注
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 18 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    53 引用 • 85 回帖
  • 反馈

    Communication channel for makers and users.

    123 引用 • 906 回帖 • 191 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    189 引用 • 1056 回帖
  • Chrome

    Chrome 又称 Google 浏览器,是一个由谷歌公司开发的网页浏览器。该浏览器是基于其他开源软件所编写,包括 WebKit,目标是提升稳定性、速度和安全性,并创造出简单且有效率的使用者界面。

    60 引用 • 287 回帖 • 2 关注
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 9 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 457 关注
  • ngrok

    ngrok 是一个反向代理,通过在公共的端点和本地运行的 Web 服务器之间建立一个安全的通道。

    7 引用 • 63 回帖 • 598 关注
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    15 引用 • 7 回帖 • 9 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    164 引用 • 407 回帖 • 526 关注
  • uTools

    uTools 是一个极简、插件化、跨平台的现代桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。

    5 引用 • 13 回帖