如何使用Java开发打包压缩工具_JavaZip流基础实战解析

Java的java.util.zip包支持ZIP文件读写,ZipOutputStream需先putNextEntry再write数据,ZipInputStream通过getNextEntry顺序读取条目,JDK7+默认UTF-8编码,处理中文路径需指定Charset,递归压缩目录要注意相对路径与安全性校验。

Java 自带的 java.util.

zip 包提供了完整的 ZIP 文件读写能力,无需第三方依赖即可实现压缩、解压、添加/遍历条目等核心功能。关键在于理解 ZipInputStream / ZipOutputStream 与普通字节流的协作逻辑,以及 ZipEntry 对文件元信息(路径、时间、大小、是否目录)的封装作用。

ZipOutputStream:构建 ZIP 包的核心输出流

创建 ZIP 文件本质是向输出流中“写入一个个 ZipEntry + 对应内容”。必须先写入 ZipEntry,再写入其数据,且不能跳过或乱序。

  • 使用 FileOutputStream 构造 ZipOutputStream
  • 对每个待压缩文件(或目录),新建 ZipEntry,注意设置路径名(用 / 分隔,目录结尾加 /
  • 调用 putNextEntry(entry) —— 这步不可省略,它标记新条目开始
  • 用普通 write() 写入该条目的原始字节(如文件内容或空字节数组表示目录)
  • 调用 closeEntry() 结束当前条目(可选,但推荐显式调用)

示例:压缩单个文本文件

ZipOutputStream zos = new ZipOutputStream(new FileOutputStream("out.zip"));
ZipEntry entry = new ZipEntry("hello.txt");
zos.putNextEntry(entry);
zos.write("Hello, ZIP!".getBytes(StandardCharsets.UTF_8));
zos.closeEntry();
zos.close();

ZipInputStream:安全读取 ZIP 内容的关键入口

ZIP 是顺序存储结构,ZipInputStream 必须逐个拉取 ZipEntry,再读取其数据。不能随机访问,也不能跳过条目后继续读后续内容(除非重置流)。

  • FileInputStream 构造 ZipInputStream
  • 循环调用 getNextEntry() 获取下一个条目,返回 null 表示结束
  • 检查 entry.isDirectory() 判断是否为目录,避免尝试读取目录内容
  • 对非目录条目,用标准字节读取方式(如 read(byte[]))获取原始数据
  • 每个条目读完后,无需 调用 closeEntry()(由流内部管理)

注意:getNextEntry() 会自动跳过当前条目数据,直接定位到下一个条目头 —— 所以务必在读完当前内容后再调用它。

处理中文路径与特殊字符的兼容方案

JDK 7+ 默认使用 UTF-8 编码 ZIP 中的文件名,但旧版 JDK 或某些压缩工具生成的 ZIP 可能用 GBK 或 CP437。若解压时出现乱码路径,需手动指定编码:

  • 使用 ZipInputStream 时,传入 Charset 构造函数(JDK 7+ 支持):
    new ZipInputStream(is, StandardCharsets.UTF_8)
  • 压缩时确保 ZipEntry 的名称字符串本身是正确编码的 Unicode 字符串(Java String 始终是 UTF-16,只要源字符串没错,写入 UTF-8 ZIP 就不会乱码)
  • 若需兼容老系统,可考虑 Apache Commons Compress 库,它提供更灵活的编码控制

实战技巧:递归压缩整个文件夹

压缩目录的本质是为每个文件/子目录创建对应 ZipEntry,并保持相对路径结构。关键点在于路径拼接和目录条目处理:

  • 递归遍历文件树,对每个 File 计算相对于根目录的相对路径(如 "src/Main.java"
  • 如果是目录,创建以 / 结尾的 ZipEntry,调用 putNextEntry 后立即 closeEntry(不写数据)
  • 如果是文件,创建不带结尾斜杠的 ZipEntry,然后写入文件全部字节
  • 利用 Files.walk()(JDK 8+)可简化遍历逻辑,注意捕获 IOException

务必校验目标路径是否合法(避免 ../ 路径穿越),生产环境建议对文件名做过滤或白名单校验。