Java Xalan XSLT处理器怎么用 Apache Xalan入门

Apache Xalan 是符合 XSLT 1.0/XPath 1.0 的轻量开源处理器,支持命令行及 Java 集成调用,需显式指定实现类(Java 9+),严格遵循标准,不支持 2.0+ 特性,使用时注意 serializer.jar 依赖、编码声明与扩展函数启用方式。

Apache Xalan 是 Java 平台上成熟、轻量、符合 XSLT 1.0 和 XPath 1.0 标准的开源处理器,适合在命令行或 Java 程序中直接调用,完成 XML 到 HTML、XML、文本等格式的转换。它不依赖浏览器,也不需要 Web 容器,开箱即用。

命令行快速上手

确保已安装 JDK(运行 java -version 可验证),并下载 xalan.jarserializer.jar(Xalan 发行包中自带)。常用命令结构如下:

  • java -jar xalan.jar -IN input.xml -XSL style.xsl -OUT output.html
  • 若 jar 包未设主类(如新版 xalan-j_2_7_2),改用:java -cp "xalan.jar;serializer.jar" org.apache.xalan.xslt.Process -IN input.xml -XSL style.xsl -OUT output.html(Windows 分号;Linux/macOS 用冒号)
  • XML 文件内若已通过 声明样式表,可省略 -XSL 参数

Java 代码中集成调用

只需几行标准 JAXP 接口代码,无需强耦合 Xalan 类型——推荐使用工厂模式解耦:

  • 添加依赖:将 xalan.jar 放入 classpath(Maven 用户可引入 org.apache.xalan:xalan
  • 创建工厂并指定实现:TransformerFactory factory = new org.apache.xalan.processor.TransformerFactoryImpl();
  • 加载 XSLT:Transformer transformer = factory.newTransformer(new StreamSource("style.xsl"));
  • 执行转换:transformer.transform(new StreamSource("data.xml"), new StreamResult("result.html"));

注意:Java 9+ 默认不再内置 Xalan,需显式指定实现类,否则可能 fallback 到默认(较弱)处理器。

XSLT 样式表编写要点

Xalan 严格遵循 XSLT 1.0,不支持 或正则函数等 2.0+ 特性。实用技巧包括:

  • 匹配根, 触发子节点处理
  • 动态生成元素名:用 ,其中 @type 是 XML 属性值
  • 排序输出:...
  • 调试建议:在模板中插入 Debug: 查看匹配路径

常见问题与规避方式

实际使用中高频遇到的问题有三类:

  • “Cannot find serializer jars”:缺失 serializer.jar,必须与 xalan.jar 同时加入 classpath
  • 中文乱码:在 XSLT 文件首行声明编码,如 ;同时在 StreamResult 构造时指定编码:new StreamResult(new FileOutputStream("out.html", false)) 配合 transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8")
  • 扩展函数不可用:Xalan 默认禁用 Java 扩展。如需调用自定义方法,需继承 %XML.XSLT.CallbackHandler 并注册,且启动时加 -Djavax.xml.transform.TransformerFactory=org.apache.xalan.processor.TransformerFactoryImpl