Ruby的REXML库怎么用

REXML是Ruby内置轻量级XML库,适合简单至中等复杂度场景;支持字符串/文件解析、XPath查找、属性文本读写及XML构建输出,但需注意大小写敏感、命名空间和空白节点处理。

REXML 是 Ruby 自带的轻量级 XML 处理库,无需额外安装,开箱即用。它适合读写简单到中等复杂度的 XML,语法直观、上手快,但不适合超大文件或高性能场景(这时建议用 NokogiriOx)。

解析 XML 字符串或文件

REXML::Document 加载 XML 内容,支持字符串、IO 对象或文件路径:

  • 从字符串解析:
    doc = REXML::Document.new("A")
  • 从文件解析:
    doc = REXML::Document.new(File.open("data.xml")) 或更安全地用 File.read
    doc = REXML::Document.new(File.read("data.xml"))

遍历和查找元素

常用方法有 rootelementseach 和 XPath 风格的 get_elements

  • doc.root 获取根节点(REXML::Element 实例)
  • doc.root.elements['item'] 获取第一个 子元素
  • doc.root.elements.to_a 转成元素数组,方便迭代
  • 用 XPath 查找:
    doc.get_elements("//item[@id='1']") → 返回匹配的元素集合

读取属性和文本内容

元素对象提供直观的方法访问结构信息:

  • 获取属性值:
    elem.attributes['id']elem.attribute('id')&.value
  • 获取子文本(不含子标签):
    elem.text(返回第一个文本节点)或 elem.texts.join 拼接所有文本
  • 获取所有直接子元素:
    elem.elements.to_a,再逐个处理

构建和输出 XML

新建文档可直接拼装,也支持添加子元素、属性和文本:

  • 创建新文档:
    doc = REXML::Document.new
    root = doc.add_element('root')
    item = root.add_element('item').add_attribute('id', '2')
    item.text = 'B'
  • 输出为字符串:
    puts doc.to_s(带缩进用 doc.write($stdout, 2)
  • 保存到文件:
    File.open("out.xml", "w") { |f| doc.write(f, 2) }

基本上就这些。REXML 不复杂但容易忽略大小写敏感、命名空间需显式处理、以及空格文本节点可能干扰 text 获取 —— 实际用时注意检查 elem.has_text? 或用 elem.texts.reject(&:blank?).first 更稳妥。