Matlab怎么读取和写入XML文件

Matlab通过xmlread读取XML得到Java DOM对象,需用getElementsByTagName和getTextContent提取内容,xmlwrite仅支持DOM对象写入;中文需UTF-8声明,大文件易内存溢出,推荐JSON中转或xml2struct工具。

Matlab读取XML文件:用 xmlread 得到 DOM 文档对象

Matlab 本身不直接解析 XML 成结构化变量(比如 table 或 struct),而是通过 Java 的 DOM API 加载为 org.w3c.dom.Document 对象。这意味着你得手动遍历节点,不能像 Python 的 xml.etree.ElementTree 那样直接用 .find() 返回子元素对象。

常见错误是调用 xmlread 后直接试图用点号访问字段,比如 doc.root —— 这会报错,因为返回的是 Java 对象,不是 Matlab 结构体。

  • xmlread 只接受文件路径字符串,不支持 URL 或字节流
  • 若 XML 文件含中文且无声明编码(如 ),Windows 系统下可能乱码;建议统一保存为 UTF-8 并显式声明
  • 大文件(>50MB)可能导致内存溢出,此时应考虑用 SAX(Matlab 不原生支持,需自写 Java 类)或转为文本预处理
doc = xmlread('data.xml');  % 返回 org.w3c.dom.Document
root = doc.getDocumentElement;  % 获取根节点(org.w3c.dom.Element)
nodeName = char(root.getNodeName);  % 转为 Matlab 字符串需用 char()

提取XML节点内容:用 getElementsByTagNamegetTextContent

DOM 操作的核心是“找节点 → 取内容”。Matlab 封装了常用 Java 方法,但命名和行为与原生 Java 一致,比如 getElementsByTagName 返回的是 org.w3c.dom.NodeList,不是数组,必须用索引 item(0) 获取单个节点。

容易踩的坑是忽略空格文本节点:XML 中换行缩进会被当作 TEXT_NODE,导致 getChildNodes 返回一堆空白节点,误判子元素数量。

  • getElementsByTagName('tagname') 比遍历所有子节点更可靠
  • 取值务必链式调用:nodeList.item(0).getTextContent,中间任一环节为 null 会报 Java 异常
  • 数字或布尔值需手动转换:str2double(char(...))strcmpi(char(...), 'true')
nodes = root.getElementsByTagName('price');
if nodes.getLength > 0
    priceNode = nodes.item(0);
    priceStr = char(priceNode.getTextContent);  % 注意 char() 转换
    priceVal = str2double(priceStr);
end

Matlab写入XML文件:靠 xmlwrite 输出 DOM 对象

xmlwrite 只能写入由 xmlread 读取后修改的 DOM 对象,或完全用 Java 方法新建的 DOM(如 doc.createElement)。它**不接受 struct、table、cell 等 Matlab 原生数据类型**——没有“一键导出”函数。

这意味着:想从头生成 XML,必须手动创建文档、元素、属性、文本节点,再逐级 append。过程冗长,且易因节点归属错误(如把 element append 到 text node)导致运行时报错。

  • 新建文档要用 com.mathworks.xml.XMLUtils.createDocument,不是 xmlread('')
  • 所有文本内容必须用 doc.createTextNode(char(...)) 包裹,直接传 string 会失败
  • xmlwrite 默认不缩进,输出是单行;如需格式化,得额外调用 Java 的 Transformer 类(Matlab 未封装)
doc = com.mathworks.xml.XMLUtils.createDocument;
root = doc.createElement('bookstore');
doc.appendChild(root);

titleElem = doc.createElement('title');
titleText = doc.createTextNode(char('MATLAB Guide'));
titleElem.appendChild(titleText);
root.appendChild(titleElem);

xmlwrite(doc, 'output.xml');  % 写入文件

替代方案:用 webread + JSON 中转或第三方工具

如果 XML 结构固定、字段不多,硬写 DOM 操作效率低且难维护。更实际的做法是:用外部工具先转成 JSON(如命令行用 xml2json),再用 Matlab 的 jsondecode 读取;或反向用 jsonencode 生成 JSON 后转 XML(需额外脚本)。

另一个选择是使用 File Exchange 上的 xml2struct(作者:Jaroslaw Tuszynski),它封装了 DOM 遍历逻辑,能将简单 XML 映射为嵌套 struct,但对属性、命名空间、重复标签支持有限,且不维护多年。

  • 纯属性 XML(如 )在 xml2struct 中会丢失,需手动补全
  • 含 CDATA 或特殊字符(&, )时,xml2struct 可能解析失败,而原生 xmlread 能正确处理
  • 如果项目允许调用系统命令,webread(['!xmlstar -U -t -v "/root/item/name" data.xml']) 是快速提取单值的捷径

DOM 操作绕不开 Java 接口细节,最易被忽略的是节点所有权和生命周期:Java 对象在 Matlab 中不自动垃圾回收,大量读写后可能内存泄漏,尤其在循环中反复 xmlread 却不 clear 变量时。