XPath怎么选择属性节点 @*的用法

@ 用于匹配当前元素的所有属性节点,是属性轴@与通配符的组合,不匹配文本、子元素或注释;如div/@*选中所有div元素的全部属性节点。

XPath 中 @* 用来匹配当前元素节点的**所有属性节点**,它不是一个“选择属性节点”的独立语法,而是属性轴(@)和通配符(*)的组合,表示“所有属性”。

什么是 @*

@ 是 XPath 的属性轴(attribute axis),专门用于选取属性;* 是通配符,代表任意名称的节点。合起来 @* 就表示“当前上下文元素的所有属性节点”。它不匹配文本、子元素或注释,只匹配属性。

  • div[@*]:选中所有拥有至少一个属性的 元素(注意:这是元素节点筛选,不是选属性本身)
  • div/@*:选中所有 元素的全部属性节点(这才是真正“选择属性节点”)
  • //@*:选中整个文档中所有元素的所有属性节点(全局查找)
  • @* 常见用途

    它主要用于需要批量处理属性的场景,比如检查、提取、比对或调试时快速获取某元素全部属性值。

    • 在浏览器控制台用 $x("//input[@type='text']/@*") 查看某个输入框的所有属性(包括 idclassname 等)
    • 在 XML 解析中,用 //book/@* 一次性提取所有 元素的属性,避免逐个写 @id@author
    • 配合函数使用,如 count(//a/@*) 统计所有超链接属性总数(但更常见的是统计每个 a 的属性个数: //a/count(@*)

    注意事项

    @* 匹配的是属性**节点**,不是属性值。如果要取值,需配合 string() 或直接在支持的环境(如 lxml、XPath 2.0+)中自动转换。

    • //img/@src → 返回 src 属性节点(值为字符串)
    • //img/@* → 返回所有属性节点,如 src="logo.png"alt="logo"class="thumb"
    • 不能写成 @*@@@* —— 属性轴只能出现一次,且必须紧挨着 * 或具体名称
    • 在 XPath 1.0 中,@* 不支持嵌套过滤(如 @*[starts-with(name(), 'data-')] 是合法的,但某些老解析器可能不支持)

    对比其他常见写法

    理解 @* 更清晰,可以和几个易混写法对照:

    • @name:只匹配名为 name 的属性
    • @*:匹配所有属性(不限名称)
    • @*[name()='id']:用函数筛选出 name 是 id 的属性节点(效果等价于 @id
    • attribute::*:是 @* 的等价全写形式(显式写出属性轴),语义相同但更冗长

    基本上就这些。@* 看似简单,关键是分清它选的是“属性节点”本身,而且总是相对于当前元素而言。用对了,能省不少重复代码。