XPath 2.0引入了哪些数据类型,它与1.0的节点集有何区别?

XPath 2.0核心变化是引入基于XML Schema的类型系统和“序列”概念,支持原子类型(如xs:string、xs:integer)、节点类型及可含节点与原子值的有序序列,克服XPath 1.0节点集仅支持无序去重节点的局限。

XPath 2.0在数据类型方面相比1.0有了显著增强,最核心的变化是引入了基于XML Schema的类型系统,并将原本简单的“节点集”扩展为更通用的“序列”(sequence)。

XPath 2.0引入的主要数据类型

XPath 2.0支持丰富的数据类型,主要包括:

  • 原子类型(Atomic Types):包括xs:stringxs:integerxs:booleanxs:decimalxs:floatxs:doublexs:datexs:timexs:dateTime等,这些类型源自XML Schema定义。
  • 节点类型(Node Types):与XPath 1.0类似,包括元素、属性、文本节点、处理指令、注释和文档节点,但它们现在可以与其他值统一处理。
  • 任意序列(Sequence):这是XPath 2.0的核心概念,表示零个或多个项(item)的有序集合,每个项可以是原子值或节点。

与XPath 1.0节点集的关键区别

XPath 1.0中的结果只能是“节点集”(node-set),它有以下限制:

  • 只能包含节点,且不能重复,无序。
  • 不支持原子值(如字符串、数字)作为第一类数据参与表达式运算。
  • 无法表示空结果以外的标量值或混合类型数据。

而XPath 2.0使用“序列”替代节点集,带来以下改进:

  • 序列可以包含任意类型的项,包括节点和原子值,甚至混合存在。
  • 序列是有序的,相同节点可重复出现。
  • 支持空序列(empty sequence),统一处理无结果的情况。
  • 支持函数返回非节点数据,例如string-length('//title')直接返回整数序列。

基本上就这些。XPath 2.0的类型系统更强大、更一致,使得表达式能处理更复杂的逻辑,也为XSLT 2.0和XQuery提供了坚实基础。虽然学习曲线略升,但灵活性和表达能力大幅提升。