XML CDATA是什么 CDATA区块使用方法与场景

CDATA是XML中用于包裹不被解析的原始文本的标记,以结尾,中间内容原样保留;适用于SQL、HTML、JavaScript等含敏感字符的场景,但不可嵌套且不能包含]]>。

CDATA 是 XML 中用来包裹“不希望被解析的原始文本”的特殊标记。它的核心作用就一个:让解析器跳过其中内容,原样保留,不作任何语法处理。

CDATA 的基本写法

格式固定,必须严格遵守:

  • 开头(注意:左方括号前是感叹号,无空格)
  • 中间放任意文本,包括 >&、双引号等 XML 敏感字符
  • ]]> 结尾(三个字符紧连,不能有空格或换行)

例如:

为什么需要 CDATA

XML 解析器默认会把所有文本当作“可解析内容”处理。一旦遇到 就可能误判为新标签开始,& 可能被当成实体引用开头,导致报错或数据截断。CDATA 就是给这类“危险内容”划出安全区。

常见触发场景包括:

  • SQL 语句里含 >= 等比较符(如 MyBatis 的 XML 映射文件)
  • 内嵌 HTML 片段,比如富文本字段:欢迎加粗]]>
  • CSS 或 JavaScript 代码块,避免样式/逻辑被 XML 解析干扰
  • 日志、错误信息、用户输入等含不可控字符的纯文本

使用时要注意的关键细节

看似简单,但几个硬性限制常被忽略:

  • 不能嵌套:CDATA 区块内部不能再出现 ]]>
  • 结尾字符串不能拆分]]> 必须连续出现,中间加空格、换行或注释都会导致解析失败
  • 不解决所有问题:如果整个元素本身被动态标签(如 MyBatis 的 )包裹,再套 CDATA 反而会让 XML 解析器跳过条件逻辑——CDTA 只保护它直接包裹的内容
  • 范围尽量小:只把真正含特殊字符的部分放进 CDATA,不要整段内容都包,否则可能掩盖结构问题

CDATA 和转义字符怎么选

两者都能解决特殊字符问题,但策略不同:

  • 少量字符(比如单个 &)用转义更轻量:&zuojiankuohaophpcn
  • 大段内容、含多处敏感符号、或需保持可读性(如代码、HTML)时,CDATA 更清晰可靠
  • 如果内容由程序生成且无法预知是否含 ]]>,要先做清理或改用转义,因为 CDATA 内出现 ]]> 会提前终止区块

基本上就这些。用对地方,CDATA 是 XML 里很安静又很管用的一个小工具。