C++如何使用正则表达式?(std::regex示例)

C++11起标准库提供std::regex支持模式匹配、查找与替换,但部分编译器实现不完整;regex_match要求全串匹配,regex_search用于子串查找,regex_replace支持捕获组引用;需注意转义、异常及性能。

从 C++11 开始,标准库提供了 std::regex(定义在 头文件中),可用于模式匹配、查找、替换等操作。它语法接近 Perl 风格(ECMAScript 默认),但功能比 Boost.Regex 简化,且部分编译器(如早期 MSVC 或某些 libstdc++ 版本)实现不完整或性能较差,使用前建议确认标准库支持情况。

基本匹配:判断字符串是否符合模式

std::regex_match 检查整个字符串是否完全匹配正则表达式:

#include 
#include 
#include 

int main() {
    std::string s = "123-456-7890";
    std::regex pattern(R"(\d{3}-\d{3}-\d{4})"); // 匹配电话格式

    if (std::regex_match(s, pattern)) {
        std::cout << "格式正确\n";
    }
}

注意:regex_match 要求**全串匹配**;若只需子串匹配,应改用 regex_search

查找子串:提取所有匹配内容

std::regex_search 可在字符串中查找第一个匹配;配合迭代器和 std::sregex_iterator 可遍历全部匹配:

  • 单次查找:传入 std::smatch 获取捕获组和位置信息
  • 批量提取:用 std::sregex_iterator 遍历所有匹配项

示例:提取所有邮箱地址

std::string text = "联系我:a@b.com 或 x.y@domain.org";
std::regex email_pat(R"(\b[A-Za-z0-9._%+-]+@[

A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b)"); auto begin = std::sregex_iterator(text.begin(), text.end(), email_pat); auto end = std::sregex_iterator(); for (auto it = begin; it != end; ++it) { std::cout << "找到邮箱:" << it->str() << "\n"; }

替换文本:简单替换与带捕获组的重构

std::regex_replace 返回替换后的新字符串(原字符串不变):

  • 直接替换:将所有匹配替换为固定字符串
  • 引用捕获组:用 $1$2 表示第 1、2 个括号内的内容

示例:把日期格式 YYYY-MM-DD 转成 DD/MM/YYYY

std::string date = "2025-12-25";
std::regex date_pat(R"((\d{4})-(\d{2})-(\d{2}))");
std::string result = std::regex_replace(date, date_pat, "$3/$2/$1");
// result == "25/12/2025"

常见注意事项与建议

正则在 C++ 中易出错,需特别留意:

  • 转义字符要双重处理:C++ 字符串字面量中反斜杠需写为 \\,或使用原始字符串字面量(如 R"(\d+)")避免干扰
  • 异常安全:正则构造或匹配失败会抛出 std::regex_error,建议用 try/catch 包裹
  • 性能考虑:频繁使用的正则应提前构造好 std::regex 对象并复用,避免重复编译
  • 兼容性提醒:GCC 4.9+、Clang 3.5+、MSVC 2015+ 支持较完整;旧版本可能缺少 regex_replace 或 ECMAScript 功能

实际项目中若需更强大、稳定或跨平台的正则能力,可考虑 Boost.Regex 或 PCRE2 绑定,但对简单验证和解析,std::regex 已足够轻量可用。