C#怎么进行正则表达式匹配 C# Regex类使用方法

C#正则表达式主要通过Regex类实现,涵盖IsMatch(判断匹配)、Match/Matches(提取内容)、Replace/ Split(替换与分割),高频使用时应预编译实例以优化性能。

在C#中,正则表达式匹配主要通过 System.Text.RegularExpressions 命名空间下的 Regex 类完成。它支持编译、匹配、替换、分割等常见操作,是处理文本模式的高效工具。

基础匹配:用 Regex.IsMatch 判断是否符合模式

最常用的是检查字符串是否匹配某规则,比如验证邮箱、手机号、密码强度等。

  • Regex.IsMatch(input, pattern) 返回 bool,适合简单判断
  • 可选传入 RegexOptions(如 IgnoreCaseSingleline)增强灵活性
  • 示例:检查是否为6–12位字母数字组合

bool isValid = Regex.IsMatch("abc123", @"^[a-zA-Z0-9]{6,12}$"); // true

提取内容:用 Regex.Match 或 Matches 获取匹配结果

当需要获取具体匹配到的文本或分组时,用 MatchMatchCollection

  • Regex.Match(input, pattern) 返回第一个匹配项(Match 对象)
  • Regex.Matches(input, pattern) 返回所有匹配(MatchCollection
  • 每个 Match.Value 是完整匹配内容,.Groups[i].Value 可取捕获组
  • 示例:从日志中提取时间戳和错误码

string log = "[2025-05-20 14:22:03] ERROR 500";
Match m = R

egex.Match(log, @"\[(\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2})\] (\w+) (\d+)");
if (m.Success) {
  string time = m.Groups[1].Value; // "2025-05-20 14:22:03"
  string level = m.Groups[2].Value; // "ERROR"
  string code = m.Groups[3].Value; // "500"
}

替换与分割:用 Replace 和 Split 快速处理文本

正则不只是“找”,还能“改”和“切”。

  • Regex.Replace(input, pattern, replacement) 支持字符串或委托(MatchEvaluator)动态生成替换内容
  • Regex.Split(input, pattern) 按模式切分,比 string.Split 更灵活(例如按多个空格/制表符/换行统一拆分)
  • 注意:如果 pattern 包含捕获组,Split 默认会把分隔符也保留在结果中(可用 RegexOptions.ExplicitCapture 控制)

// 把连续空白替换成单个空格
string cleaned = Regex.Replace("a   b\t\tc\n\n", @"\s+", " "); // "a b c"

性能优化:推荐预编译 Regex 实例(尤其高频调用)

频繁使用同一正则时,每次都用静态方法(如 Regex.IsMatch)会重复编译,影响性能。

  • new Regex(pattern, options) 创建实例并复用(线程安全,可多线程共享)
  • 也可用 RegexOptions.Compiled 编译为IL代码(启动慢但运行快),适用于长期运行、匹配极多的场景
  • 小提示:.NET 5+ 中静态方法内部已做轻量缓存,简单场景不必强求实例化

private static readonly Regex EmailRegex = new(@"^[^\s@]+@[^\s@]+\.[^\s@]+$", RegexOptions.Compiled);
bool ok = EmailRegex.IsMatch(userInput);

基本上就这些。掌握 IsMatchMatchReplace 和复用实例四个要点,就能覆盖大多数 C# 正则需求。不复杂但容易忽略编译开销和分组索引——写之前多看一眼文档里的 Groups[0] 是整个匹配,Groups[1] 才是第一个括号内容。