如何使用正则表达式简洁处理一篇文章中出现的若干敏感词汇,将出现的敏感词汇使用下划线连接?
敏感词汇可能有多组,每组出现的次数也是随机的。
比如这样一篇文章
博客园有很多好的博文。
假设敏感词汇博客园、博客。
处理之后
博_客_园有很多好的博_文。
正则表达式为我们提供了便捷的方法。
Regex.Replace(input, rules,new MatchEvaluator(delegate(Match m){ if (string.IsNullOrEmpty(m.Value) || m.Value.ToCharArray().Length == 0) return string.Empty; return string.Join("_", m.Value.ToCharArray()); }));
第一个参数是检索的文章。
第二个参数是匹配规则,同时支持多种查找,中间使用|。如博客园|文章。
第三个是一个自定义方法,用于处理匹配到数据。
在上例中,rules:博客园|文章
delegate会执行两次。第一次匹配到的是博客园,第二次是文章。