zoukankan      html  css  js  c++  java
  • C#正则表达式

    C#正则表达式

    一、简介

    正则表达式 是一种匹配输入文本的模式,.Net 框架提供了允许这种匹配的正则表达式引擎,模式由一个或多个字符、运算符和结构组成。下面列出了用于定义正则表达式的各种类别的常用字符、运算符和结构。

    字符转义:

    正则表达式中的反斜杠字符()指示其后跟的字符是特殊字符,或应按原义解释该字符。 

    转义字符描述模式匹配
    a 与报警 (bell) 符 u0007 匹配。 a "Warning!" + 'u0007' 中的 "u0007"
     在字符类中,与退格键 u0008 匹配。 []{3,} "" 中的 ""
    与制表符 u0009 匹配。 (w+) "Name Addr " 中的 "Name " 和 "Addr "
    与回车符 u000D 匹配。( 与换行符 不是等效的。) (w+) " Hello World." 中的 " Hello"
    v 与垂直制表符 u000B 匹配。 [v]{2,} "vvv" 中的 "vvv"
    f 与换页符 u000C 匹配。 [f]{2,} "fff" 中的 "fff"
    与换行符 u000A 匹配。 (w+) " Hello World." 中的 " Hello"
    e 与转义符 u001B 匹配。 e "x001B" 中的 "x001B"
    nnn 使用八进制表示形式指定一个字符(nnn 由二到三位数字组成)。 w40w "a bc d" 中的 "a b" 和 "c d"
    x nn 使用十六进制表示形式指定字符(nn 恰好由两位数字组成)。 wx20w "a bc d" 中的 "a b" 和 "c d"
    c X c x 匹配 X 或 x 指定的 ASCII 控件字符,其中 X 或 x 是控件字符的字母。 cC "x0003" 中的 "x0003" (Ctrl-C)
    u nnnn 使用十六进制表示形式匹配一个 Unicode 字符(由 nnnn 表示的四位数)。 wu0020w "a bc d" 中的 "a b" 和 "c d"
    在后面带有不识别的转义字符时,与该字符匹配。 d+[+-x*]d+d+[+-x*d+ "(2+2) * 3*9" 中的 "2+2" 和 "3*9"

     字符类:

    字符类与一组字符中的任何一个字符匹配。

    字符类描述模式匹配
    [character_group] 匹配 character_group 中的任何单个字符。 默认情况下,匹配区分大小写。 [mn] "mat" 中的 "m","moon" 中的 "m" 和 "n"
    [^character_group] 非:与不在 character_group 中的任何单个字符匹配。 默认情况下,character_group 中的字符区分大小写。 [^aei] "avail" 中的 "v" 和 "l"
    [ first - last ] 字符范围:与从 first 到 last 的范围中的任何单个字符匹配。 [b-d] [b-d]irds 可以匹配 Birds、 Cirds、 Dirds
    . 通配符:与除 之外的任何单个字符匹配。 
    若要匹配原意句点字符(. 或 u002E),您必须在该字符前面加上转义符 (.)。
    a.e "have" 中的 "ave", "mate" 中的 "ate"
    p{ name } 与 name 指定的 Unicode 通用类别或命名块中的任何单个字符匹配。 p{Lu} "City Lights" 中的 "C" 和 "L"
    P{ name } 与不在 name 指定的 Unicode 通用类别或命名块中的任何单个字符匹配。 P{Lu} "City" 中的 "i"、 "t" 和 "y"
    w 与任何单词字符匹配。 w "Room#1" 中的 "R"、 "o"、 "m" 和 "1"
    W 与任何非单词字符匹配。 W "Room#1" 中的 "#"
    s 与任何空白字符匹配。 ws "ID A1.3" 中的 "D "
    S 与任何非空白字符匹配。 sS "int __ctr" 中的 " _"
    d 与任何十进制数字匹配。 d "4 = IV" 中的 "4"
    D 匹配不是十进制数的任意字符。 D "4 = IV" 中的 " "、 "="、 " "、 "I" 和 "V"

    分组构造:

    分组构造描述了正则表达式的子表达式,通常用于捕获输入字符串的子字符串。

    分组构造描述模式匹配
    ( subexpression ) 捕获匹配的子表达式并将其分配到一个从零开始的序号中。 (w)1 "deep" 中的 "ee"
    (?< name >subexpression) 将匹配的子表达式捕获到一个命名组中。 (?< double>w)k< double> "deep" 中的 "ee"
    (?< name1 -name2 >subexpression) 定义平衡组定义。 (((?'Open'()[^()]*)+((?'Close-Open'))[^()]*)+)*(?(Open)(?!))$ "3+2^((1-3)*(3-1))" 中的 "((1-3)*(3-1))"
    (?: subexpression) 定义非捕获组。 Write(?:Line)? "Console.WriteLine()" 中的 "WriteLine"
    (?imnsx-imnsx:subexpression) 应用或禁用 subexpression 中指定的选项。 Ad{2}(?i:w+) "A12xl A12XL a12xl" 中的 "A12xl" 和 "A12XL"
    (?= subexpression) 零宽度正预测先行断言。 w+(?=.) "He is. The dog ran. The sun is out." 中的 "is"、 "ran" 和 "out"
    (?! subexpression) 零宽度负预测先行断言。 (?!un)w+ "unsure sure unity used" 中的 "sure" 和 "used"
    (?<=subexpression) 零宽度正回顾后发断言。 (?<=19)d{2} "1851 1999 1950 1905 2003" 中的 "99"、"50"和 "05"
    (?<! subexpression) 零宽度负回顾后发断言。 (?<!wo)man "Hi woman Hi man" 中的 "man"
    (?> subexpression) 非回溯(也称为"贪婪")子表达式。 [13579](?>A+B+) "1ABB 3ABBC 5AB 5AC" 中的 "1ABB"、 "3ABB" 和 "5AB"

    限定符
    限定符指定在输入字符串中必须存在上一个元素(可以是字符、组或字符类)的多少个实例才能出现匹配项。 限定符包括下表中列出的语言元素。 

    限定符描述模式匹配
    * 匹配上一个元素零次或多次。 d*.d ".0"、 "19.9"、 "219.9"
    + 匹配上一个元素一次或多次。 "be+" "been" 中的 "bee", "bent" 中的 "be"
    ? 匹配上一个元素零次或一次。 "rai?n" "ran"、 "rain"
    { n } 匹配上一个元素恰好 n 次。 ",d{3}" "1,043.6" 中的 ",043", "9,876,543,210" 中的 ",876"、 ",543" 和 ",210"
    { n ,} 匹配上一个元素至少 n 次。 "d{2,}" "166"、 "29"、 "1930"
    { n , m } 匹配上一个元素至少 n 次,但不多于 m 次。 "d{3,5}" "166", "17668", "193024" 中的 "19302"
    *? 匹配上一个元素零次或多次,但次数尽可能少。 d*?.d ".0"、 "19.9"、 "219.9"
    +? 匹配上一个元素一次或多次,但次数尽可能少。 "be+?" "been" 中的 "be", "bent" 中的 "be"
    ?? 匹配上一个元素零次或一次,但次数尽可能少。 "rai??n" "ran"、 "rain"
    { n }? 匹配前导元素恰好 n 次。 ",d{3}?" "1,043.6" 中的 ",043", "9,876,543,210" 中的 ",876"、 ",543" 和 ",210"
    { n ,}? 匹配上一个元素至少 n 次,但次数尽可能少。 "d{2,}?" "166"、 "29" 和 "1930"
    { n , m }? 匹配上一个元素的次数介于 n 和 m 之间,但次数尽可能少。 "d{3,5}?" "166", "17668", "193024" 中的 "193" 和 "024"

    二、代码

     static void Main(string[] args)
            {
                //判断是否包含a、b、c三个字符
                string str = Console.ReadLine();                //把用户输入的字符存入 str
                string regex = @"[abc]";                          //C#中 加@"[abc]" 为正则表达式基本写法
                bool isMatch = Regex.IsMatch(str, regex);         //比较: IsMatch(需要判断的字符,正则):返回bool值 
                Console.WriteLine(isMatch ? "Match [abc]" : "not Match[abc]"); //输出结果
                Console.WriteLine();
            }
    是否包含a、b、c
      static void Main(string[] args)
            {
                StringBuilder s = new StringBuilder("www.baidu.com", 50); //声明一个字符串,容量50
    
                //news=正则类.替换字符串(需要处理的字符串,正则,添加的字符串)—— 把符合正则情况的位置,替换为 后边字符串
                //替换开头
                string news = Regex.Replace(s.ToString(), "^", "网址:"); //^ :代表开头
                Console.WriteLine(news);                               //输出
    
                //替换结尾
                news = Regex.Replace(s.ToString(), "$", "结尾"); //$:代表结尾
                Console.WriteLine(news);
                Console.ReadLine();
            }
    替换正则开头或结尾
     static void Main(string[] args)
            {
                string s = Console.ReadLine();           //s接收用户输入
                string regex = @"^W*$";                 //正则:以任意除字母、下划线、数字以外的字符开头和结尾的
                bool isMatch = Regex.IsMatch(s, regex);  //匹配用户输入,是否满足正则条件
                Console.WriteLine(isMatch ? "满足" : "不满足"); //三目运算
                Console.WriteLine();
            }
    匹配以任意除字母、下划线、数字以外的字符开头和结尾的
      static void Main(string[] args)
            {
                string s = "abcdef";
                string regex = @"[^bde]";                    //[^bde]代表了除 b、d、e之外的所有字符,任意一个字符
                string newReplace = Regex.Replace(s, regex, "1"); //匹配 s 中,除了bde之外的字符,替换为 1
                Console.WriteLine(newReplace);
                Console.WriteLine();
            }
    替换字符
     static void Main(string[] args)
            {
                string qq = Console.ReadLine();       //等待用户输入
                string regex = @"^d{5,11}$";         //正则:开头结尾都是数字,并且5-11位都为数字
                bool isqq = Regex.IsMatch(qq, regex); //判断并返回布尔值
                Console.WriteLine(isqq ? "是QQ号" : "不是QQ号"); //三目运算
                Console.WriteLine();
            }
    匹配QQ号
    static void Main(string[] args)
            {
                string regex = @"^((([1]?dd?|2[0-4]d|25[0-5]).){3}([1]?dd?|2[0-4]d|25[0-5]))$"; //判断IP地址是否合规
                while (true)
                {
                    string s = Console.ReadLine();                 //等待用户输入
                    bool isMatch = Regex.IsMatch(s, regex);        //验证ip是否合法
                    Console.WriteLine(isMatch ? "是IP地址" : "不是IP地址"); //三目运算
                }
            }
    验证IP地址

    技术的发展日新月异,随着时间推移,无法保证本博客所有内容的正确性。如有误导,请大家见谅,欢迎评论区指正!
    我创建了一个.NET开发交流群,用于分享学习心得和讨论相关技术难题。欢迎有兴趣的小伙伴扫码入群,相互学习!

  • 相关阅读:
    Hive优化(转)
    hive--UDF、UDAF
    Java学习-Overload和Override的区别
    Java学习-集合(转)
    Hbase实例
    Java学习-数组
    Hadoop中两表JOIN的处理方法(转)
    Hive优化(转)
    Java学习--final与static
    Java学习--String、StringBuffer与StringBuilder
  • 原文地址:https://www.cnblogs.com/wml-it/p/14844099.html
Copyright © 2011-2022 走看看