zoukankan      html  css  js  c++  java
  • javaee正则表达式基础和常用表达式

    正则基础:

    字符集

    [ ] : 代表单个字符。

    [^] : 除了该字符外的所有单个字符。

    [a-zA-Z] : [a-z] || [A-Z]。

    [a-d[m-p]] :[a, d] || [m, p] 并集关系。

    [a-z&&[def]] :交集 {“d”, “e”, “f”}。

    [a-z&&[^bc]] :a-z && [^bc],a-z 除去 bc。

    [a-z&&[^m-p]] :a-z 中除了 m-p。

    预定义字符集
     . :任意字符。
     d :[0-9] 单个数字字符。
        d 代表转义字符,如果想表示 d 的话,需要 d。
     D :[^0-9] 除了数字外的单个字符。
     s :[ x0Bf ] 空白字符。
     S :[^s] 非空白字符。
     w :[a-zA-Z_0-9] 单词字符。
      下划线也属于单词字符。
     W :[^w] 非单词字符。
    数量词
    X? :出现 1 次 或 1 次也没有(不能出现其他)。
    X* :出现 0 次 或 更多次。
    X+ :出现 1 次 或 多次,不包括 0 次。
    X{n} :出现恰好 n 次。
    X{n,} :出现至少 n 次。
    X{n,m} :出现 [n, m] 次,包含 n 也包含 m。
    分割功能
    public String[] split(String regex)

    概述:字符串分割方法,将给定字符串中,两端都符合正则表达式的字符串拆分出来。特别的,这个匹配的字符串不会出现在返回的字符数组中。

    案例:我们有一个已知的字符串,其中包含了多个名字,并且每个名字中间都用 , 分隔,我们想要获取每个名字,此时可以借助正则表达式来完成。

    复制代码
    String str = "Sawyer,Jerry,Tom";
    String[] arr_str = str.split("\\,”);
    System.out.println(Arrays.toString(arr_str));
    //这里的正则表达式需要写成 \\, ,表示是正则表达式的 \,如果写成 \, 则代表的是字符中的转义字符。
    复制代码

    替换功能

    • public String replaceAll(String regex, String replacement)
    • 正则表达式替换功能。
      复制代码
      String str1 = “I123 Love432 Sa324wyer!”;    // 去掉数字
      // 任意数字,使用 + 可以匹配多位数字,减少 replace 次数,提高性能。
      String reget = “\d+”;
      String str2 = str1.replaceAll(reget, “”);
      System.out.println(str2);
      复制代码
    • 这里我们借助 String 中的另一个方法 replaceAll() 方法将字符串中的所有数字替换为空字符串。特别的,这里的正则表达式中使用了 + 来匹配出现 1 次或多次的数字,也就是将一组连续的数字一次替换掉,而不需要每次只替换掉一个数字,提高性能。
    • java正则表达式相关类

      1) Pattern : 生成相关正则表达式规则引擎

      2)Matcher : 正则表达式解析引擎

      看下Pattern、Mather的使用

      结果 :

      【商家】

      【时间】

      【金额】

      【URL】

      Matcher 的构造函数是私有,只能通过 Pattern.matcher获取对象。

      Mathcer 主要有matches、 find、lookingAt

      matches 方法 需要匹配到所有字符串才返回true、否则返回false
      复制代码

      private static void testMatches() { String regex = "\d+"; System.out.println(Pattern.matches(regex, "123")); // true System.out.println(Pattern.matches(regex, "123abc123"));//false System.out.println(Pattern.matches(regex, "123abc"));//false }
      复制代码
      lookingAt 方法 匹配最前面的字符串,匹配到的字符串的位置必须在最前面,才返回true、否则返回false
      复制代码
          private static void testLookingAt() {
              String str = "123aa";
              String regex = "\d+";
              
              Pattern p = Pattern.compile(regex);
              Matcher m = p.matcher(str);
              
              System.out.println(m.lookingAt());//true
              
              str = "aa123";
              m = p.matcher(str);
              System.out.println(m.lookingAt());//false
          }
      复制代码
      find 方法 匹配到字符串可以在任意位置,如果匹配到了返回true、否则返回false
      复制代码
    •     private static void testFind() {
              String str = "123aa";
              String regex = "\d+";
              
              Pattern p = Pattern.compile(regex);
              Matcher m = p.matcher(str);
              
              System.out.println(m.find());//true
              
              str = "aa123";
              m = p.matcher(str);
              System.out.println(m.find());//true
              
              str = "aa";
              m = p.matcher(str);
              System.out.println(m.find());//false
          }

    常用表达式:

    1、校验密码强度

      ●密码的强度必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-16之间

    ^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,16}$

    2、校验中文

      ●字符串只能是中文

    ^[\u4e00-\u9fa5]{0,}$

    3、由数字,26个英文字母或下划线组成的字符串

    ^\w+$

    4、校验E-Mail 地址

    [\w!#%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?

    5、校验身份证号码

      ●15位:

    ^[1-9]\d{7}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}$

      ●18位 :

    ^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{3}([0-9]|X)$

    6.校验日期

      ●“yyyy-mm-dd“ 格式的日期校验,已考虑平闰年

    ^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

    7、校验金额

      ●金额校验,精确到2位小数

    ^[0-9]+(.[0-9]{2})?$

    8、校验手机号

      ●下面是国内 13、15、18开头的手机号正则表达式

    ^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$

    9、判断IE的版本

    ^.*MSIE [5-8](?:\.[0-9]+)?(?!.*Trident\/[5-9]\.0).*$

    10、校验IP-v4地址

    \b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b 

    11、校验IP-v6地址

    复制代码
    复制代码
    (([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:)
    {1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]
    {1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4})
    {1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4})
    {1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4})
    {1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4})
    {1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4})
    {1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4})
    {0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:)
    {0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.)
    {3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:)
    {1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.)
    {3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))
    复制代码
    复制代码

    12、检查URL的前缀

    if (!s.match(/^[a-zA-Z]+:\/\//)){   s = 'http://' + s;}

    13、提取URL链接

    ^(f|ht){1}(tp|tps):\/\/([\w-]+\.)+[\w-]+(\/[\w- ./?%&=]*)?

    14、文件路径及扩展名校验

    ^([a-zA-Z]\:|\\)\\([^\\]+\\)*[^\/:*?"<>|]+\.txt(l)?$

    15、提取Color Hex  Codes

    ^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$

    16、提取网页图片

    \< *[img][^\\>]*[src] *= *[\"\']{0,1}([^\"\'\ >]*)

    17、提取页面超链接

    (<a\s*(?!.*\brel=)[^>]*)(href="https?:\/\/)((?!(?:(?:www\.)?'.implode('|(?:www\.)?', $follow_list).'))[^"]+)"((?!.*\brel=)[^>]*)(?:[^>]*)>
    
    
    
    
  • 相关阅读:
    [洛谷P2523] HAOI2011 Problem c
    [CF156D] Clues
    [洛谷P4769] NOI2018 冒泡排序
    [CF605E] Intergalaxy Trips
    [洛谷P4492] HAOI2018 苹果树
    [洛谷P3349] ZJOI2016 小星星
    [洛谷P4336] SHOI2016 黑暗前的幻想乡
    [洛谷P5364] SNOI2017 礼物
    [洛谷P2606] ZJOI2010 排列计数
    [洛谷P6078] CEOI2004 candy
  • 原文地址:https://www.cnblogs.com/wdyaoyao/p/10711723.html
Copyright © 2011-2022 走看看