zoukankan      html  css  js  c++  java
  • java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍

    假如现在有一个需求,要你用Java语言来匹配出一个文本里面的所有(英文半角)标点符号,你会怎么写呢?我想大多数人应该是把这些符号都罗列出来,

    如:

    !"#$%&'()*+,-./:;<=>?@[]^_`{|}~

    但[!"#$%&'()*+,-./:;<=>?@[]^_`{|}~]这样写需要转义一下,

    结果为:

    [-!"#$%&'()*+,./:;<=>?@

     

    ^_`{|}~]

    然后写到java代码后,有需要转义一次,

    变为:

    [-!"\#\$%&'()*+,./:;<=>?@\[\\\]\^_`\{\|\}~]

    这样的代码,细思极恐。惊恐

    我们先来用java代码验证一下,这个长长的正则能不能用

    [java] view plain copy
     
     print?
    1. String str="1~2-6,C#,1+2=3;@qq.com2^3functon(){}";  
    2.         String regex="[-!"\#\$%&'()*+,./:;<=>?@\[\\\]\^_`\{\|\}~]";  
    3.         Matcher m=Pattern.compile(regex).matcher(str);  
    4.         while(m.find()){  
    5.             System.out.print(m.group());  
    6.         }  

    输出结果:

    ~-,#,+=;@.^(){}

    很欣慰,正则应该是没错的。但这样的正则看起来挺反胃的,那么有没有简洁的写法呢?答案是有的,可以利用POSIX字符类来实现,正则为:p{Punct}

    [java] view plain copy
     
     print?
    1. String str="1~2-6,C#,1+2=3;@qq.com2^3functon(){}";  
    2.         String regex="\p{Punct}";  
    3.         Matcher m=Pattern.compile(regex).matcher(str);  
    4.         while(m.find()){  
    5.             System.out.print(m.group());  
    6.         }  

    输出结果:

    ~-,#,+=;@.^(){}

    简直了,是不是对正则又燃起了希望之火大笑,这就是在恰当的时候用POSIX字符类的好处。虽然平时比较少运用POSIX字符类的写法,但在恰当的时机运用起来就会有一种一鸣惊人的感觉。

    那么我们来看看POSIX字符类有哪些:

    除了POSIX字符类之外,还有一个也知道提一下,那就是Unicode块和类别的类

  • 相关阅读:
    rxjs 学习实践笔记
    封装localStorage、sessionStorage设置,获取,移除方法
    Angular实现类似vuex状态管理功能、全局数据管理与同步更新
    关于RxJS 处理多个Http请求 串行与并行方法
    vue插件汇总
    vue使用videojs控制后台m3u8数据请求
    NPOI winform读取Excel
    //邮件发送:
    定时任务框架Quartz.net
    系统日志控件 Log4NET
  • 原文地址:https://www.cnblogs.com/ptqueen/p/7019084.html
Copyright © 2011-2022 走看看