zoukankan      html  css  js  c++  java
  • java正则表达式

    参考http://blog.csdn.net/telnetor/article/details/6041323

    http://www.runoob.com/java/java-regular-expressions.html

    String str = ",.!,,D_NAME。!;‘’”“**dfs  #$%^&()-+1431221""中           国123漢字かどうかのjavaを決定";
    str = str.replaceAll("[\pP\pS\pZ]", "");
    System.out.println(str);
    DNAMEdfs1431221中国123漢字かどうかのjavaを

    Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。 
    /pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。

    P:标点字符 
    L:字母; 
    M:标记符号(一般不会单独出现); 
    Z:分隔符(比如空格、换行等); 
    S:符号(比如数学符号、货币符号等); 
    N:数字(比如阿拉伯数字、罗马数字等); 
    C:其他字符

    1.  /**清除数字和空格*/  
    2.     public static  String cleanBlankOrDigit(String str){  
    3.         if(isBlankOrNull(str))return "null";  
    4.         return Pattern.compile("\d|\s").matcher(str).replaceAll("");  
    5.     }  
    6.   

    public static final String REG_SPACE_PUNCTUATION = "(\s)|(\pP)";
    List<News> news = newsDao.findNewsByComsOrInds(query);
    // 所有的标点符号空格用空字符串替换后 再进行去重
    TreeSet<News> newSet = new TreeSet<>((o1, o2) -> o1.getTitle().replaceAll(REG_SPACE_PUNCTUATION, "").compareTo(o2.getTitle().replaceAll(REG_SPACE_PUNCTUATION, "")));
    newSet.addAll(news);
    news = new ArrayList<>(newSet);

    java里面\s就是空格, \pP代表标点符号。 !"#$%&'()*+,-./:;<=>?@[]^_`{|}~
    /pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
    第一个 是转义字符
    用在上面的replaceAll 方法中 写第一个 就代表匹配正则表达式了



  • 相关阅读:
    HDU1058Humble Numbers(DP)
    HDU1285确定比赛名次(拓扑排序)
    HDU2602Bone Collector(DP,0/1背包)
    HDU1869六度分离(最短路floyd)
    HDU3342Legal or Not(拓扑)
    Dijkstra不能得到含有负权边图的单源最短路径
    HDU1069Monkey and Banana(DP)
    HDU1176免费馅饼(DP)
    DAG上的动态规划
    网络分析中数据包结构的定义
  • 原文地址:https://www.cnblogs.com/xiaolei2017/p/8028996.html
Copyright © 2011-2022 走看看