zoukankan      html  css  js  c++  java
  • 正则匹配换行符、英文、非英文(比如中文)

    今天在Java中想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则: 
    (.*) 
    结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“ ”以外的所有字符。同时,手册上还有一句话:要匹配包括 ' ' 在内的任何字符,请使用像 '[. ]' 的模式。于是我将正则表达式的匹配规则修改如下: 
    ([. ]*),当然,如果是在java程序中直接写到话,需要改为([.\n]*) 
    结果再次运行程序,发现什么内容也取不到了。我百思不得其解,又将其修改为如下规则: 
    ([.| ]*) 以及 ([ .]*) 
    结果还是不行,什么内容都取不到。看来点符号和换行符卯上劲了~ 
    然后上网一查,虽然没有查出上述规则到底是什么地方出问题了,但是查出了一个解决办法,经过一试,果然可以匹配包括换行符在内的任意字符,以下为正确的正则表达式匹配规则: 
    ([sS]*) 
    同时,也可以用 “([dD]*)”、“([wW]*)” 来表示。 


    在文本文件里, 这个表达式可以匹配所有的英文 
    /[ -~]/ 
    这个表达式可以匹配所有的非英文(比如中文) 
    /[^ -~]/ 
    /是VI里用的. 你在editplus或程序里不需要/ 

  • 相关阅读:
    基于python检测端口是否在使用
    一行CMD命令kill(杀)掉你的进程
    Python 线程与进程
    Linux07 文件查找(locate、find )及特殊权限(SUID、SGID、Sticky)
    Linux06 vim文本编辑器的使用
    Linux04 shell编程1
    Linux03 重定向,管道,文件查找(grep)
    Linux02(目录、文件、用户、用户组管理)
    Linux01
    pytest装饰器
  • 原文地址:https://www.cnblogs.com/liujinyu/p/10894455.html
Copyright © 2011-2022 走看看