zoukankan      html  css  js  c++  java
  • ruby正则表达

    1、Ruby中正则表达式的写法

    主要有三种

    • 在//之间,要进行转义
    • 在%r{}内,不用进行转义
    • Regexp.new()内,不用进行转义

    /mm/dd/,Regexp.new(“mm/dd”),%r{mm/dd}三者效果相同,实质都是新建了一个Regexp的类。

    2、匹配的两种方法

    • =~肯定匹配, !~否定匹配。=~表达式返回匹配到的位置索引,失败返回nil,符号左右内容可交换
    • regexp#match(str),返回MatchData,一个数组,从0开始,还有match.pre_match返回匹配前内容,match.post_match返回匹配后内容
    /cat/ =~ "dog and cat" 	#返回8
    mt = /cat/.match("bigcatcomes")
    "#{mt.pre_match}->#{mt[0]}<-#{mt.post_match}" #返回big->cat<-comes
    

    3、替换

    很多时候匹配是为了替换,Ruby中进行正则替换非常简单,两个方法即可搞定,sub()+gsub()。
    sub只替换第一次匹配,gsub(g:global)会替换所有的匹配,没有匹配到返回原字符串的copy

    str = "ABDADA"
    new_str = str.sub(/A/, "*") 	#返回"*BDADA"
    new_str2 = str.gsub(/A/, "*")	#返回"*BD*D*"
    

    如果想修改原始字符串用sub!()和gsub!(),没有匹配到返回nil。

    方法后面还可以跟block,对匹配的字符串进行操作

    a.gsub(/[aeiou]/) {|vowel| vowel.upcase } # => "qUIck brOwn fOx"
    

    4、分组匹配

    Ruby的分组匹配与其它语言差别不大,分组匹配表达式是对要进行分组的内容加()。
    对于匹配到的结果,可以用系统变量#$1,#$2…索引,也可用matchData数组来索引

    md = /(dd):(dd)(..)/.match("12:50am") # md为一个MatchData对象
    puts "Hour is #$1, minute #$2"
    puts "Hour is #{md[1]}, minute #{md[2]}"
    

    5、匹配所有

    regexp#match()只能匹配一次,如果想匹配所有要用regexp#scan()
    用法示例:

    "abcabcabz".scan(%r{abc}).each {|item| puts item} # 输出2行abc
    

    6、贪婪匹配vs懒惰匹配

    这两种匹配属于标准正则表达式内容,与Ruby没关,但新手如果不明白匹配时会发生莫名其妙的错误,所以特别总结一下。

    • 贪婪匹配:尽可能多匹配,正则默认是贪婪匹配。例子:a.*b它将会匹配最长的以a开始,以b结束的字符串。对于aabab的匹配结果是aabab。
    • 懒惰匹配:尽可能少匹配。例子:a.*?b对于aabab的匹配结果是aab和ab。

    一般是在原来表达式结尾加?就由贪婪匹配变成了懒惰匹配。常用的懒惰限定符有(去年最后的问题就是贪婪匹配):

    • ?重复任意次,但尽可能少重复
    • +?重复1次或更多次,但尽可能少重复
    • ??重复0次或1次,但尽可能少重复
    • {n,m}?重复n到m次,但尽可能少重复
    • {n,}?重复n次以上,但尽可能少重复
  • 相关阅读:
    转 linux设备模型(4)
    SQL convert
    SQL 中的 case when
    自己写的文本文件加密器
    [A3] 2D Airfoil Aerodynamic Analysis With Fluent & Gambit
    [A2]更快的使用你的键盘:AutoHotkey
    [A4]更快的使用你的键盘:AutoHotkey(2)
    开篇HOG提取训练检测+样本制作
    Flash调用Lua脚本: 五
    Sql Server全局变量 【转载】
  • 原文地址:https://www.cnblogs.com/qinyan20/p/3759812.html
Copyright © 2011-2022 走看看