zoukankan      html  css  js  c++  java
  • PERL学习笔记---正则表达式的应用

     使用m//匹配

    //这是m//(模式匹配)的一种简写。同qw//操作一样,可以使用任何
    成对的分隔符。因此,可以使用m(fred), m<fred>, m{fred}, m[fred],或者m,fred,, m!fred!, m^fred^,其它非成对的分隔符也
    可以

    不区分大小写:/i

    if(/yes/i) {#大小写无关

    print “In that case, I recommend that you go bowling. ”;
    }

    匹配任何字符:/s

    默认情况下,点(.)不匹配换行符,这对于“单行中查找”的问题能很好解决。如果你的字符串中有换行符,并希望点(.)能匹
    配它们,那可以使用/s 这个修饰符。它将模式中点(.)◆的行为变成同字符类[dD]的行为类似:可以匹配任何字符,包括换
    行符。从下例中可见其区别:
    ◆如果你想改变其中的一部分,但不是全部,那可以将此部分用[dD]代替

    $_ = “I saw Barney down at the bowing alley with Fred last night. ”;
    if(/Barney.*Fred/s){
    print “That string mentions Fred after Barney! ”;
    }
    如果不使用/s,那么上述模式将不能被匹配上,因为这两个字符不在同一行中。

    符号^(脱字字符◆)表示在字符串的开头进行匹配,而符号$则表示在结尾◆。因此,模式/^fred/只匹配字符串的开头部分;
    它不会匹配上manfred man。而/rock$/只在结尾处匹配;其不会匹配上knute rockne。

    锚定不仅仅针对字符串的两头。词界锚定,,是针对单词使用的。如/fred/可以匹配上单词fred,但不能匹配frederick,
    alfred, man fred mann。这同字处理软件中的“全字匹配(match whole words only)”是类似的。
    ◆某些正则表达式实现中开头的锚定和结尾锚定不同,但Perl 中均使用。
    这些单词(words)不是你或者我通常认为的那样;它们是w 类型,由通常的字母,数字,下划线组成。 将从开头或结尾
    匹配这些w 类型的字符。

    非词界锚定为B。它将在任何非 匹配的点上进行匹配。因此,模式/searchB/将匹配searches, searching, searched, 但不能
    匹配search,或者researching。

    绑定操作符(binding operator:=~)

    ),$likes_perl 将根据用户的输入而得到一个boolean 值。它有一些quick-and-ditry,因为输入
    行很快就被丢弃了。这段代码将读入一行,由右边的模式进行匹配,然后丢弃此输入◆。它没有使用$_。
    ◆输入的字符不会自动存储在$_中,除非行输入操作(<STDIN>)单独出现在while 循环的条件判断部分。
    print “Do you like Perl? ”;
    my $likes_perl = (<STDIN> =~ /yes/i);
    … #Times passes…
    if($likes_perl){
    print “You said earlier that you like Perl, So… ”;

    }
    由于绑定操作有非常高的优先级,因此,模式测试部分的括号不是必需的,下面的代码和上面代码的含义是一样的。它将
    测试部分的结果(而非行输入)返回给变量$likes_perl:
    my $likes_perl = <STDIN> =~ /yes/i;

    其含义是:“这个模式默认将对
    $_进行匹配,但此时将对左边的字符串进行匹配”。如果没有绑定操作符,则此表达式将对$_匹配。

    匹配变量
    我们曾经在模式中使用过括号,使用括号是由于它可以将模式的某一部分组合起来。同时括号也会引起正则表达式分配新
    的内存块。这些内存含有括号中的模式所匹配的字符串。如果有不止一对括号,那就不止一块内存块。每一个内存块内有
    一段字符串,而非模式的一部分。
    由于这些变量含有字符串,那它们是标量变量;在Perl 中,它们具有像$1, $2 这样的名字。变量个数同模式中括号对数的个
    数是相同的。如$4 是指第四对括号所匹配的字符串◆。
    ◆这和后引用(backreference)4 在模式匹配中引用字符的字符串相同。但它们不仅是同一事物的两个不同名字;4 是模式正在匹配是引
    用的;而$4 是模式匹配完成后再引用的。想了解更多的关于backreferences 的信息,可参见perlre 的帮助手册。
    这些匹配变量(match variables)是组成正则表达式强大功能的重要部分,它允许取出相应的字符串:
    $_ = “Hello there, neighbor”;
    if(/s(w+),/){ #空格和逗号之间的词
    print “the word was $1 ”; #the word was there
    }
    也可以一次使用多个:
    $_ = “Hello there, neighbor”;
    if(/(S+) (S+), (S+)/){
    print “words were $1 $2 $3”;
    }

    其输出为words were Hello there neighbor。注意输出中没有逗号。因为第二块内存中没有逗号。使用这种技术,可以选择
    我们感兴趣的部分。

    匹配变量可能是空的◆,如果其没有被匹配上。也就是说,匹配变量的值可能为空串:
    ◆这和undefined 是不同的。如果模式中只有3 个或者更少的括号,那$4 为undef。
    my $dino = "I fear that I'll be extinct after 1000 years.";
    if ($dino =~ /(d*) years/) {
    print "That said '$1' years. "; # 1000
    }
    my $dino = "I fear that I'll be extinct after a few millions years.";
    if ($dino =~ /(d*) years/) {
    print "That said '$1' years. "; # 空串
    }

     自动匹配变量

    if(“Hello there, neigbor”=~ /S(w+),/){
    print “That actually matched ‘$&’. ”;
    }
    匹配的部分是“there,”(空格,单词,和一个逗号)。变量$1 中的值为there,而$&为整个被匹配的部分。
    匹配部分的前一部分存放在$`之中,后一部分被存到$'。另一种说法是,$`中含有正则表达式引擎在匹配成功前所找到的变
    量,而$'为此模式还没有匹配的剩余部分。如果将这三个变量放在一起,你将得到原始字符串:
    if (“Hello there, neighbor”=~ /S(w+),/){
    pirnt “That was ($`)($&)($’)”;
    }

    输出的消息为(Hello)( there,)( neighbor),为这三个自动匹配变量的值。三个变量的值可能是空的,和之前数字匹配变量的例
    子一样。它们和数字匹配变量有相同的作用域。通常,在下次成功匹配前其值不变。

  • 相关阅读:
    Mybatis配置数据库连接
    C# 解决httplistener querystring 中文乱码、返回json中文格式乱码
    C# Base64加解密、MD5加密
    C# 获取时间戳并从10进制时间戳转换成16进制byte数组
    win10删除文件夹需要Administrator权限
    WordPress所有页面404 分类页面导航也找不到文章
    Maven配置阿里云镜像
    Hexo部署GitHub Pages
    Linux常用命令集合
    jmeter性能测试入门使用参数化
  • 原文地址:https://www.cnblogs.com/yuan1225/p/3782068.html
Copyright © 2011-2022 走看看