zoukankan      html  css  js  c++  java
  • DELPHI正则表达式

    DELPHI正则表达式

    1)下载源码

    官方网站: http://www.regular-expressions.info/delphi.html
        直接下载: http://www.regular-expressions.info/download/TPerlRegEx.zip   

    2)改编译开关

     pcre.pas 文件,到 {$DEFINE PCRE_LINKDLL} ,把它注释掉,即改为 //{$DEFINE PCRE_LINKDLL} 。注意:这点非常重要,如果不这样改的话,在软件开发完成后,

    分发到其他电脑上的时候,软件就会提示“缺少pcre3.dll错误”。这样修改的原因,是把正则直接封包到 exe 文件里,而不需要链接 pcre3.dll 了;封包进 exe,

    付出的代价是软件增大了 100KB 左右的大小,当然比起必须携带 pcre3.dll来说,这是有意义的付出。

    3)代码演示

    //查找是否存在
    var
      reg: TPerlRegEx;
    begin
      reg := TPerlRegEx.Create(nil);
      reg.Subject := 'CodeGear Delphi 2007 for Win32';
      reg.RegEx   := 'd';
      if reg.Match then
        ShowMessage('找到了')
      else
        ShowMessage('没找到');
      FreeAndNil(reg);
    end;
    

      

    //替换一般字符串
    var
    reg: TPerlRegEx;
    begin
    reg := TPerlRegEx.Create(nil);
    reg.Subject := '我爱DELPHI, 但Delphi不爱我!';
    reg.RegEx   := 'Delphi';
    reg.Replacement := '◆';
    reg.ReplaceAll;
    ShowMessage(reg.Subject); //返回: 我爱DELPHI, 但◆不爱我!          
    FreeAndNil(reg);
    end;
    

      

    //分别显示找到的每一个和总数
    var
      reg: TPerlRegEx;
      num: Integer; //用 num 来计数
    begin
      reg := TPerlRegEx.Create(nil);  
    reg.Subject := 'CodeGear Delphi 2007 for Win32'; reg.RegEx := 'd';
    num := 0; while reg.MatchAgain do //MatchAgain 是下一个 begin ShowMessage(reg.MatchedExpression); //将分别显示: 2 0 0 7 3 2 Inc(num); end; ShowMessage(IntToStr(num)); //6 FreeAndNil(reg); end;
    //目标字符串的位置与长度
    var
      reg: TPerlRegEx;
    begin
      reg := TPerlRegEx.Create(nil);  reg.Subject := 'CodeGear Delphi 2007 for Win32';
      reg.RegEx   := 'Delphi';  while reg.MatchAgain do  //很明显: 本例只能找到一个结果
      begin
        ShowMessage(reg.MatchedExpression); //找到的字符串: Delphi
        ShowMessage(IntToStr(reg.MatchedExpressionOffset)); //它所在的位置: 10
        ShowMessage(IntToStr(reg.MatchedExpressionLength)); //它的长度: 6
      end;  FreeAndNil(reg);
    end;
    // Matchedexpression_r 与Subexpression_rs[0]
    var
    reg: TPerlRegEx;
    begin
    reg := TPerlRegEx.Create(nil);
    reg.Subject := 'CodeGear Delphi 2007';
    reg.RegEx   := 'Delphi';
    while reg.MatchAgain do
    begin
       ShowMessage(reg.Matchedexpression_r); //Delphi; 这是匹配到的内容
       ShowMessage(reg.Subexpression_rs[0]); //Delphi; 也可以这样显示匹配到的内容
    end;
    {
    Subexpression_rs 是一个数组:
    Subexpression_rs[1] 储存第 1 个表达式匹配的内容;
    Subexpression_rs[2] 储存第 2 个表达式匹配的内容;
    Subexpression_rs[n] 储存第 n 个表达式匹配的内容;
    Subexpression_rs[0] 储存整个表达式匹配的内容;
    Matchedexpression_r 表示的不过是 Subexpression_rs[0].
    }
    FreeAndNil(reg);
    end;
    //提取子表达式匹配到的内容
    var
    reg: TPerlRegEx;
    begin
    reg := TPerlRegEx.Create(nil);
    reg.Subject := 'abc A1111 BB222 CCC33 DDDD4';
    reg.RegEx   :='([A-D]+)([1-4]+)'; //这个表达式有两个子表达式构成
    while reg.MatchAgain do
    begin
       ShowMessage(reg.Subexpression_rs[0]); //将分别显示: A1111 BB222 CCC33DDDD4
       ShowMessage(reg.Subexpression_rs[1]); //将分别显示: A BB CCC DDDD
       ShowMessage(reg.Subexpression_rs[2]); //将分别显示: 1111 222 33 4
       {另外:
         reg.Subexpression_rCount     是子表达式的个数;
         reg.Subexpression_rLengths[n] 是第 n 个表达式返回的字符串的长度;
         reg.Subexpression_rOffsets[n] 是第 n 个表达式返回的字符串在源字符串中的位置
        }
    end;
    FreeAndNil(reg);
    end;
    //子表达式不能超过 MAX_SUBexpression_rS = 99 个, MAX_SUBexpression_rS 是TPerlRegEx 的内置常数.
    //设定搜索范围: Start、Stop
    var
    reg: TPerlRegEx;
    begin
    reg := TPerlRegEx.Create(nil);
    reg.Subject := 'ababab';
    reg.RegEx   := 'ab';
    reg.Replacement := '◆';
    reg.Start := 1;
    reg.Stop := 2;
    while reg.MatchAgain do
    begin
       reg.Replace;
    end;
    ShowMessage(reg.Subject); //返回: ◆abab
    
    reg.Subject := 'ababab';
    reg.Start := 3;
    reg.Stop := 4;
    while reg.MatchAgain do
    begin
       reg.Replace;
    end;
    ShowMessage(reg.Subject); //返回: ab◆ab
    
    reg.Subject := 'ababab';
    reg.Start := 5;
    reg.Stop := 6;
    while reg.MatchAgain do
    begin
       reg.Replace;
    end;
    ShowMessage(reg.Subject); //返回: abab◆
    FreeAndNil(reg);
    end;
    
    // Replace
    var
    reg: TPerlRegEx;
    begin
    reg := TPerlRegEx.Create(nil);
    reg.RegEx   := 'ab';
    reg.Replacement := '◆';
    reg.Subject := 'ababab';
    reg.ReplaceAll;
    ShowMessage(reg.Subject); //返回: ◆◆◆
    
    reg.Subject := 'ababab';
    //下面四行程序, 相当于 reg.ReplaceAll;
    while reg.MatchAgain do
    begin
       reg.Replace;
    end;
    ShowMessage(reg.Subject); //返回: ◆◆◆
    FreeAndNil(reg);
    end;
    {
    ReplaceAll 函数返回的是 Boolean;
    Replace 函数返回的是 Replacement 的值, 当然是不能赋值的, 它仅仅是返回值.
    }
    
    // Compile、Study
    var
    reg: TPerlRegEx;
    begin
    reg := TPerlRegEx.Create(nil);
    reg.RegEx   := 'ab';
    reg.Options := [preCaseLess];
    reg.Compile; {编译表达式}
    reg.Study; {Study 方法会检查是否编译, 如果没有编译则执行 Compile}
    reg.Replacement := '◆';
    reg.Subject := 'abAbaB';
    reg.ReplaceAll;
    ShowMessage(reg.Subject); {返回: ◆◆◆}
    FreeAndNil(reg);
    end;
    {
    编译表达式, 会加快执行速度、降低启动速度;
    如果表达式比较复杂而又多次执行, 应该先编译;
    编译内容包括表达式选项.
    }
    // EscapeRegExChars 函数可以自动为特殊字符加转义符号 
    var
    reg: TPerlRegEx;
    begin
    reg := TPerlRegEx.Create(nil);
    reg.Subject := 'C++Builer';
    reg.RegEx   :=reg.EscapeRegExChars('C+') + '{2}'; {相当于 'C+{2}'}
    reg.Replacement := '◆';
    reg.ReplaceAll;
    ShowMessage(reg.Subject); {返回: ◆Builer}
    FreeAndNil(reg);
    end;
    //字符串分割: Split
    var
    reg: TPerlRegEx;
    List: TStrings;
    begin
    List := TStringList.Create;
    reg := TPerlRegEx.Create(nil);
    reg.Subject := 'aaa,bbb,ccc,ddd';
    reg.RegEx   := ',';{这里可是运行相当复杂的分割符啊}
    reg.Split(List,MaxInt); {第一个参数读入的是 Subject; 第二个参数是分成多少份}
    { 输入一个最大整数, 表示能分多少就分多少}
    ShowMessage(List.Text);
    {返回:
        aaa
        bbb
        ccc
        ddd
    }
    FreeAndNil(reg);
    List.Free;
    end;
    DEMO:
    #!/usr/bin/perl
     
    use strict;
    use warnings;
     
    my @array;
    open(my $fh, "<", "file3")
      or die "Failed to open file: $!
    ";
    while(<$fh>) {
        chomp;
        push @array, $_;
    }
    close $fh;
     
    foreach my $line(@array)
    {
        if($line =~ /.*([0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]).*logged in((.*)).*/gi)
        {
           print $1,",", $2,"
    ";
        }
     
    }
    

      

      

  • 相关阅读:
    使用 Dockerfile 定制镜像
    UVA 10298 Power Strings 字符串的幂(KMP,最小循环节)
    UVA 11090 Going in Cycle!! 环平均权值(bellman-ford,spfa,二分)
    LeetCode Best Time to Buy and Sell Stock 买卖股票的最佳时机 (DP)
    LeetCode Number of Islands 岛的数量(DFS,BFS)
    LeetCode Triangle 三角形(最短路)
    LeetCode Swap Nodes in Pairs 交换结点对(单链表)
    LeetCode Find Minimum in Rotated Sorted Array 旋转序列找最小值(二分查找)
    HDU 5312 Sequence (规律题)
    LeetCode Letter Combinations of a Phone Number 电话号码组合
  • 原文地址:https://www.cnblogs.com/hnxxcxg/p/11074294.html
Copyright © 2011-2022 走看看