小结：PHP 正则表达式常用函数PCRE模式篇

zoukankan html css js c++ java

小结：PHP 正则表达式常用函数PCRE模式篇
附注：本文在脚本之家的博文《PHP正则表达式常用函数使用小结》的基础上，整理、补充而成。感谢脚本之家的分享。

概述：

正如在《POSIX 和 PCRE 标准的正则表达式区别》中所说，PHP中有两套正则表达式函数库。一套是由PCRE（Perl Compatible Regular Expression）库提供的；另一套是由POSIX（Portable Operation System interface）扩展库提供的。

PCRE库使用和Perl相同的语法规则实现了正则表达式的模式匹配，其使用以“preg_”为前缀命名的函数。POSIX扩展的正则表达式由POSIX 1003.2定义，一般使用以“ereg_”为前缀命名的函数。总体来说，PHP对PCRE的支持较为全面，执行效率更高。而PHP 5.4 版本及以后已经不推荐使用 POSIX库。故本文重点介绍PCRE的常用函数。

（一）正则表达式的匹配
1．preg_match()
函数原型：int preg_match (string $pattern, string &$content [, array $matches])
函数功能：函数在$content字符串中搜索与$pattern给出的正则表达式相匹配的内容。如果提供了$matches，则将匹配结果放入其中。$matches[0]将包含与整个模式匹配的文本，$matches[1]将包含第一个捕获的与括号中的模式单元所匹配的内容，以此类推。该函数只作一次匹配，最终返回0或1的匹配结果数。

　　代码示例：日期时间的匹配
<?php //需要匹配的字符串。date函数返回当前时间　　$content = "Current date and time is ".date("Y-m-d h:i a").", we are learning PHP together."; 　　//使用通常的方法匹配时间　　if (preg_match ("/\d{4}-\d{2}-\d{2} \d{2}:\d{2} [ap]m/", $content, $m)) 　　{ 　　　　echo "匹配的时间是：" .$m[0]. "\n"; 　　} 　　//由于时间的模式明显，也可以简单的匹配　　if (preg_match ("/([\d-]{10}) ([\d:]{5} [ap]m)/", $content, $m)) 　　{
　　　　//代码实例如下　　　　echo "当前日期是：" .$m[1]. "\n"; 　　　　echo "当前时间是：" .$m[2]. "\n"; 　　} ?>
　　这是一个简单动态文本串匹配实例。假设当前系统时间是“2006年8月17日13点25分”，将输出如下的内容。
　　　　匹配的时间是：2013-07-22 08:39 pm
　　　　当前日期是：2013-07-22
　　　　当前时间是：08:39 pm

附：ereg()和eregi()
ereg()是POSIX扩展库中正则表达式的匹配函数。eregi()是ereg()函数的忽略大小写的版本。二者与preg_match的功能类似，但函数返回的是一个布尔值，表明匹配成功与否。
通常情况下，使用与Perl兼容的正则表达式匹配函数perg_match()，将比使用ereg()或eregi()的速度更快。如果只是查找一个字符串中是否包含某个子字符串，建议使用strstr()或strpos()函数。
2．preg_grep()
　　函数原型：array preg_grep (string $pattern, array $input)
　　函数功能：preg_grep()函数返回一个数组，其中包括了$input数组中与给定的$pattern模式相匹配的单元。对于输入数组$input中的每个元素，preg_grep()也只进行一次匹配。
　　代码示例：数组查询匹配

<?php 　　$subjects = array( 　　　　"Mechanical Engineering", "Medicine", 　　　　"Social Science", "Agriculture", 　　　　"Commercial Science", "Politics" 　　); 　　//匹配所有仅由有一个单词组成的科目名　　$alonewords = preg_grep("/^[a-z]*$/i", $subjects); ?>

（二）进行全局正则表达式匹配
1．preg_match_all()
　　函数原型：int preg_match_all ( string $pattern , string $subject [, array &$matches [, int $flags = PREG_PATTERN_ORDER [, int $offset = 0 ]]] )
　　函数功能：与preg_match()函数类似。如果使用了第三个参数，将把所有可能的匹配结果放入。本函数返回整个模式匹配的次数（可能为0），如果出错返回False。
　　代码实例：将文本中的链接地址转成HTML

<?php 　　//功能：将文本中的链接地址转成HTML 　　//输入：字符串　　//输出：字符串　　function url2html($text) 　　{ 　　　　//匹配一个URL，直到出现空白为止　　　　preg_match_all("/http:\/\/?[^\s]+/i", $text, $links); 　　　　//设置页面显示URL地址的长度　　　　$max_size = 40; 　　　　foreach($links[0] as $link_url) 　　　　{ 　　　　//计算URL的长度。如果超过$max_size的设置，则缩短。　　　　　　$len = strlen($link_url); 　　　　　　if($len > $max_size) 　　　　　　{ 　　　　　　　　$link_text = substr($link_url, 0, $max_size)."..."; 　　　　　　} else { 　　　　　　　　$link_text = $link_url; 　　　　　　} 　　　　　　//生成HTML文字　　　　　　$text = str_replace($link_url,"<a href='$link_url'>$link_text</a>",$text); 　　　　} 　　　　return $text; 　　} 　　//运行实例　　$str = “这是一个包含多个URL链接地址的多行文字。欢迎访问http://www.jb51.net”; 　　print url2html($str); 　　/*输出结果　　这是一个包含多个URL链接地址的多行文字。欢迎访问<a href='http://www.jb51.net'> 　　http://www.jb51.net</a> 　　*/ ?>

（三）正则表达式的替换
1．preg_replace()
　　函数原型：mixed preg_replace (mixed $pattern, mixed $replacement, mixed $subject [, int $limit])
　　函数功能：preg_replace较ereg_replace的功能更加强大。其前三个参数均可以使用数组；第四个参数$limit可以设置替换的次数，默认为全部替换。
　　代码实例：数组替换

<?php 　　//字符串　　$string = "Name: {Name}<br>\nEmail: {Email}<br>\nAddress: {Address}<br>\n"; 　　//模式　　$patterns =array( 　　　　"/{Address}/", 　　　　"/{Name}/", 　　　　"/{Email}/" 　　); 　　//替换字串　　$replacements = array ( 　　　　"No.5, Wilson St., New York, U.S.A", 　　　　"Thomas Ching", 　　　　"tom@emailaddress.com", 　　); 　　//输出模式替换结果　　print preg_replace($patterns, $replacements, $string); ?>

　　输出结果如下：
　　　　Name: Thomas Ching",
　　　　Email: tom@emailaddress.com
　　　　Address: No.5, Wilson St., New York, U.S.A
　　在preg_replace的正则表达式中可以使用模式修正符“e”。其作用是将匹配结果用作表达式，并且可以进行重新运算。例如：

<?php 　　$html_body = “<HTML><Body><H1>TEST</H1>My Picture<Img src=”my.gif”></Body></HTML>”; 　　//输出结果中HTML标签将全部为小写字母　　echo preg_replace ( 　　　　"/(<\/?)(\w+)([^>]*>)/e", 　　　　"'\\1'.strtolower('\\2').'\\3'", //此处的模式变量\\2将被strtolower转换为小写字符　　　　$html_body); ?>

附注：preg_replace函数使用了Perl兼容正则表达式语法，通常是比ereg_replace更快的替代方案。如果仅对字符串做简单的替换，可以使用str_replace函数。
（四）正则表达式的拆分
1．preg_split()

　　函数原型：array preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] )

　　函数功能：通过一个正则表达式分隔给定字符串。

　　代码实例：查找文章中单词数量
<?php 　　$seek = array(); 　　$text = "I have a dream that one day I can make it. So just do it, nothing is impossible!"; 　　//将字符串按空白，标点符号拆分（每个标点后也可能跟有空格）　　$words = preg_split("/[.,;!\s']\s*/", $text); 　　foreach($words as $val) 　　{ 　　　　$seek[strtolower($val)] ++; 　　} 　　echo "共有大约" .count($words). "个单词。"; 　　echo "其中共有" .$seek['i']. "个单词“I”。"; ?>

　　附注：preg_split() 函数使用了Perl兼容正则表达式语法，通常是比POSIX模式的split()更快的替代方案。使用正则表达式的方法分割字符串，可以使用更广泛的分隔字符。例如，上面对日期格式和单词处理的分析。如果仅用某个特定的字符进行分割，建议使用explode()函数，它不调用正则表达式引擎，因此速度是最快的。
查看全文

相关阅读:
[转载]Shell十三问(入门与提高)
[转载]FPGA学习步骤
 matlab设计切比雪夫低通滤波器
 累加器A与ACC区别
 [转载]3分钟设计滤波器
 [转载]卷积运算的实际意义
 [转载]CRC校验原理
 一个怂女婿的成长笔记【三】
一个怂女婿的成长笔记【一】
一个怂女婿的成长笔记【二】

原文地址：https://www.cnblogs.com/scutwang/p/3093157.html