zoukankan      html  css  js  c++  java
  • javascript 正则介绍

    1、正则直接量字符

    o NUL字符(u000)
    制表符
    换行符(u000A)
    v 垂直制表符
    f 换页符
    xnn 由16进制nn指定的拉丁字符
    uXXXX 由16进制XXXX指定的uncode字符
    cX 控制字符

    2、正则字符

    [....] 方括号内的任意字符
    [^...] 非方括号内的任意字符
    . 除换行符和和他uncode行终止符之外的任意字符
    w 任何ASCII码组成的字符 等价于[a-zA-Z0-9]
    W 任何非ASCII码组成的字符 等价于[^a-zA-Z0-9]
    s unicode空白符
    S 非unicode空白符
    d 任何ASCII码数字等价于[0-9]
    D 任何非ASCII码数字等价于[^0-9]
    [] 退格符

    3、正则重复

    {n,m} 匹配前一项至少n次,但不能超过m次 等价于n =< x < m
    {n,} 匹配前一项至少n次,或者更多次
    {n} 匹配前一项n次
    ? 匹配前一项0次或者1次
    + 匹配前一项1次或者多次
    * 匹配前一项0次或者多次

    4、非贪婪的重复

    非贪婪的匹配只需在待匹配的正则后面加一个“?”即可,这样能尽可能少的进行匹配
    ??,+?,*?,或{1,5}?等

    5、选择,分组和引用

    '|'或者匹配 选择引用
    /ab|ed|rf/ 匹配ab ed rf其中一个,如果前面的被匹配,后面的将会被忽略,选择项的匹配的顺序是从左至右。
    () 分组引用符使用
    正则中括号的使用是多变的,
    一个作用是吧单独的项作为子表达式使用,以便可以处理单独的项
    例如:/java(script)/ 可以匹配java也可以匹配javascript后面的script可以有也可以没有
    例子:/(ab/cd)+|ef/ 可以匹配ab或者cd的1次或者多次,也可以匹配ef
    另一个作用是在完整的模式中定义子模式,当一个正则表达式成功的和目标字符串相匹配时,可以从目标串中抽出和圆括号相配的子串。
    还有一个作用是是允许在同一个正则表达式的后部引用前面的子表达式。
    例如:1 表示引用的是第一个带括号的子表达式,2就是第二个
    (?:...)只组合,把项目合到一个单元,但不记忆与该组想匹配的字符。

      5.1、先行断言

      (?= ...)用以说明圆括号内的表达式必须正确匹配!
      例如:/[jJ]ava([sS]cript)?(?=:)/ 匹配例如:javascript:the good...

      5.2、负向先行断言

      (?!....) 用以指定接下来的字符都不必匹配
      例如:/java(?!Script)([A-Z]w*)/

    6、string对象有四个方法支持正则匹配

      6.1 search()方法
      他的参数就是一个正则表达式,返回第一个与之匹配的串的起始位置!如果找不到返回-1。如果传入的参数不是正则表达式,函数会调用
      RegExp构造函数创建一个正则!search()方法不支持全局查找,因此会忽略修饰符/g;

      6.2 replace();替换方法

      他的参数有两个,一个是匹配的正则,一个是要匹配的字符串!如果参数设置修饰符g,则会把匹配到了都替换成最新的字符,如果没有指定

      修饰符g,只会替换第一个出现的字符!
      例如:text.replace(/javascript/gi,'JavaScript');
      replace函数的另外一个使用
      例如:
      var quot = /(^")/g;
      text.replace(quot,'"$1"');
      $1储存在$1中的内容
      replace的第二个参数还可以是函数,可以动态的计算并做替换!

      6.3 match()函数
      
    他只有一个参数就是正则表达式,返回的是由匹配结果组成的数组,如果该方法的正则设置了修饰符g,会返回所有匹配到的结果!
      例如:
      '1plus 2 plus 3 kkk'.match(/d+/g);//结果为[1,2,3]
      如果match函数的正则没有设置全局的g,也会返回一个数组,那么数组的结果就是第一个被匹配的内容和圆括号括起来的子表达式匹配的内容!
      例如:
      使用如下代码进行url解析:
      var pattern = /(w+:)//([w.]+)/(S*)/;
      var url = 'vsv is a http://www.baidu.com/~fgf';
      var result = url.match(pattern);
      console.log(result); //["http://www.baidu.com/~fgf", "http:", "www.baidu.com", "~fgf", index: 9, input: "vsv is a http://www.baidu.com/~fgf"]
      if(result != null){
      var s1 = result[0];//http://www.baidu.com/~fgf
      var s2 = result[1];//http:
      var s3 = result[2];//www.baidu.com
      var s4 = result[3];//~fgf
      }
      
    //他还返回另外两个属性:index和input
      给match()函数传入不带全局的正则实际上和正则的exec()函数返回的结果是一致的!

      6.4 split()函数

      split()函数的参数可以是正则表达式,可以按照正则指定的规则进行分割
      例如:
      '1 ,2 , 3,4, 5'.split(/s*,s*/);//["1", "2", "3", "4", "5"]

      7、RegExp 对象

      例如:
      var pa = new RegExp("\d+","g");//第二个参数是可选的!

      8、exec 函数
      他总是返回一个匹配的结果,并提供本次返回的所有完整的信息,当调用的exec具有g时候,他就把当前的lastIndex定位为紧挨着匹配结果的位置
      当同一个正则表达式再次调用的时候就从上次的位置再次查找结果!如果没有查找到,会将lastIndex定位为0,这种特殊的行为可以使我们反复调用
      exec 函数!

  • 相关阅读:
    八款常用的 Python GUI 开发框架推荐
    scrapy + mogoDB 网站爬虫
    tkinter界面卡死的解决办法
    通过核心API启动单个或多个scrapy爬虫
    爬虫怎样绕过验证码?
    Python爬虫入门教程 33-100 电影评论数据抓取 scrapy
    Python开发 之 Websocket 的使用示例
    StringBuffer详解
    其实python正则表达式就这样简单明了
    ABAP和Java里的单例模式攻击
  • 原文地址:https://www.cnblogs.com/shizhouyu/p/4647391.html
Copyright © 2011-2022 走看看