zoukankan      html  css  js  c++  java
  • RegExp&正则的一些小知识点

         js的数据类型  ----介绍RegExp
            基本数据类型:String、boolean、Number、undefined、null
            引用数据类型:Object、Array、Date、RegExp、Function

            RegExp表示正则表达式,它是对字符串执行模式匹配的强大工具。

            JavaScript有两种方式创建一个正则表达式:

            第一种方式是直接通过/正则表达式/写出来

            第二种方式是通过new RegExp('正则表达式')创建一个RegExp对象

            new RegExp(pattern, attributes);

            参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。

            参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。

    var re1 = /ABC-001/;
    var re2 = new RegExp('ABC\-001');
    
    re1; // /ABC-001/
    re2; // /ABC-001/
    var re = /^d{3}-d{3,8}$/;
    re.test('010-12345'); // true
    re.test('010-1234x'); // false
    re.test('010 12345'); // false

    RegExp对象的test()方法用于测试给定的字符串是否符合条件。

        

      切分字符串

    用正则表达式切分字符串比用固定的字符更灵活

    'a b   c'.split(' '); // ['a', 'b', '', '', 'c']

    无法识别连续的空格,用正则表达式试试:

    'a b   c'.split(/s+/); // ['a', 'b', 'c']

    无论多少个空格都可以正常分割。

    'a,b, c  d'.split(/[s\,]+/); // ['a', 'b', 'c', 'd']

    再加入

    'a,b;; c  d'.split(/[s\,;]+/); // ['a', 'b', 'c', 'd']

    如果用户输入了一组标签,下次记得用正则表达式来把不规范的输入转化成正确的数组。

    分组

    除了简单地判断是否匹配之外,正则表达式还有提取子串的强大功能。用()表示的就是要提取的分组(Group)。比如:

    ^(d{3})-(d{3,8})$分别定义了两个组,可以直接从匹配的字符串中提取出区号和本地号码:

    var re = /^(d{3})-(d{3,8})$/;
    re.exec('010-12345'); // ['010-12345', '010', '12345']
    re.exec('010 12345'); // null

    如果正则表达式中定义了组,就可以在RegExp对象上用exec()方法提取出子串来。

    exec()方法在匹配成功后,会返回一个Array,第一个元素是正则表达式匹配到的整个字符串,后面的字符串表示匹配成功的子串。

    exec()方法在匹配失败时返回null

    提取子串非常有用。

    var re = /^(0[0-9]|1[0-9]|2[0-3]|[0-9]):(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9]):(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9])$/;
    re.exec('19:05:30'); // ['19:05:30', '19', '05', '30']

    这个正则表达式可以直接识别合法的时间。但是有些时候,用正则表达式也无法做到完全验证,比如识别日期:

    var re = /^(0[1-9]|1[0-2]|[0-9])-(0[1-9]|1[0-9]|2[0-9]|3[0-1]|[0-9])$/;

    对于'2-30''4-31'这样的非法日期,用正则还是识别不了,或者说写出来非常困难,这时就需要程序配合识别了。

    贪婪匹配

    需要特别指出的是,正则匹配默认是贪婪匹配,也就是匹配尽可能多的字符。

    var re = /^(d+)(0*)$/;
    re.exec('102300'); // ['102300', '102300', '']

    由于d+采用贪婪匹配,直接把后面的0全部匹配了,结果0*只能匹配空字符串了。

    必须让d+采用非贪婪匹配(也就是尽可能少匹配),才能把后面的0匹配出来,加个?就可以让d+采用非贪婪匹配:

    var re = /^(d+?)(0*)$/;
    re.exec('102300'); // ['102300', '1023', '00']

    全局搜索

    JavaScript的正则表达式还有几个特殊的标志,最常用的是g,表示全局匹配:

    var r1 = /test/g;
    // 等价于:
    var r2 = new RegExp('test', 'g');

    全局匹配可以多次执行exec()方法来搜索一个匹配的字符串。当我们指定g标志后,每次运行exec(),正则表达式本身会更新lastIndex属性,表示上次匹配到的最后索引:

    var s = 'JavaScript, VBScript, JScript and ECMAScript';
    var re=/[a-zA-Z]+Script/g;
    
    // 使用全局匹配:
    re.exec(s); // ['JavaScript']
    re.lastIndex; // 10
    
    re.exec(s); // ['VBScript']
    re.lastIndex; // 20
    
    re.exec(s); // ['JScript']
    re.lastIndex; // 29
    
    re.exec(s); // ['ECMAScript']
    re.lastIndex; // 44
    
    re.exec(s); // null,直到结束仍没有匹配到

    全局匹配类似搜索,因此不能使用/^...$/,那样只会最多匹配一次。

    正则表达式还可以指定i标志,表示忽略大小写,m标志,表示执行多行匹配。

    小结

    正则表达式非常强大。

  • 相关阅读:
    使用element-ui是下拉筛选选择
    vue 组件传值
    vue element 地址联动的使用
    vux scroller
    实时监听组件中路由的变化
    vuex的使用
    对移动端滚动高度的获取
    【转】ACM 取石子问题
    【转】ACM博弈知识汇总
    EOJ 2857 编辑距离
  • 原文地址:https://www.cnblogs.com/goodboyzjm/p/11674217.html
Copyright © 2011-2022 走看看