zoukankan      html  css  js  c++  java
  • 正则表达式

    本文转自

    http://www.cnblogs.com/dongzhiquan/archive/2009/09/13/1994736.html

    经过测试其中匹配双字节字符(包括汉字在内):[^x00-xff]非常好用推荐一下

    两外推荐个网址http://mscenter.edu.cn/blog/yongsheng/archive/2004/11/19/308.html

    这个家伙收录的正则很多,呵呵

    关键字:正则表达式  模式匹配 Javascript

    摘要:收集一些常用的正则表达式。

    正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新。

    匹配中文字符的正则表达式: [u4e00-u9fa5]

    匹配双字节字符(包括汉字在内):[^x00-xff]

    应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

    String.prototype.len=function(){return this.replace([^x00-xff]/g,"aa").length;}

    匹配空行的正则表达式: [s| ]*

    匹配HTML标记的正则表达式:/<(.*)>.*</1>|<(.*) />/

    匹配首尾空格的正则表达式:(^s*)|(s*$)

    String.prototype.trim = function()
    {
        return this.replace(/(^s*)|(s*$)/g, "");
    }

    利用正则表达式分解和转换IP地址:

    下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:

    function IP2V(ip)
    {
     re=/(d+).(d+).(d+).(d+)/g  //匹配IP地址的正则表达式
    if(re.test(ip))
    {
    return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
    }
    else
    {
     throw new Error("Not a valid IP address!")
    }
    }

    不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:

    var ip="10.100.20.168"
    ip=ip.split(".")
    alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

    匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

    匹配网址URL的正则表达式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

    利用正则表达式去除字串中重复的字符的算法程序 :[注:此程序不正确,原因见本贴回复]

    var s="abacabefgeeii"
    var s1=s.replace(/(.).*1/g,"$1")
    var re=new RegExp("["+s1+"]","g")
    var s2=s.replace(re,"") 
    alert(s1+s2)  //结果为:abcefgi

    我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法,最终没有找到,这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符,再以重复的字符建立第二个表达式,取到不重复的字符,两者串连。这个方法对于字符顺序有要求的字符串可能不适用。

    得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1

    s="http://www.9499.net/page1.htm"
    s=s.replace(/(.*/){0,}([^.]+).*/ig,"$2")
    alert(s)

    利用正则表达式限制网页表单里的文本框输入内容:

    用正则表达式限制只能输入中 文:onkeyup="value=value.replace(/[^u4E00-u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^u4E00-u9FA5]/g,''))"

    用正则表达式限制只能输入全角字符:  onkeyup="value=value.replace(/[^uFF00-uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^uFF00-uFFFF]/g,''))"

    用正则表达式限制只能输入数 字:onkeyup="value=value.replace(/[^d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,''))"

    用正则表达式限制只能输入数字和英 文:onkeyup="value=value.replace(/[W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^d]/g,''))"

    应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:

    判断日文的正则表达式

    1. GBK (GB2312/GB18030)
    x00-xff  GBK双字节编码范围
    x20-x7f  ASCII
    xa1-xff  中文
    x80-xff  中文

    2. UTF-8 (Unicode)
    u4e00-u9fa5 (中文)
    x3130-x318F (韩文
    xAC00-xD7A3 (韩文)
    u0800-u4e00 (日文)
    ps: 韩文是大于[u9fa5]的字符

  • 相关阅读:
    hdu 1823 Luck and Love 二维线段树
    UVA 12299 RMQ with Shifts 线段树
    HDU 4578 Transformation 线段树
    FZU 2105 Digits Count 线段树
    UVA 1513 Movie collection 树状数组
    UVA 1292 Strategic game 树形DP
    【ACM】hdu_zs2_1003_Problem C_201308031012
    qsort快速排序
    【ACM】nyoj_7_街区最短路径问题_201308051737
    【ACM】nyoj_540_奇怪的排序_201308050951
  • 原文地址:https://www.cnblogs.com/mengxiangzhi/p/10167229.html
Copyright © 2011-2022 走看看