zoukankan      html  css  js  c++  java
  • 正则表达式3---中文

    1. 获取汉字的UTF-8

      PHP:

      var_export(json_encode("你"));

      javaScript:

      alert(escape("你"));

    java:

    JDK下面的native2ascii 工具查看字符的unicode编码

    1. 匹配所有中文

      JS:

      var pattern=/[u4e00-u9fa5]/g;

      在正则中,u加上四位十六进制数,范围从u4e00(一)开始到u9fa5(龥 ),就能匹配所有中文

       

      php:

      在PHP中。是用x代表十六进制数,并且位数超过四位必须要大括号概括

      所以在PHP中匹配中文要这么写:[x{4e00}-x{9fa5}]

      并必须加上 "u" 修饰符,字符串如果是utf-8,那么必须要加上u修饰符

       

      Java:

      [\x{4e00}-\x{9fa5}]

      [\u4e00-\u9fa5]

       

      ps:如果字符是gb2312,推荐先把字符串转化为utf-8编码。同样使用统一的正则来匹配,不建议不同的编码各一套正则写法。

    在人生中,赢家并不是那些有优秀基因的人,或是那些最有天分的人,而是那些最不屈不挠的人!当他们跌倒了,他们总是不断的爬起来,继续做,继续做。 no pain no gains (^ _ ^) !!
  • 相关阅读:
    Median of Two Sorted Arrays
    Two Sum
    C# Socket服务端和客户端互相send和receive
    C++ 虚函数和虚函数表
    C++ 类型转换
    C# 几种退出程序的方式
    进程判断及简单操作
    C#根据函数名称执行对应的函数
    C# DateTime格式化
    nginx常用代理配置
  • 原文地址:https://www.cnblogs.com/fatsnake/p/5291715.html
Copyright © 2011-2022 走看看