zoukankan      html  css  js  c++  java
  • 关于Basic Latin踩到的一些坑

    目录

      在wiki中,很多语言的字符集都包含了Basic Latin,一开始我没有细看,以为Basic Latin里面都是正常的字符集,后来在线上环境出现了问题

      博主某天接到一个需求,需要过滤出某国语言的字符集(避免出现Unicode中的不可见字符),于是高高兴兴的在维基百科上找到该语言字符集抄了下来

      嗯,于是,线上环境出了一点小问题,由于我们某些功能是依赖于Basic Latin里面的特殊字符来做分割的,博主过于年轻,没有细看,于是翻车,卒,享年22岁。

      先看看Basic Latin里面到底是什么:https://jrgraphix.net/r/Unicode/0020-007F

      仔细看里面其实有很多特殊字符的,所以大多数程序员一般都会在正则表达式里面写0-9a-zA-Z来表示Basic Latin里面的东西,为什么不直接写x0020-x007F是有用意,以后看见一些东西还是不要随意忽略,就像为什么写0-9a-zA-Z来表示x0020-x007F,你以为别人是傻逼,写这么一长串干啥,实际上你是傻逼。

    • 相关阅读:
      开始熟悉一下数据结构了
      首个概率dp
      十六进制转化为八进制
      蓝桥之 剪格子
      蓝桥之 颠倒的价格
      还是闲的
      也是闲的
      闲的无聊,,,
      函数进阶
      函数基础
    • 原文地址:https://www.cnblogs.com/daryl-blog/p/11003081.html
    Copyright © 2011-2022 走看看