zoukankan      html  css  js  c++  java
  • 特殊的空格(Java无法替换字符串中的空格)

    一、自己的问题

    先说一下自己碰到的问题,自己在本地建立了一个json文件,并且把它格式化了(为了看着美观);然后在Java后台中去读取(使用BufferedReader的readline方法),但是读取后的Json字符串总是带着一部分空白,使用了多种替换方式(trim,空格,换行符,制表符等)都无法消除空格,导致后续创建json对象时提示错误。

    原因:是因为这个读取到的不是Java常见的空格字符,而是特殊的空格(ASCII值160,严格来说这个是扩展ASCII值的部分,因为原生ASCII最大只到127),因此不能使用常规的替换方式。

    具体处理见下文(转载的博客,为了加深记忆,特意又放到自己的博客中)。

    二、处理办法

    最近遇到个问题,在页面的搜索框输入带有空格的字符串时,总是无法从db中搜索出来对应的数据,于是将db里的空格复制出来,发现其ASCII码值为160,这才知道,原来ASCII码中除了32之外还有160这个特殊的空格。下边是查看字符对应ASCII值的逻辑:

    final char c1 = ' '; //db里的空格
    final char c2 = ' '; //手动输入的空格
    System.out.println((int)c1); //160
    System.out.println((int)c2); //32

    平时我们用键盘输入的空格的ASCII值是32,而这个ASCII值为160的空格,其实是不间断空格(non-breaking space),是不是从来没听说过这东东?其实你平时一定也用过很多次的,就是页面上的 所产生的空格。

    不间断空格non-breaking space的缩写正是nbsp。这中空格的作用就是在页面换行时不被打断,如下:

    页面某一行的末尾是一个人名Zhang Xiaoming

    我们希望在换行时人名不会被打断,导致Zhang 在第一行末尾,而Xiaoming跑到第二行开头,而是保持完整的人名在同一行的末尾,于是就有了不间断空格。(在word中也有这种空格的使用)

    如果使用了平常的空格,就会被页面压缩,变成下边这样

    页面某一行的末尾是一个人名Zhang 
    Xiaoming

    问题

    但是不间断空格有个问题,就是它无法被trim()所裁剪,也无法被正则表达式的s所匹配,也无法被StringUtils的isBlank()所识别,也就是说,无法像裁剪寻常空格那样移除这个不间断空格。

    我们可以利用不间断空格的Unicode编码来移除它,其编码为u00A0。

    解决办法如下:

    replace("u00A0", "")
    replaceAll("\u00A0+", "")  //这是正则表达式的写法
    
    String str = "aacsdfe ";  //包含了不间断空格的字符串
    str = str.replace("u00A0", "");
    str = str.replaceAll("\u00A0+", "");

    ————————————————

    本文不是个人原创。

    附原文链接:https://blog.csdn.net/lewky_liu/article/details/79353151

  • 相关阅读:
    Es spring data jpa 修改连接配置
    object转map类型
    记一次项目中yaml文档引发的惨案 (#yaml文档格式#yaml中'-'的作用)
    02-方法重载
    01-数据类型分类
    Centos 7 Sublime 安装 package control
    修改AdminLTE左侧菜单展开延迟
    【Flask】Flask Restful api
    【Flask】Flask常用信号
    【Flask】Flask上下文
  • 原文地址:https://www.cnblogs.com/qingtian-jlj/p/12784770.html
Copyright © 2011-2022 走看看