zoukankan      html  css  js  c++  java
  • Java中根据字节截取字符串

    一、简介                      

      为了统一世界各国的字符集,流行开了Unicode字符集,java也支持Unicode编码,即java中char存的是代码点值,即无论是‘A’还是‘中’都占两个字节。

      代码点值:与Unicode编码表中字符相对应的代码值;

      代码单元:就是java中的一个char,可一个以认为是字符编码的基本单元

    二、根据字节截取字符串的代码实现                  

      public String getSubString(String str, int length) throws Exception {

        int i;

        int n;

        byte[] bytes = str.getBytes("Unicode");      //使用Unicode字符集将字符串编码成byte序列

        i = 2;      //bytes的前两个字节是标志位,bytes[0] = -2, bytes[1] = -1, 故从第二位开始

        n = 0;

        for(; i < bytes.length && n < length; i++) {

          if(i % 2 == 1) {

            n++;

          } else {

            if(bytes[i] != 0) {

              n++;

            }

          }

        }

        //去掉半个汉字

        if(i % 2 == 1) {

          if(bytes[i-1] != 0) {

            i = i -1;

          } else {

            i = i + 1;

          }

        }

        return new String(bytes, 0, i, "Unicode");

      }

  • 相关阅读:
    frida多版本安装 ubuntu同时安装多个版本的frida
    python爬虫备忘录
    解决linux不能启动google问题
    Centos7 自定义守护进程
    (CentOS 7.0和7.5实验过) 更改网卡名称
    centos 配置网络连接(本机是基于无线网,虚拟机上)
    linux 仿QQ 2.0版本
    linux 实现仿QQ应用程序
    linux 终端、伪终端、虚拟终端的理解
    linux中的make命令
  • 原文地址:https://www.cnblogs.com/lmmblogs/p/7813132.html
Copyright © 2011-2022 走看看