zoukankan      html  css  js  c++  java
  • Java中根据字节截取字符串

    一、简介                      

      为了统一世界各国的字符集,流行开了Unicode字符集,java也支持Unicode编码,即java中char存的是代码点值,即无论是‘A’还是‘中’都占两个字节。

      代码点值:与Unicode编码表中字符相对应的代码值;

      代码单元:就是java中的一个char,可一个以认为是字符编码的基本单元

    二、根据字节截取字符串的代码实现                  

      public String getSubString(String str, int length) throws Exception {

        int i;

        int n;

        byte[] bytes = str.getBytes("Unicode");      //使用Unicode字符集将字符串编码成byte序列

        i = 2;      //bytes的前两个字节是标志位,bytes[0] = -2, bytes[1] = -1, 故从第二位开始

        n = 0;

        for(; i < bytes.length && n < length; i++) {

          if(i % 2 == 1) {

            n++;

          } else {

            if(bytes[i] != 0) {

              n++;

            }

          }

        }

        //去掉半个汉字

        if(i % 2 == 1) {

          if(bytes[i-1] != 0) {

            i = i -1;

          } else {

            i = i + 1;

          }

        }

        return new String(bytes, 0, i, "Unicode");

      }

  • 相关阅读:
    大佬讲话听后感
    P1226快速幂取余
    对拍
    P1017 进制转换
    P1092 虫食算 NOIP2002
    P1003 铺地毯
    P1443 马的遍历
    P1032 字串变换
    P1379 八数码问题
    2-MAVEN 基本命令
  • 原文地址:https://www.cnblogs.com/lmmblogs/p/7813132.html
Copyright © 2011-2022 走看看