zoukankan      html  css  js  c++  java
  • Java中根据字节截取字符串

    一、简介                      

      为了统一世界各国的字符集,流行开了Unicode字符集,java也支持Unicode编码,即java中char存的是代码点值,即无论是‘A’还是‘中’都占两个字节。

      代码点值:与Unicode编码表中字符相对应的代码值;

      代码单元:就是java中的一个char,可一个以认为是字符编码的基本单元

    二、根据字节截取字符串的代码实现                  

      public String getSubString(String str, int length) throws Exception {

        int i;

        int n;

        byte[] bytes = str.getBytes("Unicode");      //使用Unicode字符集将字符串编码成byte序列

        i = 2;      //bytes的前两个字节是标志位,bytes[0] = -2, bytes[1] = -1, 故从第二位开始

        n = 0;

        for(; i < bytes.length && n < length; i++) {

          if(i % 2 == 1) {

            n++;

          } else {

            if(bytes[i] != 0) {

              n++;

            }

          }

        }

        //去掉半个汉字

        if(i % 2 == 1) {

          if(bytes[i-1] != 0) {

            i = i -1;

          } else {

            i = i + 1;

          }

        }

        return new String(bytes, 0, i, "Unicode");

      }

  • 相关阅读:
    webpack:loader编写
    架构之路:从概念开始
    AtCoder Regular Contest 114(A-C)
    12-UE4-控件类型
    10-UE4-蓝图定义简介
    11-UE4-UMG UI设计器
    UE4-目录结构简介
    UE4-字符串
    官方Spring Boot starters整理
    Java是引用传递还是值传递?
  • 原文地址:https://www.cnblogs.com/lmmblogs/p/7813132.html
Copyright © 2011-2022 走看看