zoukankan      html  css  js  c++  java
  • Java中根据字节截取字符串

    一、简介                      

      为了统一世界各国的字符集,流行开了Unicode字符集,java也支持Unicode编码,即java中char存的是代码点值,即无论是‘A’还是‘中’都占两个字节。

      代码点值:与Unicode编码表中字符相对应的代码值;

      代码单元:就是java中的一个char,可一个以认为是字符编码的基本单元

    二、根据字节截取字符串的代码实现                  

      public String getSubString(String str, int length) throws Exception {

        int i;

        int n;

        byte[] bytes = str.getBytes("Unicode");      //使用Unicode字符集将字符串编码成byte序列

        i = 2;      //bytes的前两个字节是标志位,bytes[0] = -2, bytes[1] = -1, 故从第二位开始

        n = 0;

        for(; i < bytes.length && n < length; i++) {

          if(i % 2 == 1) {

            n++;

          } else {

            if(bytes[i] != 0) {

              n++;

            }

          }

        }

        //去掉半个汉字

        if(i % 2 == 1) {

          if(bytes[i-1] != 0) {

            i = i -1;

          } else {

            i = i + 1;

          }

        }

        return new String(bytes, 0, i, "Unicode");

      }

  • 相关阅读:
    C#与SAP进行数据交互
    自动加减工单结存算法实现
    RDLC报表打印一维码
    调用存储过程通用类
    监听网络状态
    压缩及解压缩文件
    用Go造轮子-管理集群中的配置文件
    2015年总结
    浅析Go语言的Interface机制
    2014年总结
  • 原文地址:https://www.cnblogs.com/lmmblogs/p/7813132.html
Copyright © 2011-2022 走看看