zoukankan      html  css  js  c++  java
  • Java中根据字节截取字符串

    一、简介                      

      为了统一世界各国的字符集,流行开了Unicode字符集,java也支持Unicode编码,即java中char存的是代码点值,即无论是‘A’还是‘中’都占两个字节。

      代码点值:与Unicode编码表中字符相对应的代码值;

      代码单元:就是java中的一个char,可一个以认为是字符编码的基本单元

    二、根据字节截取字符串的代码实现                  

      public String getSubString(String str, int length) throws Exception {

        int i;

        int n;

        byte[] bytes = str.getBytes("Unicode");      //使用Unicode字符集将字符串编码成byte序列

        i = 2;      //bytes的前两个字节是标志位,bytes[0] = -2, bytes[1] = -1, 故从第二位开始

        n = 0;

        for(; i < bytes.length && n < length; i++) {

          if(i % 2 == 1) {

            n++;

          } else {

            if(bytes[i] != 0) {

              n++;

            }

          }

        }

        //去掉半个汉字

        if(i % 2 == 1) {

          if(bytes[i-1] != 0) {

            i = i -1;

          } else {

            i = i + 1;

          }

        }

        return new String(bytes, 0, i, "Unicode");

      }

  • 相关阅读:
    ROXFiler 2.6
    ubuntu下lxr的运用
    NTFS3G-Linux 的 NTFS 驱动步骤
    Songbird 0.2.5 Final
    ePDFView:一个轻量的 PDF 文档阅读东西
    Gmail Notifier:又一个 Gmail 邮件通知法式
    Hybrid Share-文件分享软件
    Dolphin:KDE 中的文件管理器
    文泉驿点阵宋体 0.8(嬴政)正式公布
    KDE 4 Kludge 发布宣布
  • 原文地址:https://www.cnblogs.com/lmmblogs/p/7813132.html
Copyright © 2011-2022 走看看