zoukankan      html  css  js  c++  java
  • 取得汉语拼音首个字母

    byte数组转float 以及byte转其他类型时为什么要&0xff

    public static float getFloat(byte[] b) {  

          int accum = 0;  

           accum = accum|(b[0] & 0xff) << 0; 

           accum = accum|(b[1] & 0xff) << 8;  

           accum = accum|(b[2] & 0xff) << 16;  

          accum = accum|(b[3] & 0xff) << 24;  

           System.out.println(accum); 

           return Float.intBitsToFloat(accum);  

    java中byte转换int时为何与0xff进行与运算

    在剖析该问题前请看如下代码

     public static String bytes2HexString(byte[] b) {

       String ret = "";

       for (int i = 0; i < b.length; i++) {

         String hex = Integer.toHexString(b[i] & 0xFF);

         if (hex.length() == 1) {

           hex = ''0'' + hex;

         }

           ret += hex.toUpperCase();

        }

          return ret;

      }

    上面是将byte[]转化十六进制的字符串,注意这里b[i] & 0xFF将一个byte和 0xFF进行了与运算,然后使用Integer.toHexString取得了十六进制字符串,可以看出

    b[i] & 0xFF运算后得出的仍然是个int,那么为何要和 0xFF进行与运算呢?直接 Integer.toHexString(b[i]);,将byte强转为int不行吗?答案是不行的.

    其原因在于:

    1.byte的大小为8bits而int的大小为32bits

     2.java的二进制采用的是补码形式

    在这里先温习下计算机基础理论

    byte是一个字节保存的,有8个位,即8个0、1。

    8位的第一个位是符号位,

    也就是说0000 0001代表的是数字1

     1000 0001代表的就是-1

    所以正数最大位0111 1111,也就是数字127

    负数最大为1111 1111,也就是数字-128

    上面说的是二进制原码,但是在java中采用的是补码的形式,下面介绍下什么是补码

    1、反码:

            一个数如果是正,则它的反码与原码相同;

            一个数如果是负,则符号位为1,其余各位是对原码取反;

    2、补码:利用溢出,我们可以将减法变成加法

           对于十进制数,从9得到5可用减法:

           9-4=5    因为4+6=10,我们可以将6作为4的补数

           改写为加法:

           9+6=15(去掉高位1,也就是减10)得到5.

           对于十六进制数,从c到5可用减法:

           c-7=5    因为7+9=16 将9作为7的补数

           改写为加法:

           c+9=15(去掉高位1,也就是减16)得到5.

        在计算机中,如果我们用1个字节表示一个数,一个字节有8位,超过8位就进1,在内存中情况为(1 0000 0000),进位1被丢弃。

        ⑴一个数为正,则它的原码、反码、补码相同

        ⑵一个数为负,刚符号位为1,其余各位是对原码取反,然后整个数加1

      - 1的原码为                1000 0001 

      - 1的反码为                1111 1110 

                                                        + 1

      - 1的补码为                1111 1111 

      0的原码为                 0000 0000

      0的反码为                 1111 1111(正零和负零的反码相同)

                                              +1

      0的补码为               10000 0000(舍掉打头的1,正零和负零的补码相同)

    Integer.toHexString的参数是int,如果不进行&0xff,那么当一个byte会转换成int时,由于int是32位,而byte只有8位这时会进行补位。

    例如补码1111 1111的十进制数为-1转换为int时变为11111111111111111111111111111111好多1啊,呵呵!即0xffffffff但是这个数是不对的,这种补位就会造成误差。和0xff相与后,高24比特就会被清0了,结果就对了。

    了解这个基础后回归正题:

    public static String getPinYinHead(char c) {
            String s = String.valueOf(c);
    
            byte[] b;
            try {
                b = s.getBytes("GBK");
            } catch (UnsupportedEncodingException e) {
                b = s.getBytes();
            }
    
            if (b.length >= 2) {
                int b1 = b[0] & 0xff;
                int b2 = b[1] & 0xff;
    
                int value = b1 << 8 | b2;
                if (value >= 0xb0a1 && value <= 0xb0c4) {
                    return "A";
                } else if (value >= 0xb0c5 && value <= 0xb2c0) {
                    return "B";
                } else if (value >= 0xb2c1 && value <= 0xb4ed) {
                    return "C";
                } else if (value >= 0xb4ee && value <= 0xb6e9) {
                    return "D";
                } else if (value >= 0xb6ea && value <= 0xb7a1) {
                    return "E";
                } else if (value >= 0xb7a2 && value <= 0xb8c0) {
                    return "F";
                } else if (value >= 0xb8c1 && value <= 0xb9fd) {
                    return "G";
                } else if (value >= 0xb9fe && value <= 0xbbf6) {
                    return "H";
                } else if (value >= 0xbbf7 && value <= 0xbfa5) {
                    return "J";
                } else if (value >= 0xbfa6 && value <= 0xc0ab) {
                    return "K";
                } else if (value >= 0xc0ac && value <= 0xc2e7) {
                    return "L";
                } else if (value >= 0xc2e8 && value <= 0xc4c2) {
                    return "M";
                } else if (value >= 0xc4c3 && value <= 0xc5b5) {
                    return "N";
                } else if (value >= 0xc5b6 && value <= 0xc5bd) {
                    return "O";
                } else if (value >= 0xc5be && value <= 0xc6d9) {
                    return "P";
                } else if (value >= 0xc6da && value <= 0xc8ba) {
                    return "Q";
                } else if (value >= 0xc8bb && value <= 0xc8f5) {
                    return "R";
                } else if (value >= 0xc8f6 && value <= 0xcbf9) {
                    return "S";
                } else if (value >= 0xcbfa && value <= 0xcdd9) {
                    return "T";
                } else if (value >= 0xcdda && value <= 0xcef3) {
                    return "W";
                } else if (value >= 0xcef4 && value <= 0xd188) {
                    return "X";
                } else if (value >= 0xd1b9 && value <= 0xd4d0) {
                    return "Y";
                } else if (value >= 0xd4d1 && value <= 0xd7f9) {
                    return "Z";
                }
            }
    
            return s;
        }

    下面只是编码表一部分:

      

  • 相关阅读:
    分布式系统实践解读丨详解高内聚低耦合
    Git:改变世界的一次代码提交
    一分钟带你认识深度学习中的知识蒸馏
    99%的人都能看懂的分布式系统「补偿」机制
    一大波人气博主袭来,现场直播华为全联接2020!
    快速了解前端开发HTML的正确姿势
    华为云IoT智简联接,开启物联世界新纪元
    从一个小程序说起2 C++快速入门03
    从一个小程序说起 C++快速入门02
    PE格式详细讲解6(上) 系统篇06|解密系列
  • 原文地址:https://www.cnblogs.com/cangqiongbingchen/p/5019867.html
Copyright © 2011-2022 走看看