zoukankan      html  css  js  c++  java
  • 字节和字符的区别 【转】

    (一)“字节”的定义
    字节(Byte)是一种计量单位,表示数据量多少,它是计算机信息技术用于计量存储容量的一种计量单位。

    (二)“字符”的定义
    字符是指计算机中使用的文字和符号,比如1、2、3、A、B、C、~!·#¥%……—*()——+、等等。

    (三)“字节”与“字符”
    它们完全不是一个位面的概念,所以两者之间没有“区别”这个说法。不同编码里,字符和字节的对应关系不同:
    ①ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。
    ②UTF-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
    ③Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。
    符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。
    ④UTF-16编码中,一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。
    ⑤UTF-32编码中,世界上任何字符的存储都需要4个字节。

    ==============================================================================
    package com.suypower.chengyu.test;

    public class ByteTest {

     /**
      * byte 8 bits -128 - + 127
      * 1 bit = 1 二进制数据
      * 1 byte = 8 bit
      * 1 字母 = 1 byte = 8 bit(位)
      * 1 汉字 = 2 byte = 16 bit
      */
     public static void main(String[] args) {
      // TODO Auto-generated method stub
      byte b1 = 127;
      byte b2 = -128;
      byte b3 = 'a';
      byte b4 = 'A'; // 一个字母 = 1 byte = 8 bit
    //  byte b5 ='aa';  这就错了
    //  byte b6 ='中'; 这就错了 一个汉字 2个字节 16bit
      short s1 = '啊'; // 一个汉字 2个字节 16bit short 是 16 bit位的
    //  short s2 = '汉字';  // 2个汉字 4个字节 32 bit int 是32 bit的
    //  int i1 = '汉字';  但是 int 是数字类型的 , char 是 16 bit的 = 2 byte = 一个汉字
      char c1 = '汗';
    //  byte 转换 string
      String string = "中文";
      byte by[] = string.getBytes();
      String str = new String(by);
      System.out.println("str="+str);
     }

    }
    ==================================================================================

    [Java-原创] bit、byte、位、字节、汉字、字符
    bit、byte、位、字节、汉字的关系


            1 bit     = 1  二进制数据
            1 byte  = 8  bit
            1 字母 = 1  byte = 8 bit
            1 汉字 = 2  byte = 16 bit


    1. bit:位
        一个二进制数据0或1,是1bit;

    2. byte:字节
        存储空间的基本计量单位,如:MySQL中定义 VARCHAR(45)  即是指 45个字节;
        1 byte = 8 bit

    3. 一个英文字符占一个字节;
        1 字母 = 1 byte = 8 bit

    4. 一个汉字占2个字节;
        1 汉字 = 2 byte = 16 bit

    5. 标点符号
        A>.  汉字输入状态下,默认为全角输入方式;
        B>.  英文输入状态下,默认为半角输入方式;

        C>.  全角输入方式下,标点符号占2字节;
        D>.  半角输入方式下,标点符号占1字节;

        故:汉字输入状态下的字符,占2个字节 (但不排除,自己更改了默认设置);
                英文输入状态下的字符,占1个字节 (但不排除,自己更改了默认设置);

            老美在发明电脑时,肯定以自己的英文字母--即他们自认为的字符为最小的存储计量单位,于是也就有了不规范的1字符=1byte, 岂不知还有我们伟大的汉字计量单
      位,NND,一个汉字也是一个字符,我们的1汉字字符就等于2byte,后来,他们可能意识到这个尴尬的问题,于是又标榜为:一个字母为一个标准字符,去球吧,谁
      整天没事说个字符还“标准字符”,所以啊,个人认为:字符,不能用于标准的计量单位。

  • 相关阅读:
    sikiA计划问题记录
    列表+泛型
    查看别人项目找代码的方法
    Unity3d 异常与解决方案集合(持续)
    实现继承+接口继承+虚方法+隐藏方法+this/base+抽象类+密封类/方法+修饰符
    定义类+类实例化+属性+构造函数+匿名类型var+堆与栈+GC回收机制+值类型与引用类型
    局部变量和成员变量的区别
    数组元素二分查找(折半查找)
    数组元素冒泡排序
    数组元素选择排序
  • 原文地址:https://www.cnblogs.com/efforts-will-be-lucky/p/7083039.html
Copyright © 2011-2022 走看看