zoukankan      html  css  js  c++  java
  • Byte和byte[]数组

    Byte和byte[]数组,“表示一个 8 位无符号整数, 一般为8位二进制数”。

    Byte是计算机最基础的存储单位和最基础的通讯单位。

    而所有的类型都是支持由byte[]类型转换而来。

    为什么说Byte是最基础类型那,

    其实这里的关键所在是,计算机最基础的算法是编码,包括媒体文件、图片、各种文档以致计算机算有数据的文件展现都是字符串,而这些字符串都是由编码得来。

    不管你是各种千奇百怪的字符串组成的格式,最终都要根据编码表,字符转换成相对应的十进制数字,而这相应的十进制数字那,就会存储在byte[]数组中(这里的十进制数是用来计算的,存储时会自动转换为二进制数字存储,程序计算时会按十进制计算)。

    媒体文件、图片、各种文档等等—》源文件由字符串组成,多个字符—》单个字符—》十进制数字(根据相应编码)—》byte[]数组(单个字符) —》byte[]数组(多个字符) —》媒体文件、图片、各种文档等等存储单位或通讯单位。

    此时这个“单个字符”二进制的长度就是根据相应编码得来的,由多个字符组成的byte[]就组成了媒体文件、图片、各种文档等等的源文件。

    具体如下:

    UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。

    Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。

     

    下面可以看到UTF-8编码的byte[]数组(C# byte[]默认存储计算为十进制),所以说最终计算机数据是由byte类型组成数据为基础的。

                           

     

     

     

     

     

    网络传输:

     

    如果是自己程序间的对接,byte[]类型理论上就够了(实际上也不够,哈哈),在传输段传输byte[]类型,收取端收取byte[]类型,然后转化为原格式就可以了。

     

    “a张”编码—>byte[0]=97、byte[1]=229、byte[2]=188、byte[3]=160(byte[0]=01100001、byte[1]=11100101、byte[2]=10111100、byte[3]=10100000)—>传输—>收取为byte[]—> 解码“a张”。

     

           但是如果传输的数据是开放式的,或者生成可读的文件,比如文件格式的,url,xml、json的话,是不能存储byte[]型的,看不懂也没法解析,这就要求再吧byte[]再编码为字符串类型。

     

    到了网络传输过程了,前文我们已经得到了文件最基础的存储格式,byte[]数组,但作为程序传输他面临个问题,因为程序传输一般可见的是以字符形式传输的(中间过程是网络层自动转换的),那么就需要把byte[]类型转换为字符串传输,很多人是感觉怎么有转换为字符串了,这不是和原来一样了吗,其实不是,现在编码的就不是任意字符串了,是基础的二进制数字10做成的字符串,相当于把byte[]类型每个byte转换为字符串传送,而在接收端在转换为byte[]数组,这相当于无编码过程。

     

    byte[]是数据类型的,长度是有限制的,也不灵活。所以说基础传输其实是1和0组成的长字符串。

    简单的说就是数据编码成byte[],byte[]再二次编码成为易于传送的字符串。

    如下

    “a张”编码—>byte[0]=97、byte[1]=229、byte[2]=188、byte[3]=160(byte[0]=01100001、byte[1]=11100101、byte[2]=10111100、byte[3]=10100000)—>不编码“01100001111001011011110010100000” —>传输—>解析成为byte[]—>解码“a张”

     

    “a张”编码—>byte[0]=97、byte[1]=229、byte[2]=188、byte[3]=160(byte[0]=01100001、byte[1]=11100101、byte[2]=10111100、byte[3]=10100000)—>  base64 编码串—>传输—>解析成为byte[]—>解码“a张”

     

           更多的是,在转换字符串传输的过程,还要对这个byte[]进行编码。

    注1:在传输过程中,基础的byte[]类型还可以做各种编码传输,如base64字符串、16进制编码、xml、json、html等等,不过万变不离其中的是编码和解码。

    注2:“传输”时,还是以基础二进制数据传输,不过这和应用层无关,是传输层自动完成了,应用层的数据只需要处理自己的传输格式就可以了。

  • 相关阅读:
    关于表单提交的数据记录
    Hrbust 2363 Symmys (Manacher + DP)
    Codeforces 911F Tree Destruction(贪心 && 树的直径)
    Codeforces 903F Clear The Matrix(状态压缩DP)
    HDU 6229 Wandering Robots(2017 沈阳区域赛 M题,结论)
    Codeforces 912D Fishes (概率&期望,优先队列的应用)
    Codeforces 912E Prime Gift(预处理 + 双指针 + 二分答案)
    HDU 6251 Inkopolis(2017 CCPC-Final,I题,环套树 + 结论)
    HDU 6249 Alice’s Stamps(2017 CCPC-Final G题,DP)
    2017 ACM-ICPC EC-Final 记录
  • 原文地址:https://www.cnblogs.com/cuihongyu3503319/p/5031670.html
Copyright © 2011-2022 走看看