zoukankan      html  css  js  c++  java
  • php二进制组包pack和unpack

    参考:

    https://segmentfault.com/a/1190000018264262 (pack和unpack函数)

    https://segmentfault.com/a/1190000008305573(PHP中pack、unpack的详细用法)

    一,理解流的概念

    在c中流可分为两大类,即文本流和二进制流。

    1,所谓文本流是指在流中流动的数据是以字符形式出现。

    2,二进制流是指流动的是二进制数字序列,若流中有字符,则用一个字节的二进制ASCII码表示,若是数字,则用一个字节的二进制数标识。在流入流出时,对 符号不进行变换。

    计算机的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。

    二,pack函数

    用来将参数打包成二进制字符串,返回的是字符串

    string pack ( string $format [, mixed $args [, mixed $... ]] )

    举例:

    a和A(打包字符串,用NUL或者空格填充)
    $string = pack('a6', 'china');
    var_dump($string); //输出结果: string(6) "china",最后一个字节是不可见的NUL
    echo ord($string[5]); //输出结果: 0(ASCII码中0对应的就是nul)
    
    //A同理
    $string = pack('A6', 'china');
    var_dump($string); //输出结果: string(6) "china ",最后一个字节是空格
    echo ord($string[5]); //输出结果: 32(ASCII码中32对应的就是空格)
    
    h和H
    $string = pack('H3', 281);
    var_dump($string); //输出结果: string(2) "("
    
    for($i=0;$i<strlen($string);$i++) {
    echo ord($string[$i]) . PHP_EOL;
    }
    //输出结果: 40 16
    h和H需要特殊说明一下,它们是将对应的参数看做十六进制字符然后打包。什么意思呢?比如上面的281,打包前会将281转换为0x281,因为十六进制的一位对应二进制的四位,上面的0x281只有1.5个字节,后面会默认补0变成0x2810,0x28对应的十进制为40((),0x10对应的十进制为16(dle不可见字符)
    
    c和C
    $string = pack('c3', 67, 68, -1);
    var_dump($string); //输出:string(3) "CD�"
    
    for($i=0;$i<strlen($string);$i++) {
    echo ord($string[$i]) . PHP_EOL;
    }
    //输出: 67 68 225
    最后输出本能应该觉得是67 68 -1
    ord获取的是字符的ASCII码(范围0-255),这时-1(0000 0001)对应的字符将以补码的形式输出也就是255(1111 1110 + 0000 0001 = 1111 1111)
    
    整型相关
    所有的整型类型使用方法完全一样,主要注意它们的位和字节序就可以了,下面以L作为例子展示
    
    $string = pack('L', 123456789);
    var_dump($string); //输出:string(4) "�["
    
    for($i=0;$i<strlen($string);$i++) {
    echo ord($string[$i]) . PHP_EOL;
    }
    //输出: 21 205 91 7
    
    f和d
    $string = pack('f', 12345.123);
    var_dump($string);
    //输出:string(4) "~�@F"
    var_dump(unpack('f', $string)); //这里提前用到了unpack,后面会讲解
    //输出:float(12345.123046875)
    f和d是针对浮点数打包,至于为什么打包前是12345.123解包后是12345.123046875,这个和浮点数的储存有关系
    
    x、X、Z、@
    $string = pack('x'); //打包一个nul字符串
    echo ord($string); //输出: 0
    关于X(大写X),试了N次,没搞明白怎么用,有清楚的童鞋可以给我留言,多谢。
    
    $string = pack('Z2', 'abc5'); //其实就是将从Z后面的数字位置开始,全部设置为nul
    var_dump($string); //输出:string(2) "a"
    
    for($i=0;$i<strlen($string);$i++) {
    echo ord($string[$i]) . PHP_EOL;
    }
    //输出: 97 0
    $string = pack('@4'); //我理解为填充N个nul
    var_dump($string); //输出: string(4) ""
    
    for($i=0;$i<strlen($string);$i++) {
    echo ord($string[$i]) . PHP_EOL;
    }
    //输出: 0 0 0 0

    三,unpack

    将二进制字符串解包返回一个参数数组

    array unpack ( string $format , string $data )

    unpack的使用相当简单,就是讲pack打包的数据解包,打包的时候用的什么参数,就用什么参数解包,具体使用懒得说了,列几个小例子

    $string = pack('L4', 1, 2, 3, 4);
    var_dump(unpack('L4', $string));
    //输出:
    array(4) {
    [1]=>
    int(1)
    [2]=>
    int(2)
    [3]=>
    int(3)
    [4]=>
    int(4)
    }
    
    $string = pack('L4', 1, 2, 3, 4);
    var_dump(unpack('Ll1/Ll2/Ll3/Ll4', $string)); //可以指定key,用/分割
    //输出:
    array(4) {
    ["l1"]=>
    int(1)
    ["l2"]=>
    int(2)
    ["l3"]=>
    int(3)
    ["l4"]=>
    int(4)
    }

    这两个函数到底有啥用途

    1,数据通信(通过二进制格式与其它语言通信)

    2,数据加密(如果不告诉第三方你的打包方式,对方解包的难度就相对很大)

    3,节省空间(比如比较大的数字按字符串储存会浪费很多空间,打包成二进制格式才需要4位<32位数字>

  • 相关阅读:
    神经网络梯度下降的推导
    在虚拟环境里安装TensorFlow-cpu完成Ng作业
    利用anaconda配置虚拟环境
    Java基础(三)面向对象(下)
    Java基础(二)面向对象(上)
    Java基础(一)
    《深入理解计算机系统》阅读笔记--程序的机器级表示(上)
    《深入理解计算机系统》阅读笔记--信息的表示和处理(下)
    《深入理解计算机系统》阅读笔记--信息的表示和处理(上)
    《深入理解计算机系统》阅读笔记--计算机系统漫游
  • 原文地址:https://www.cnblogs.com/tkzc2013/p/13897908.html
Copyright © 2011-2022 走看看