zoukankan      html  css  js  c++  java
  • php中序列化与反序列化

    解析PHP多种序列化与反序列化的方法

    序列化是将变量转换为可保存或传输的字符串的过程;反序列化就是在适当的时候把这个字符串再转化成原来的变量使用。这两个过程结合起来,可以轻松地存储和传输数据,使程序更具维护性。
    1. serialize和unserialize函数
    这两个是序列化和反序列化PHP中数据的常用函数。

    复制代码代码如下:

    <?php
    $a = array('a'=> 'Apple' ,'b' => 'banana', 'c' => 'Coconut');
    //序列化数组
    $s = serialize($a);
    echo $s;
    //输出结果:a:3:{s:1:"a";s:5:"Apple";s:1:"b";s:6:"banana";s:1:"c";s:7:"Coconut";}
    echo '<br /><br />';
    //反序列化
    $o = unserialize($s);
    print_r($o);
    //输出结果 Array ( [a] => Apple [b] => banana [c] => Coconut )
    ?>


    当数组值包含如双引号、单引号或冒号等字符时,它们被反序列化后,可能会出现问题。为了克服这个问题,一个巧妙的技巧是使用base64_encode和base64_decode。

    复制代码代码如下:

    $obj = array();
    //序列化
    $s = base64_encode(serialize($obj));
    //反序列化
    $original = unserialize(base64_decode($s));
    但是base64编码将增加字符串的长度。为了克服这个问题,可以和gzcompress一起使用。
    //定义一个用来序列化对象的函数
    function my_serialize($obj )
    {
       returnbase64_encode(gzcompress(serialize($obj)));
    }
    //反序列化
    function my_unserialize($txt)
    {
       returnunserialize(gzuncompress(base64_decode($txt)));
    }


    2. json_encode 和 json_decode
    使用JSON格式序列化和反序列化是一个不错的选择: 
        使用json_encode和json_decode格式输出要serialize和unserialize格式快得多。
        JSON格式是可读的。
        JSON格式比serialize返回数据结果小。
        JSON格式是开放的、可移植的。其他语言也可以使用它。

    复制代码代码如下:

    $a = array('a'=> 'Apple' ,'b' => 'banana', 'c' => 'Coconut');

    //序列化数组
    $s = json_encode($a);
    echo $s;
    //输出结果:{"a":"Apple","b":"banana","c":"Coconut"}
    echo '<br /><br />';
    //反序列化
    $o = json_decode($s);


    在上面的例子中,json_encode输出长度比上个例子中serialize输出长度显然要短。
    3. var_export 和 eval
    var_export 函数把变量作为一个字符串输出;eval把字符串当成PHP代码来执行,反序列化得到最初变量的内容。

    复制代码代码如下:

    $a = array('a'=> 'Apple' ,'b' => 'banana', 'c' => 'Coconut');

    //序列化数组
    $s = var_export($a, true);
    echo $s;
    //输出结果: array ( 'a' => 'Apple', 'b' => 'banana', 'c' => 'Coconut', )
    echo '<br /><br />';
    //反序列化
    eval('$my_var='. $s . ';');
    print_r($my_var);


    4. wddx_serialize_value 和 wddx deserialize
    wddx_serialize_value函数可以序列化数组变量,并以XML字符串形式输出。 

    复制代码代码如下:

    $a = array('a'=> 'Apple' ,'b' => 'banana', 'c' => 'Coconut');

    //序列化数组
    $s = wddx_serialize_value($a);
    echo $s;
    //输出结果(查看输出字符串的源码):<wddxPacket version='1.0'><header/><data><struct><var name='a'><string>Apple</string></var><var name='b'><string>banana</string></var><var name='c'><string>Coconut</string></var></struct></data></wddxPacket>
    echo '<br /><br />';
    //反序列化
    $o = wddx_deserialize($s);
    print_r($o);
    //输出结果:Array ( [a] => Apple [b] => banana 1 => Coconut )


    可以看出,XML标签字符较多,导致这种格式的序列化还是占了很多空间。
    小结
    上述所有的函数在序列化数组变量时都能正常执行,但运用到对象就不同了。例如json_encode序列化对象就会失败。反序列化对象时,unserialize和eval将有不同的效果。

    转自:http://qing.weibo.com/tag/unserialize

    把复杂的数据类型压缩到一个字符串中

    serialize() 把变量和它们的值编码成文本形式
    unserialize() 恢复原先变量
    eg:
    $stooges = array('Moe','Larry','Curly');
    $new = serialize($stooges);
    print_r($new);echo "<br />";
    print_r(unserialize($new));
    结果:a:3:{i:0;s:3:"Moe";i:1;s:5:"Larry";i:2;s:5:"Curly";}
    Array ( [0] => Moe [1] => Larry [2] => Curly )
    当把这些序列化的数据放在URL中在页面之间会传递时,需要对这些数据调用urlencode(),以确保在其中的URL元字符进行处理:
    $shopping = array('Poppy seed bagel' => 2,'Plain Bagel' =>1,'Lox' =>4);
    echo '<a href="next.php?cart='.urlencode(serialize($shopping)).'">next</a>';
    margic_quotes_gpc和magic_quotes_runtime配置项的设置会影响传递到unserialize()中的数据。
    如果magic_quotes_gpc项是启用的,那么在URL、POST变量以及cookies中传递的数据在反序列化之前必须用stripslashes()进行处理:
    $new_cart = unserialize(stripslashes($cart)); //如果magic_quotes_gpc开启
    $new_cart = unserialize($cart);
    如果magic_quotes_runtime是启用的,那么在向文件中写入序列化的数据之前必须用addslashes()进行处理,而在读取它们之前则必须用stripslashes()进行处理:
    复制代码
    $fp = fopen('/tmp/cart','w');
    fputs($fp,addslashes(serialize($a)));
    fclose($fp);
    //如果magic_quotes_runtime开启
    $new_cat = unserialize(stripslashes(file_get_contents('/tmp/cart')));
    //如果magic_quotes_runtime关闭
    $new_cat = unserialize(file_get_contents('/tmp/cart'));
    在启用了magic_quotes_runtime的情况下,从数据库中读取序列化的数据也必须经过stripslashes()的处理,保存到数据库中的序列化数据必须要经过addslashes()的处理,以便能够适当地存储。
    mysql_query("insert into cart(id,data) values(1,'".addslashes(serialize($cart))."')");
    $rs = mysql_query('select data from cart where id=1');
    $ob = mysql_fetch_object($rs);
    //如果magic_quotes_runtime开启
    $new_cart = unserialize(stripslashes($ob->data));
    //如果magic_quotes_runtime关闭
    $new_cart = unserialize($ob->data);
    复制代码
    当对一个对象进行反序列化操作时,PHP会自动地调用其__wakeUp()方法。这样就使得对象能够重新建立起序列化时未能保留的各种状态。例如:数据库连接等。
  • 相关阅读:
    redis主从模式
    深入理解BigDecimal
    double使用BigDecimal进行计算出现精确度问题
    代理IP爬取和验证(快代理&西刺代理)
    Jsoup-简单爬取知乎推荐页面(附:get_agent())
    Jsoup-基础练习
    取数据超过内存限制的问题-解决方案(sample,takeSample,filter)
    说出你的故事:你为什么学爬虫
    hadoop第一次面到hr(品友互动)
    MapReduce本地运行模式wordcount实例(附:MapReduce原理简析)
  • 原文地址:https://www.cnblogs.com/bluealine/p/6061613.html
Copyright © 2011-2022 走看看