zoukankan      html  css  js  c++  java
  • python全栈开发-json和pickle模块(数据的序列化)

    一、什么是序列化?

      我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。

      为什么要序列化?

      1、持久保存状态

      需知一个软件/程序的执行就在处理一系列状态的变化,在编程语言中,'状态'会以各种各样有结构的数据类型(也可简单的理解为变量)的形式被保存在内存中。

    内存是无法永久保存数据的,当程序运行了一段时间,我们断电或者重启程序,内存中关于这个程序的之前一段时间的数据(有结构)都被清空了。

    在断电或重启程序之前将程序当前内存中所有的数据都保存下来(保存到文件中),以便于下次程序执行能够从文件中载入之前的数据,然后继续执行,这就是序列化。

    具体的来说,如,虚拟机状态的挂起等。

      2、跨平台数据交互

    序列化之后,不仅可以把序列化后的内容写入磁盘,还可以通过网络传输到别的机器上,如果收发的双方约定好实用一种序列化的格式,那么便打破了平台/语言差异化带来的限制,实现了跨平台数据交互。

    反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。

      如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。

    JSON表示的对象就是标准的JavaScript语言的对象,JSON和Python内置的数据类型对应如下:

    二、json序列化

    1、dumps序列化和loads反序列化

    dumps()序列化 

    import  json   #导入json模块
    
    info = {
         'name':"qianduoduo",
         "age":22,
    }
    with open("test.json","w") as f:  #以普通模式写入
    f.write(json.dumps(info)) #把内存对象转为字符串
    #写到文件中  
    #test.json文件中的内容
    {"name": "qianduoduo", "age": 22}

    loads()反序列化

    import json   #导入json模块
     
    with open("test.json","r") as f:  #以普通模式读
    data = json.loads(f.read())   #用loads反序列化
    print(data["age"])     #date.get("age")   一样的
    #输出
    22

    2、dump序列化和load反序列化

    dump()序列化

    import  json
     
    info = {
        'name':"qianduoduo",
         "age":22
    }
    with open("test.json","w") as f:   #文件以写的方式打开
      json.dump(info,f)    #第1个参数是内存的数据对象 ,第2个参数是文件句柄
    #test.json文件中的内容
    {"name": "qianduoduo", "age": 22}

     load()反序列化

    import json
     
    with open("text.txt","r") as f:   #以读的方式打开文件
      data = json.load(f)  #输入文件对象
    print(data.get("age"))   #date["age"]
    #输出
    22

    3、序列化函数(不支持的,直接报错)

    总结:

      1、dumps和loads是成对使用的,dump和load是成对使用的。

      2、dumps和loads由于序列化的是内容,所以后面要加s,但是dump和load序列化的内容是对象,所以单数。

      3、json只能处理简单的数据类型,例如:字典、列表、字符串等,不能处理函数等复杂的数据类型。

      为什么不能处理复杂的因为python 和别的语言定义函数,类完全不一样,特性也不一样

      4、json是所有语言通用的,所有语言都支持json,如果我们需要python跟其他语言进行数据交互,那么就用json格式。

    三、pickle序列化

    1、dumps序列化和loads反序列化

    dumps()序列化

    import pickle
     
    info = {
        'name':"qianduoduo",
        "age":22,
    } 
    with open("test.json","wb") as f:   #以二进制的形式写入
      data = pickle.dumps(info)   #序列化成字符串
      f.write(data)   #写入text.txt 文件中
    #输出到test.json文件中的内容   我们看不懂的二级制
    �}q (X   nameqX
    qianduoduoqX   ageqKu.

    loads()反序列化

    import pickle
    
    with open("text.txt","rb") as f: #以二进制的模式读
      data = pickle.loads(f.read())   #反序列化操作
    print(data.get("age"))    #date["age"]  是一样的
    #输出
    22

    2、dump序列化和load反序列化

    dump()序列化

    import pickle
    
    info = {
        'name':"qianduoduo",
        "age":22,
    }
    with open("text.txt","wb") as f:
      pickle.dump(info,f)  #序列化
    #输出
    �}q (X   nameqX
    qianduoduoqX   ageqKu.

    load()反序列化

    import pickle
    
    with open("text.txt","rb") as f:
      data = pickle.load(f)  #反序列化成内存对象
    print(data.get("age"))     #or   date["age"]  一样的
    #输出
    22

    3、序列化函数

    序列化

    import pickle
    
    def sayhi(name):   #函数
      print("hello:",name)
    info = {
       'name':"duoduo",
       "age":22,
       "func":sayhi    #"func"对应的值sayhi,是函数名  如果sayhi加()就执行这个函数
    }
    with open("test.json","wb") as f:
      data = pickle.dumps(info)
      f.write(data)
    #输出test.json
    �}q (X   nameqX
    qianduoduoqX   ageqKX   funcqc__main__
    sayhi

    反序列化

    import pickle
    
    def sayhi(name):   #在反序列化中必须写上此函数,不然会报错,因为在加载的时候,函数没有加载到内存
      print("hello:",name)
    
    with open("test.json","rb") as f:
      data = pickle.loads(f.read())
      print(data["age"])
    data.get("func")("qianduoduo")  #执行函数sayhi
    #输出
    22
    hello: qianduoduo   #输出的函数体中的逻辑也是可以变的,但是函数名必须要相同,这又是要注意的地方

     小结:

      1、json值支持简单的数据类型,pickle支持python所有的数据类型。

      2、pickle只能支持python本身的序列化和反序列化,不能用作和其他语言做数据交互,而json可以。

      3、pickle序列化的是整个的数据对象,所以反序列化函数时,函数体中的逻辑变了,是跟着新的函数体逻辑。

      4、pickle和json在3.0中只能dump一次和load一次,dump在2.7里面可以dump多次,load多次,anyway,以后只记住,只需要dump一次,load一次就可以了。

        Pickle的问题和所有其他编程语言特有的序列化问题一样,就是它只能用于Python,并且可能不同版本的Python彼此都不兼容,因此,只能用Pickle保存那些不重要的数据,不能成功地反序列化也没关系。

     
  • 相关阅读:
    Java基础16(Java8的其它新特性)
    Java基础15(反射机制)
    Java基础14(网络编程)
    tensorflow.keras
    递归算法
    tensorfolw学习笔记——张量、微分、自定义训练、keras
    python可变长参数、key-only参数之收集和解包参数
    20200909- 集群迁移记录
    20200909--记一次发布流程
    20200909----开发沟通提效记录
  • 原文地址:https://www.cnblogs.com/ManyQian/p/8733209.html
Copyright © 2011-2022 走看看