zoukankan      html  css  js  c++  java
  • python's twenty-fifth day for me 模块

    模块:

      py文件就是模块。

      python之所以好用,因为模块多。

      内置模块:python安装的时候自带的。

      扩展模块:别人写好的,需要安装后可直接使用。

      自定义模块:自己写的模块。

    序列化模块:

        能存储在文件中的一定是字符串或者字节,能在网络上传输的只有字节。

        序列化:就是创造一个序列(字符串)。

    python中的序列化模块:

        json:所有的编程语言都通用的序列格式。

            它支持的数据类型非常有限,数字,字符串,列表,字典。

        pickle:只能在python语言的程序之间传递数据用的。

            pickle支持python中的所有数据类型。

        shelve:python3x之后才有的。

    json模块:识别不了元祖类型,会将元组类型直接转换成列表类型。

      dumps:序列化,loads:反序列化

    import json
    dic = {'顾清秋':(175,70,'Music')}
    ret = json.dumps(dic,ensure_ascii=False)    # dump 将字典序列化
    print(ret,type(ret))        # {"顾清秋": [175, 70, "Music"]} <class 'str'>
    res = json.loads(ret)       # loads  反序列化
    print(res,type(res))        # {'顾清秋': [175, 70, 'Music']} <class 'dict'>

      dump 和 load 是直接将对象序列化后写入文件。依赖一个文件句柄。

    import json
    dic = {'顾清秋':(175,70,'Music')}
    f = open('log',encoding='utf-8',mode='w')   # 打开一个文件以‘w’模式
    json.dump(dic,f,ensure_ascii=False) # 先接受序列化对象,在接受文件句柄
    f.close()
    f = open('log',encoding='utf-8')    # 以'r'模式打开一个文件
    content = json.load(f)
    print(content)  # {'顾清秋': [175, 70, 'Music']}

       写入多个字典时:

    import json
    dic1 = {'顾清秋':(175,70,'Music')}
    dic2 = {'顾小白':(175,70,'Music')}
    dic3 = {'懒笨呆':(175,70,'Music')}
    f = open('log2',encoding='utf-8',mode='a')
    #  先序列化,再逐个写入文件
    str1 = json.dumps(dic1)     
    f.write(str1+'
    ')
    str2 = json.dumps(dic2)
    f.write(str2+'
    ')
    str3 = json.dumps(dic3)
    f.write(str3+'
    ')
    f.close()
    f = open('log2',encoding='utf-8')
    # 用for循环读取
    for line in f:
        print(json.loads(line.strip()))     # 用loads(反序列化) 打印出原类型
    f.close()
    # {'顾清秋': [175, 70, 'Music']}
    # {'顾小白': [175, 70, 'Music']}
    # {'懒笨呆': [175, 70, 'Music']}

     dumps 序列化,loads 反序列化:之在内存中操作数据,主要用于网络传输。

    dump 序列化,load 反序列化:主要用于一个数据直接存在文件里--直接和文件打交道。

    json不支持元组 不支持除了str数据类型之外的key:

    import json
    dic = {(175,70,'Music'):'顾清秋'}  # 以元祖为键,json不支持元祖。
    ret = json.dumps(dic)
    print(ret)
    # TypeError: keys must be a string

     pickle模块:可识别元祖。

      dumps : 序列化后是一个bytes类型。

      loads:反序列化转回原类型。

    import pickle
    dic = {'顾清秋': (175, 70, 'Music')}
    ret = pickle.dumps(dic)     # 序列化结果:不是一个可读的字符串,而是一个bytes类型。
    print(ret)
    res = pickle.loads(ret)
    print(res)  # {'顾清秋': (175, 70, 'Music')}

       dump 和 load:

    import pickle
    dic = {'顾清秋': (175, 70, 'Music')}
    f =  open('log2','wb')  #  以wb模式就无需编码(不用写encoding='utf-8')
    pickle.dump(dic,f)      # 序列化成bytes类型写入文件
    f.close()
    f = open('log2','rb')   # 读取是以rb模式。
    content = pickle.load(f) 
    print(content)      # {'顾清秋': (175, 70, 'Music')}
    f.close()

      写入多行:

    import pickle
    dic1 = {'顾清秋':(175,70,'Music')}
    dic2 = {'顾小白':(175,70,'Music')}
    dic3 = {'懒笨呆':(175,70,'Music')}
    f = open('log','wb')
    pickle.dump(dic1,f)
    pickle.dump(dic2,f)
    pickle.dump(dic3,f)
    f.close()
    f = open('log','rb')
    while True:
        try:
            print(pickle.load(f))
        except:
            break
    # {'顾清秋': (175, 70, 'Music')}
    # {'顾小白': (175, 70, 'Music')}
    # {'懒笨呆': (175, 70, 'Music')}

    关于序列化自定义类的对象:

    import pickle
    class A:
        def __init__(self,name,age):
            self.name = name
            self.age = age
    a = A('顾清秋',17)
    f =  open('顾清秋','wb')
    pickle.dump(a,f)
    f.close()
    f = open('顾清秋','rb')
    content = pickle.load(f)
    print(content)  # <__main__.A object at 0x000001D0FE619828>
    print(content.__dict__)     # {'name': '顾清秋', 'age': 17}
    f.close()

    模块 shelve:

      python 专有的序列化模块,只针对文件。

      

    import shelve
    f = shelve.open('shelve_file')   # 打开文件
    f['key'] = {'int': 10,'float':9.5,'strig':'Sample data'} # 直接对文件句柄操作,就可以存入数据。
    f.close()
    f1 = shelve.open('shelve_file')
    existing = f1['key'] # 取数据的时候也只需要直接用key获取即可,但如果key不存在会报错。
    f1.close()
    print(existing)

      设置只读方式:flag = ‘r’

    import shelve
    f = shelve.open('shelve_file',flag = 'r')
    existing = f['key']
    # f['key']['int'] = 50    # 不能修改已有结构中的值
    # f['key']['new'] = 'new' # 不能再已有的结构中添加新的项。
    f['key'] = 'new'    # 但是可以覆盖原来的结构
    f.close()
    print(existing)

      写入:writeback = True

    import shelve
    f = shelve.open('shelve_file',writeback = True)
    f['key'] = {'name':'顾小白','age':17}
    f['key']['hobby'] = 'Music'
    f.close()
    f = shelve.open('shelve_file',flag='r')
    content1 = f['key']
    print(content1)     #  {'hobby': 'Music', 'name': '顾小白', 'age': 17}
    f.close()

    hashlib——摘要算法:

      也是算法的集合,有好多算法。

      字符串——> 数字

      不同的字符串--->数字一定不同。

      无论在哪台机器上,在什么时候计算,对相同的字符串,结果总是一样的。

      摘要的过程不可逆。

      用法:

        1,文件的一致性校验。2,密文验证的时候加密。

      密文验证的时候加密:

      md5算法:通用的算法。

      sha算法:安全系数更高,sha算法有很多种,后面的数字越大,安全系数越高,

            得到的数字结果越长,计算的时间越长。

    import hashlib
    m = hashlib.md5()
    m.update('alex3714'.encode('utf-8'))
    print(m.hexdigest())        # aee949757a2e698417463d47acac93df    # 16进制的数字

      为了防止暴力破解和撞库:

        加盐:  

    import hashlib
    # m = hashlib.md5()
    m = hashlib.md5('guxiaobai'.encode('utf-8'))
    m.update('123456'.encode('utf-8'))
    print(m.hexdigest())    # b25cc83ffee9268a80c0c32e107d1ad5

        动态加盐:

    import hashlib
    username = input('>>>')
    password = input('*>>>')
    m = hashlib.md5(username.encode('utf-8'))
    m.update(password.encode('utf-8'))
    print(m.hexdigest())

         文件的一致性校验:

          一段字符串直接进行摘要和分成几段摘要的结果是相同的。

    import hashlib
    md5_obj = hashlib.md5()
    md5_obj.update(b'hello world')
    print(md5_obj.hexdigest())  # 5eb63bbbe01eeed093cb22bb8f5acdc3
    m = hashlib.md5()
    m.update(b'hello ')
    m.update(b'world')
    print(m.hexdigest())        # 5eb63bbbe01eeed093cb22bb8f5acdc3
    # 一段字符串直接惊醒摘要和分成几段摘要的结果是相同的。

          对文件进行校验,如果两个文件的内容一致,则摘要的结果是一致的。

    import hashlib
    def check(filename):
        m = hashlib.md5()
        with open(filename,'rb') as f:
            content = f.read()
            m.update(content)
            return m.hexdigest()
    
    print(check('log1'))    # 7fc983869a79c4e549268f47bbdc971b
    print(check('log2'))    # 7fc983869a79c4e549268f47bbdc971b
    print(check('log1') == check('log2'))   # True
  • 相关阅读:
    05-Selenium的三种等待
    04-selenium 八大元素定位方法
    03-Selenium简单操作
    python-利用json模块处理json数据几个函数总结
    python-利用pymysql获取数据简单使用总结
    python-利用faker模块生成测试数据
    python-利用random模块生成测试数据封装方法总结
    python-利用shutil模块rmtree方法可以将文件及其文件夹下的内容删除
    pytest--配置用例执行顺序(pytest_ordering插件介绍)
    pytest--mark基本使用(主要通过pytest.ini文件注册标签名,对用例进行标记分组)
  • 原文地址:https://www.cnblogs.com/stfei/p/8892055.html
Copyright © 2011-2022 走看看