zoukankan      html  css  js  c++  java
  • python 内置模块

    一、序列号模块(*****)

      1.1 什么是序列化,反序列化 

    #   序列化: 把内存中的数据转化成一种中间的格式(json或pickle),然后存放在硬盘中,永久保存
    #   反序列化:从硬盘中读出(json或pickle)格式,然后反解成python 的数据类型

      1.2 为什么要使用序列化

    #   1、数据格式的持久化
    #   2、跨平台交互

      1.3 如何使用序列化

    import json
    
    dict = {'name':'jmz','age':23,'sex':'boy','school':{'small_school':'lala','middle_school':'chajj school'}}
    
    
    with open('json.txt','w',encoding='utf-8') as f:
        f.write(json.dumps(dict))
        # json.dump(dict,f)     # 这是上面的简写
    
    
    with open('json.txt','r',encoding='utf-8') as f:
        res = json.loads(f.readline())
        # res = json.load(f)        # 上面的简写
    
    
    print(res['name'])
    json_mod.py
    import pickle               
                                
    def func(name):             
        print(name)             
                                
    dict = {'name':'jmz','school
                                
    with open('pick.pkl','wb') a
        # pickle 只保存 bytes 类型的数据
        f.write(pickle.dumps(dic
        # pickle.dump(dict,f)   
                                
    with open('pick.pkl','rb') a
        res = pickle.loads(f.rea
        # res = pickle.load(f)  
                                
    print(res)                  
    res['func'](res['name'])    
    pickle_mod

      1.4 总结

    # json:
    #       优点:所有的语言都支持json
    #       缺点:只支持 部分的python 数据类型
    
    # pickle:
    #       优点:支持所有的python 数据类型
    #       缺点:只有python 语言支持
    
    # 注意:
        # pickle 在保存数据时,只保存bytes类型,在转化成pickle 时已是bytes类型了

      

    二、hash模块(*****)

       2.1 什么是hash

    #   hash 是一种算法,该算法是用来效验数据内容的
    #   多数用来加密数据,保证数据的安全。

      2.2 怎么使用

    import hashlib
    
    m1= hashlib.md5()                   # 创建 一个md5的工厂
    m1.update('中文'.encode('utf-8'))    # 向 工厂中添加内容   # 注意内容必须是 bytes类型
    print(m1.hexdigest())               # 得到hash 结果,md5 是固定32位的 hash算法加密
    
    
    
    
    m2 = hashlib.sha512()
    m2.update(b'hello')
    m2.update(b'jmz')
    m2.update(b'shanghai')
    m2.update(b'haha')
    print(m2.hexdigest())     # sha512 是可变长的 hash算法加密
    hash_mod.py

      2.3 流程

    # 流程:
    #     1、创建一个hash 工厂(hashlib.XXX())
    #     2、向工厂中添加 bytes 数据。      一定要是 bytes 数据类型
    #     3、得出hash算法后结果  

    三、日志模块(*****)

      3.1 错误级别

    # 1、debug   10 调试错误
    # 2、info    20 提示错误
    # 3、warning 30 警告错误
    # 4、error   40 错误
    # 5、critical 50 致命错误

       3.2 日志基础使用(了解)

    import logging
    logging.basicConfig(
        filename='access.log',
        format = '%(asctime)s - %(name)s -%(levelname)s -%(module)s:%(message)s',
        datefmt='%Y-%m-%d %X',
        level=10,       # 可以接受的至少什么等级的错误
    )
    
    
    
    logging.debug('这是一个调试错误')
    logging.info('这是一个info错误')
    logging.warning('这是一个warining错误')
    logging.error('这是一个error错误')
    logging.critical('这是一个critical错误')
    
    
    # 中文错误在文件的编码使用的是系统的默认编码
    简单运用,只做了解

      3.3 日志原理(项目中不推荐使用,需了解)

    #logger:产生日志的对象
    
    #Filter:过滤日志的对象
    
    #Handler:接收日志然后控制打印到不同的地方,FileHandler用来打印到文件中,StreamHandler用来打印到终端
    
    #Formatter对象:可以定制不同的日志格式对象,然后绑定给不同的Handler对象使用,以此来控制不同的Handler的日志格式
    #!/usr/bin/env python
    # -*- coding:utf-8 -*-
    # Author Jmz
    
    import logging
    
    # logger对象: 生成对象,产生atm日志
    logger1=logging.getLogger('atm')
    
    
    # handle对象, 控制日志内容的去向,文件or终端
    #      FileHandler 文件
    #      StreamHandler 终端
    a1=logging.FileHandler('a1.log',encoding='utf-8')
    a2=logging.FileHandler('a2.log',encoding='utf-8')
    ch = logging.StreamHandler()
    
    # 建立 logger 和 handle 之间的绑定关系
    logger1.addHandler(a1)
    logger1.addHandler(a2)
    logger1.addHandler(ch)
    
    
    # Formatter 对象: 定制日志格式
    format1 = logging.Formatter('%(asctime)s - %(name)s -%(levelname)s -%(module)s:%(message)s',datefmt='%Y-%m-%d %X')
    format2 = logging.Formatter('%(asctime)s-%(module)s:%(message)s',datefmt='%Y-%m-%d %X')
    
    # 为handle对象定制 日志格式
    a1.setFormatter(format1)
    a2.setFormatter(format2)
    
    
    # 设置 保存 错误的级别     先 logger  后a1 or a2    # 先顶级过滤 logger 后 才是handle过滤
    logger1.setLevel(10)
    a1.setLevel(20)
    a2.setLevel(30)
    
    
    
    
    # 输出错误
    logger1.debug('这是一个bug错误')
    logger1.error('这是一个error错误')
    logger1.info('这是一个info错误')
    企业项目中一般不使用,但须知原理
    format参数中可能用到的格式化串:
    %(name)s Logger的名字
    %(levelno)s 数字形式的日志级别
    %(levelname)s 文本形式的日志级别
    %(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
    %(filename)s 调用日志输出函数的模块的文件名
    %(module)s 调用日志输出函数的模块名
    %(funcName)s 调用日志输出函数的函数名
    %(lineno)d 调用日志输出函数的语句所在的代码行
    %(created)f 当前时间,用UNIX标准的表示时间的浮 点数表示
    %(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数
    %(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
    %(thread)d 线程ID。可能没有
    %(threadName)s 线程名。可能没有
    %(process)d 进程ID。可能没有
    %(message)s用户输出的消息
    日志格式化串

      原理图

      3.4 日志记录,公司常用

    #!/usr/bin/env python
    # -*- coding:utf-8 -*-
    # Author Jmz
    
    """
    logging配置
    """
    
    import os
    import logging.config
    
    # 定义三种日志输出格式 开始
    
    standard_format = '[%(asctime)s][%(threadName)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lineno)d]' 
                      '[%(levelname)s][%(message)s]' #其中name为getlogger指定的名字
    
    simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s'
    
    id_simple_format = '[%(levelname)s][%(asctime)s] %(message)s'
    
    # 定义日志输出格式 结束
    
    logfile_dir = os.path.dirname(os.path.abspath(__file__))  # log文件的目录
    
    logfile_name = 'all2.log'  # log文件名
    
    # 如果不存在定义的日志目录就创建一个
    if not os.path.isdir(logfile_dir):
        os.mkdir(logfile_dir)
    
    # log文件的全路径
    logfile_path = os.path.join(logfile_dir, logfile_name)
    
    # log配置字典
    LOGGING_DIC = {
        'version': 1,
        'disable_existing_loggers': False,
        'formatters': {
            'standard': {
                'format': standard_format
            },
            'simple': {
                'format': simple_format
            },
        },
        'filters': {},
        'handlers': {
            #打印到终端的日志
            'console': {
                'level': 'DEBUG',
                'class': 'logging.StreamHandler',  # 打印到屏幕
                'formatter': 'simple'
            },
            #打印到文件的日志,收集info及以上的日志
            'default': {
                'level': 'DEBUG',
                'class': 'logging.handlers.RotatingFileHandler',  # 保存到文件
                'formatter': 'standard',
                'filename': logfile_path,  # 日志文件
                'maxBytes': 1024*1024*5,  # 日志大小 5M
                'backupCount': 5,
                'encoding': 'utf-8',  # 日志文件的编码,再也不用担心中文log乱码了
            },
        },
        'loggers': {
            #logging.getLogger(__name__)拿到的logger配置
            '': {
                'handlers': ['default', 'console'],  # 这里把上面定义的两个handler都加上,即log数据既写入文件又打印到屏幕
                'level': 'DEBUG',
                'propagate': True,  # 向上(更高level的logger)传递
            },
        },
    }
    
    
    def load_my_logging_cfg():
        logging.config.dictConfig(LOGGING_DIC)  # 导入上面定义的logging配置
        logger = logging.getLogger(__name__)  # 生成一个log实例
        logger.info('It works!')  # 记录该文件的运行状态
    
    if __name__ == '__main__':
        load_my_logging_cfg()
    通过配置,设置日志

    四、正则模块(*****)

      4.1 正则方法

    _compile(pattern, flags)           # 匹配正则
    
    search(pattern,[string,],flags=0)  ===> _compile(pattern, flags).search(string)
        # 查找符合正则规则的pattern的string,
        # 存在返回 匹配对象,不存在返回None
    re.search(pattern,string).group()  # 返回第一个匹配到的结果,没有匹配则报错
    
    split(pattern,string,maxsplit=0)   # 以pattern 分割 string,并确认分割maxsplit份。默认分割全部,返回分割后的新列表
    
    sub(pattern,repl,string)      # 在string 将匹配(pattern)到的内容替换成repl 返回替换后的结果
    
    findall(pattern,string)    # 在 string 在 匹配到所有的pattern ,返回 列表
    
    match(pattern,string)      # 在string的起始位置开始匹配pattern,存在返回对象,不存在,返回None
    re.match(pattern,string).group(1)   # 返回匹配到的下标为1的结果,下标为0则为本身

      4.2 举例使用方式

    import re
    content = 'asd3fdsjk43dsndf'
    print(re.findall('d',content))
    # ['3', '4', '3']
    findall.py
    import re
    
    test = '+-dsad-+dsa--dd++'
    print(re.sub('+-','-',test))
    # -dsad-+dsa--dd++
    sub.py
    import re
    
    a = '23dasd2321dasdf3'
    
    # search().group() 只取都第一个
    print(re.search('d',a).group())
    # 2
    
    #单纯使用search 可以确认是否存在值,存在为真 不存在为假
    if re.search('d',a):
        print('ok')
    else:
        print('no')
    # ok
    search.py
    import re
    
    a = 'sda123dsa432'
    
    # 已什么作为分割点,分割,  1 别是分割1次
    res = re.split('d',a,1)
    print(res)
    # ['sda', '23dsa432']
    split.py
    import re
    content = 'jmz3s4[22],[3],[dsada]'
    
    res = re.match('.*?[(.*?)].*?[(.*?)].*?[(.*?)]',content)
    
    print(res.group())    # jmz3s4[22],[3],[dsada]
    print(res.group(1))   # 22
    print(res.group(2))   # 3
    print(res.group(3))   # dsada
    match.py

    五、os模块(*****)

      os模块是与操作系统交互的一个接口

    os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
    os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd
    os.curdir  返回当前目录: ('.')
    os.pardir  获取当前目录的父目录字符串名:('..')
    os.makedirs('dirname1/dirname2')    可生成多层递归目录
    os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
    os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname
    os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
    os.listdir('dirname')    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
    os.remove()  删除一个文件
    os.rename("oldname","newname")  重命名文件/目录
    os.stat('path/filename')  获取文件/目录信息
    os.sep    输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"
    os.linesep    输出当前平台使用的行终止符,win下为"	
    ",Linux下为"
    "
    os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
    os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
    os.system("bash command")  运行shell命令,直接显示
    os.environ  获取系统环境变量
    os.path.abspath(path)  返回path规范化的绝对路径
    os.path.split(path)  将path分割成目录和文件名二元组返回
    os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
    os.path.basename(path)  返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素
    os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
    os.path.isabs(path)  如果path是绝对路径,返回True
    os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
    os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
    os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
    os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间
    os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
    os.path.getsize(path) 返回path的大小
    os模块的方法
    在Linux和Mac平台上,该函数会原样返回path,在windows平台上会将路径中所有字符转换为小写,并将所有斜杠转换为饭斜杠。
    >>> os.path.normcase('c:/windows\system32\')   
    'c:\windows\system32\'   
       
    
    规范化路径,如..和/
    >>> os.path.normpath('c://windows\System32\../Temp/')   
    'c:\windows\Temp'   
    
    >>> a='/Users/jieli/test1/\a1/\\aa.py/../..'
    >>> print(os.path.normpath(a))
    /Users/jieli/test1
    os路径处理
    #方式一:推荐使用
    import os
    #具体应用
    import os,sys
    possible_topdir = os.path.normpath(os.path.join(
        os.path.abspath(__file__),
        os.pardir, #上一级
        os.pardir,
        os.pardir
    ))
    sys.path.insert(0,possible_topdir)
    
    
    #方式二:不推荐使用
    os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

    六、sys模块(****)

    1  sys.argv           命令行参数List,第一个元素是程序本身路径
    2  sys.exit(n)        退出程序,正常退出时exit(0)
    3  sys.version        获取Python解释程序的版本信息
    4  sys.maxint         最大的Int值
    5  sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
    6  sys.platform       返回操作系统平台名称
    import time
    
    # print('
    [#          ]',end='')
    # time.sleep(0.3)
    # print('
    [###        ]',end='')
    # time.sleep(0.3)
    # print('
    [#######    ]',end='')
    # time.sleep(0.3)
    # print('
    [###########]',end='')
    
    # x = 0
    # while x <= 50:
    #     print('
    [%-50s] %d%%'%(x*'#',x//50*100),end='')    # %-50s  表示总共50个字符,不足以空格补充
    #     x+=10
    #     time.sleep(0.3)
    
    
    def proccess(x,width=40):
        if x > 1:
            x =1
        pro_format = ('[%%-%ds]'%width) %(int(x*width)*'#')  # '%%' 表示%
        res = '%s %d%%'%(pro_format,int(x*100))
        print('
     %s'%res,end='')
    
    start =0
    total = 10484
    while start <= total:
        start += 1024
        proccess(start/total)
        time.sleep(0.3)
    
    
    
    # 补充知识点 1
    #   在windows 中 
     表示光标移动至行首, 
     跳到下一行,光标不变
    #   linux 
     表示就是
    
    
    
    # 补充知识点2
    #   %-30s 表示共30个字符,不足以空格补充
    #   %% 表示%, 因为格式化操作 % 有特殊意义
    #   ('[%%-%ds]'%10)%('###')   ===> '[%-10s]'%('###')   ===> [###       ]
    打印进度条

      

    七、random 随机模块(*****)

    1 random.random()      # (0,1)     0-1 之间取不到0和1
    2 random.randint(2,5)   # [2,5]    取2与5之间的整数
    3 random.choice([1,2,['jmz','ggf'],'aa'])  # 在 [1,2,['jmz','ggf'],'aa'] 列表 中随机取一个返回
    4 random.sample([1,2,['jmz','ggf'],'aa'],2)  # 在 [1,2,['jmz','ggf'],'aa'] 列表中 随机取2个组成新的列表
    5 random.shuffle([1,2,['jmz','ggf'],'aa'])  # 将列表的下标打乱。
    6 random.uniform(4,6)        # (4,6) 取大于4小于6的小数
    方法
    import random
    print(random.random())       # (0,1)  去小数
    # 0.644271281361324
    
    print(random.randint(2,4))   # [2,4]
    # 4
    
    print(random.choice([1,2,3,['a','jmz']]))     # 在[1,2,3,['a','jmz']] 中随机取一个
    # 2
    
    print(random.sample([1,2,3,['a','jmz']],2))   # [1,2,3,['a','jmz']] 中取两个 组成 新历史列表
    # [3, 2]
    
    print(random.uniform(2,5))
    # 4.7414246822271595
    
    l = ['a','d',3,4,5]
    print(random.shuffle(l))   # None
    print(l)                   # ['d', 'a', 3, 5, 4]
    具体用法
    # ascii编码表 十进制数与字符的转化
    # chr()   ord()
    
    #  十进制 转 字符
    print(chr(43))
    
    # 字符装 十进制数
    print(ord('+'))
    import random
    def make_code_one():
        '''
        随机生成以为字符
        a-z A-Z 0-9
        :return:
        '''
        s1 = random.randint(ord('a'),ord('z'))
        s2 = random.randint(ord('A'),ord('Z'))
        s3 = random.randint(ord('0'),ord('9'))
        res = random.choice([s1,s2,s3])
        return chr(res)
    
    def make_code(n):
        res = ''
        for i in range(n):
            res = res + make_code_one()
        return res
    
    print(make_code(4))
    随机验证码生成

    八、time模块(*****)

      8.1 时间戳,结构化时间,格式化时间

    import time
    
    # 1、时间戳 以unix元年(1970-01-01 00:00:00)开始计算一直到当前时间的秒数
    print(time.time())
    # 1526911211.354357
    
    
    # 2、结构化时间
    print(time.localtime())  # 本地的结构化时间
    # time.struct_time(tm_year=2018, tm_mon=5, tm_mday=21, tm_hour=22, tm_min=0, tm_sec=11, tm_wday=0, tm_yday=141, tm_isdst=0)
    print(time.localtime().tm_year)
    # 2018
    print(time.gmtime())     # 世界的结构化时间
    # time.struct_time(tm_year=2018, tm_mon=5, tm_mday=21, tm_hour=14, tm_min=0, tm_sec=11, tm_wday=0, tm_yday=141, tm_isdst=0)
    
    
    # 3、格式化时间
    print(time.strftime('%Y-%m-%d %X'))
    # 2018-05-21 22:00:11

      8.2时间戳,结构化时间与格式化时间之间的相互转化

    # 1、时间戳  结构化时间  相互转化
    print(time.localtime(1526911211.354357))     # 时间戳转结构化时间
    # time.struct_time(tm_year=2018, tm_mon=5, tm_mday=21, tm_hour=22, tm_min=0, tm_sec=11, tm_wday=0, tm_yday=141, tm_isdst=0)
    
    print(time.mktime((2009, 2, 17, 17, 3, 38, 1, 48, 0)))    # 格式化时间转 时间戳
    # 1234861418.0
    
    # 2、结构化时间 格式化时间 相互转化
    print(time.strftime('%Y-%m-%d %X',(2009, 2, 17, 17, 3, 38, 1, 48, 0)))  # 结构化时间转 格式化时间
    # 2009-02-17 17:03:38
    print(time.strptime('2018-04-09 14:23:14','%Y-%m-%d %H:%M:%S'))   # 格式化时间转 结构化时间
    
    # 1.1   时间戳转结构化时间  ===> localtime,gmtime
    # 1.2   结构化时间转时间戳  ===> mktime
    
    # 2.1   结构化时间转格式化时间 ===> strftime
    # 2.2   格式化时间转结构化时间 ===> strptime 

      图解

    # time 模块没有之间进行时间戳与格式化时间的转换,但可以自己手写一个
    import time
    
    # 格式化时间转 时间戳
    def mktime(string,format):
        return time.mktime(time.strptime(string,format))
    
    # 时间戳转 格式化时间
    def date(format,strtime=time.time()):
        struct_time = time.localtime(strtime)
        return time.strftime(format,struct_time)
    
    print(mktime('2017-08-09 14:13:34','%Y-%m-%d %H:%M:%S'))
    # 1502259214.0
    
    
    print(date('%Y-%m-%d'))
    # 2018-05-21
    时间戳与格式化时间的转化
    %a    Locale’s abbreviated weekday name.     
    %A    Locale’s full weekday name.     
    %b    Locale’s abbreviated month name.     
    %B    Locale’s full month name.     
    %c    Locale’s appropriate date and time representation.     
    %d    Day of the month as a decimal number [01,31].     
    %H    Hour (24-hour clock) as a decimal number [00,23].     
    %I    Hour (12-hour clock) as a decimal number [01,12].     
    %j    Day of the year as a decimal number [001,366].     
    %m    Month as a decimal number [01,12].     
    %M    Minute as a decimal number [00,59].     
    %p    Locale’s equivalent of either AM or PM.    (1)
    %S    Second as a decimal number [00,61].    (2)
    %U    Week number of the year (Sunday as the first day of the week) as a decimal number [00,53]. All days in a new year preceding the first Sunday are considered to be in week 0.    (3)
    %w    Weekday as a decimal number [0(Sunday),6].     
    %W    Week number of the year (Monday as the first day of the week) as a decimal number [00,53]. All days in a new year preceding the first Monday are considered to be in week 0.    (3)
    %x    Locale’s appropriate date representation.     
    %X    Locale’s appropriate time representation.     
    %y    Year without century as a decimal number [00,99].     
    %Y    Year with century as a decimal number.     
    %z    Time zone offset indicating a positive or negative time difference from UTC/GMT of the form +HHMM or -HHMM, where H represents decimal hour digits and M represents decimal minute digits [-23:59, +23:59].     
    %Z    Time zone name (no characters if no time zone exists).     
    %%    A literal '%' character.
    时间格式

    九、datetime模块(*****)

    # datetime 就是基于time 模块发展而来,到用法更简单
    import datetime,time
    print(datetime.datetime.now())
    # 2018-05-21 22:52:39.542560
    
    print(datetime.date.fromtimestamp((time.time())))
    # 2018-05-21  时间转日期
    
    print(datetime.datetime.now() + datetime.timedelta(-3))
    print(datetime.datetime.now() - datetime.timedelta(3))
    # 2018-05-18 22:56:21.981011  上面两个的效果是 一样的  都是 在当天的基础上减3天
    
    print(datetime.datetime.now() + datetime.timedelta(hours=-3))
    print(datetime.datetime.now() - datetime.timedelta(hours=3))
    # 2018-05-21 19:58:22.163141   上面两个的效果是 一样的  都是 在当天的基础上减3小时
    
    print(datetime.datetime.now() + datetime.timedelta(minutes=30)) #当前时间+30分
    # 2018-05-21 23:29:06.690998
    
    c_time = datetime.datetime.now()
    print(c_time.replace(minute=30,hour=2,day=19))
    # 2018-05-19 02:30:19.485846

    十、configparser 模块(***) 

    # 用户对 ini 一类文件的读写操作
    # 一般使用与 对环境,或系统 配置文件的 读写操作
    import configparser
    config = configparser.ConfigParser()    #  生成object 对象
    config["DEFAULT"] = {'ServerAliveInterval': '45',
                         'Compression': 'yes',
                         'CompressionLevel': '9',
                         'time' : 12.34}
    
    config['bitbucket.org'] = {}
    config['bitbucket.org']['User'] = 'hg'
    config['topsecret.server.com'] = {}
    topsecret = config['topsecret.server.com']
    topsecret['Host Port'] = '50022'  # mutates the parser
    topsecret['ForwardX11'] = 'no'  # same here
    config['DEFAULT']['ForwardX11'] = 'yes'
    with open('example.ini', 'w') as configfile:
        config.write(configfile)
    写一个example.ini 的配置文件
    res = configparser.ConfigParser()
    res.read('example.ini')
    
    print(res.sections())
    print(res.options('topsecret.server.com'))
    
    print(res.get('bitbucket.org','forwardx11'))
    print(res.getint('bitbucket.org','CompressionLevel'))
    print(res.getfloat('bitbucket.org','time'))
    读 example.ini 配置文件

    十一、subprocess 模块(*****)

    # 看名字即知 和 子进程有关。
    # 主要使用:
    #     执行命令获取进程执行的结果保存。
    
    
    # 注意
    #       os模块 也可以执行命令 开启了一个进程,但是无法保存结果。
    import subprocess,time
    # 开启子进程执行
    res = subprocess.Popen('tasklist'
                           ,shell=True
                           # ,stdout=subprocess.PIPE          # 标准化输出
                           # ,stderr=subprocess.PIPE          # 错误输出
    )
    time.sleep(1)
    print(res)
    print(res.stdout.read().decode('gbk'))           # res.stdout.read() 拿到的是一个utf-8或者gbk的16进制码,这个是操作系统默认字符编码有关
    
    
    # 在没有stdout=subprocess.PIPE的情况下,子进程命令结果或直接输入到终端,能否正常显示,取决于该程序的结束时间是否大于子进程的结束时间,大于则显示,小于则来不急显示
    # 在有stdout=subprocess.PIPE的情况下,只有需要(res.stdout.read())是才会显示

    十二、shutil模块(***)

    # 高级的 文件、文件夹、压缩包 处理模块
    # 1、shutil.copyfileobj(fsrc, fdst[, length])
    # 将文件内容拷贝到另一个文件中
    #  shutil.copyfileobj(open('old.xml','r'), open('new.xml', 'w'))
    
    # 2、shutil.copyfile(src, dst) #拷贝文件
    
    # 3、shutil.copymode(src, dst) # 仅拷贝权限。内容、组、用户均不变
    
    # 4、shutil.copystat(src, dst) # 仅拷贝状态的信息,包括:mode bits, atime, mtime, flags
    
    # 5、shutil.copy(src, dst) # 拷贝文件和权限
    
    # 6、 shutil.copy2(src, dst) # 拷贝文件和状态信息
    
    # 7、shutil.copytree(src, dst, symlinks=False, ignore=None) #递归的去拷贝文件夹
    #   shutil.copytree('folder1', 'folder2', ignore=shutil.ignore_patterns('*.pyc', 'tmp*'))
    # #目标目录不能存在,注意对folder2目录父级目录要有可写权限,ignore的意思是排除
    
    
    # 8、shutil.rmtree(path[, ignore_errors[, onerror]]) # 递归的去删除文件
    
    # 9、shutil.move(src, dst) # mv 递归的去移动文件,它类似mv命令,其实就是重命名。
    
    # 10、shutil.make_archive(base_name, format,...)
    #    base_name: 压缩包的文件名,也可以是压缩包的路径。只是文件名时,则保存至当前目录,否则保存至指定路径,
    #    如 data_bak                       =>保存至当前路径
    #    如:/tmp/data_bak =>保存至/tmp/
    #    format:    压缩包种类,“zip”, “tar”, “bztar”,“gztar”
    #    root_dir:    要压缩的文件夹路径(默认当前目录)
    #    owner:    用户,默认当前用户
    #    group:    组,默认当前组
    #    logger:    用于记录日志,通常是logging.Logger对象
    # 压缩
    import shutil
    res =shutil.make_archive('a',format='zip')
    print(res)
    压缩
    # 解压
    import zipfile
    z= zipfile.ZipFile('a.zip','r')
    z.extractall('./a')
    z.close()
    解压

    shutil 压缩的原理就是通过zipfile,tarfile 进行压缩

    import zipfile
    
    # zip 压缩
    z = zipfile.ZipFile('a.zip','w')
    z.write('a.txt')
    z.write('index.py')
    z.close()
    
    
    # zip解压
    z = zipfile.ZipFile('a.zip','r')
    z.extractall('./a')
    z.close()
    zipfile
    import tarfile,os
    
    # 压缩
    t = tarfile.TarFile('a.tar','w')
    t.add('a.txt')
    t.close()
    
    # 解压
    t= tarfile.TarFile('a.tar','r')
    t.extractall('./a')
    t.close()
    tarfile

    十三、shelve模块(***)

    import shelve
    # shelve 比 pickle 更简单
    
    # 添加数据
    f= shelve.open(r'test')
    f['jmz'] = {'name':'jmz','age':25,'weight':175.3}
    f['jly'] = {'name':'jly','age':27,'weight':165.3}
    f.close()
    
    
    # 读和改
    f= shelve.open(r'test',writeback=True)         # 改变数据必须要加writeback=True,添加则不需要
    f['jmz']['age'] =35    # 改数据
    print(f['jmz'])
    f.close()

      

    十四、xml 模块(***)

    xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,但json使用起来更简单,不过,古时候,在json还没诞生的黑暗年代,大家只能选择用xml呀,至今很多传统公司如金融行业的很多系统的接口还主要是xml。

    xml的格式如下,就是通过<>节点来区别数据结构的:

    <?xml version="1.0"?>
    <data>
        <country name="Liechtenstein">
            <rank updated="yes">2</rank>
            <year>2008</year>
            <gdppc>141100</gdppc>
            <neighbor name="Austria" direction="E"/>
            <neighbor name="Switzerland" direction="W"/>
        </country>
        <country name="Singapore">
            <rank updated="yes">5</rank>
            <year>2011</year>
            <gdppc>59900</gdppc>
            <neighbor name="Malaysia" direction="N"/>
        </country>
        <country name="Panama">
            <rank updated="yes">69</rank>
            <year>2011</year>
            <gdppc>13600</gdppc>
            <neighbor name="Costa Rica" direction="W"/>
            <neighbor name="Colombia" direction="E"/>
        </country>
    </data>
    xml 数据结构

    xml协议在各个语言里的都 是支持的,在python中可以用以下模块操作xml:

    import xml.etree.ElementTree as ET
    
    tree = ET.parse('b.xml')
    root = tree.getroot()           # 获取内容主体
    print(root)
    
    print(tree.find('country'))         # 返回第一个country子节点元素
    print(tree.findall('country'))      # 返回所有的country子节点元素
    print(tree.iter('year'))            # 返回所有的 year 元素
    # 遍历
    for country in tree.findall('country'):
        rank = country.find('rank')
        print('%s-->%s-->%s'%(rank.tag,rank.attrib,rank.text))
    
    # tag 标签
    # attrib 获取的是元素的属性
    # text 获取元素的文本内容
    # {'updated': 'yes'}---->2
    # {'updated': 'yes'}---->5
    # {'updated': 'yes'}---->69
    
    
    
    
    
    # 增加元素
    country2 = ET.Element('country')    # 创建一个新元素
    country2.text='jmz'
    country2.attrib = {'updated':'yes','version':'1.0'}
    root.append(country2)     # 主体部分 添加一个新元素
    
    tree.write('new.xml',encoding='utf-8')    # tree
    
    
    
    # 修改
    for year in tree.iter('year'):
        year.text = str(2016)    # xml 必须是str类型
        year.set('updated','yes')
        year.set('version','1.0')
    
    tree.write('b.bat.xml')
    xml 操作
    import xml.etree.ElementTree as ET
    
    new_xml = ET.Element('namelist')
    name = ET.SubElement(new_xml,'jmz',attrib={'updated':'yes'})   # 创建子节点
    age = ET.SubElement(name,'age',attrib={'year':'1994'})
    age.text = 'jmz'
    sex = ET.SubElement(name,'sex',text='')
    sex.text = ''
    
    name2 = ET.SubElement(new_xml,'jly',attrib={'updated':'yes'})
    age2 = ET.SubElement(name2,'age',attrib={'year':'1994'})
    age2.text = 'jly'
    sex2 = ET.SubElement(name2,'sex')
    sex2.text = ''
    
    object = ET.Element('object')
    object.text = 'oldboy'
    object.attrib={'addr':'shanghai','time':'2018-01-01'}
    
    
    et=ET.ElementTree(new_xml)
    et.write('namelist.xml',encoding='utf-8',xml_declaration=True)
    
    ET.dump(new_xml)
    创建一个xml
  • 相关阅读:
    leetcode-----118. 杨辉三角
    leetcode-----117. 填充每个节点的下一个右侧节点指针 II
    leetcode-----116. 填充每个节点的下一个右侧节点指针
    leetcode-----115. 不同的子序列
    leetcode-----114. 二叉树展开为链表
    leetcode-----113. 路径总和 II
    leetcode-----112. 路径总和
    leetcode-----111. 二叉树的最小深度
    windows同时安装jdk7和jdk8
    使用乌龟Git连接github
  • 原文地址:https://www.cnblogs.com/xiaobaiskill/p/9053885.html
Copyright © 2011-2022 走看看