zoukankan      html  css  js  c++  java
  • 常用模块(一)

    collections模块

    在内置数据类型(dict,list,set,tuple)的基础上,collections模块还提供了额外
    的几个数据类型:Counter,deque,defaultdict,namedtuple和OrderedDict等
      1.namedtuple:生成可以使用名字来访问元素内容的tuple
      2.deque:双端队列,可以快速的从另外一侧追加和推出对象
      3.Counter:计算器,主要用来计数
      4.OrderredDict:有序字典
      5.defaultdict:带有默认值的字典

    namedtuple(具名元组)

    因为元组的局限性:不能为元组内部的数据进行命名,所以往往我们并不知道一个元组所要表达的意义,所以在这里引入了 collections.namedtuple 这个工厂函数,来构造一个带字段名的元组。具名元组的实例和普通元组消耗的内存一样多,因为字段名都被存在对应的类里面。这个类跟普通的对象实例比起来也要小一些,因为 Python 不会用 __dict__ 来存放这些实例的属性。下面来看看具名元组的实例:

    p = (1 , 2)

    突兀的出现这么一个tuple大家就很难了解它到底想要表达什么东西,而这个时候namedtuple就派上用场了:

    from collections import namedtuple
    point = namedtuple('point',['x','y'])
    p = point(1,2)
    print(p)
    >>>p.x
    out: 1
    >>>p.y
    out: 2

    加上一个'x','y'就很容易让人明白这是一个坐标

    类似的,如果要用坐标和半径表示一个圆,也可以用namedtuple定义:

    #namedtuple('名称', [属性list]):
    Circle = namedtuple('Circle', ['x', 'y', 'r'])

    ps:书写规范

      namedtuplr的小括号里 第一个是类名,第二个是类的各个字段的名字。后者可以是由数个字符串组成的可迭代对象,或者是由空格分隔开的字段名组成的字符串

    deque(双端队列)

    对于list这种线性存储的数据类型,插入和删除元素就很慢,于是deque这种高效实现插入和删除操作的双向列表就问世了,它的出现对于队列和栈的操作提供了一大便利

    from collections import deque
    q = deque(['a','b','c'])
    
    q.append(1)
    q.appendleft(2)
    print(q)
    out: deque([2, 'a', 'b', 'c', 1])
    """
    队列不应该支持任意位置插值
    只能在首尾插值(不能插队)
    """
    q.insert(0, '哈哈哈')
    print(q)
    out: deque(['哈哈哈', 2, 'a', 'b', 'c', 1])
    print(q.pop())  # 弹出右边第一个元素
    out: 1
    print(q.popleft())  # 弹出左边第一个元素
    out: 哈哈哈

    OrderredDict(有序字典)

    很多人认为python中的字典是无序的,因为它是按照hash来存储的,但是python中有个模块collections(英文,收集、集合),里面自带了一个子类

    OrderedDict,实现了对字典对象中元素的排序。请看下面的实例:

    from collections import OrderedDict
    print('Regular dictionary')
    d={}
    d['a']='A'
    d['b']='B'
    d['c']='C'
    for k,v in d.items():
        print(k,v)
    
    
    print( "
    Order dictionary")
    d1 =OrderedDict()
    d1['a'] = 'A'
    d1['b'] = 'B'
    d1['c'] = 'C'
    d1['1'] = '1'
    d1['2'] = '2'
    for k,v in d1.items():
        print(k,v)
    
    out:
    Regular dictionary
    a A
    c C
    b B
    
    Order dictionary
    a A
    b B
    c C
    1 1
    2 2

    可以看到,同样是保存了ABC等几个元素,但是使用OrderedDict会根据放入元素的先后顺序进行排序。所以输出的值是排好序的。

    意,OrderedDict的Key会按照插入的顺序排列,不是Key本身排序:

    d = OrderedDict()
    d['z'] = 1
    d['y'] = 2
    d['x'] = 3
    d.keys() # 按照插入的Key的顺序返回
    ['z', 'y', 'x']

    defaultdict(默认值字典)

    当我使用普通的字典时,用法一般是dict={},添加元素的只需要dict[element] =value即,调用的时候也是如此,dict[element] = xxx,但前提是element字典里,如果不在字典里就会报错,如:
                                              

    这时defaultdict就能派上用场了,defaultdict的作用是在于,当字典里的key不存在但被查找时,返回的不是keyError而是一个默认值.来看个例子:

    from collections import defaultdict
    s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
    
    d = defaultdict(list)
    for k, v in s:
        d[k].append(v)
    
    print(list(d.items()))

    输出:

    时间模块

    表示时间的三种方式

    在Python中,通常有这三种方式来表示时间:时间戳、元组(struct_time)、格式化的时间字符串:

    (1)时间戳(timestamp) :通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回的是float类型。

    (2)格式化的时间字符串(Format String): ‘1999-12-06’

    time模块

    1.time.sleep(secs)
    
    线程推迟指定的时间运行
    适合放在脚本里,定时sleep一会然后继续干啥
    
    while True:
        time.sleep(3)
        print time.strftime('%H:%M:%S')
    17:21:35
    17:21:38
    17:21:41
    17:21:44
    ……
    
    
    2.time.localtime([secs])
    
    将一个时间戳转换成一个当前时区的struct_time,如果seconds参数未输入,则以当前时间为转换标准
    未提供secs参数时,按当前时间为准
    In : time.localtime()
    Out: time.struct_time(tm_year=2014, tm_mon=8, tm_mday=14, tm_hour=17, tm_min=23, tm_sec=48, tm_wday=3, tm_yday=226, tm_isdst=0)
    
    提供secs为当前时间戳时
    In : time.time()
    Out: 1408008232.217969
    In : time.localtime(time.time())
    Out: time.struct_time(tm_year=2014, tm_mon=8, tm_mday=14, tm_hour=17, tm_min=24, tm_sec=2, tm_wday=3, tm_yday=226, tm_isdst=0)
    
    
    
    3.time.strftime(format[, t])
    
    将指定的struct_time(默认为当前时间),根据指定的格式化字符串输出
    t未指定,传入time.localtime()作为默认参数:
    In : time.strftime('%Y-%m-%d %H:%M:%S')
    Out: '2014-08-14 17:28:16’
    
    指定t为time.localtime(1407945600.0)时:
    In : time.localtime(1407945600.0)
    Out: time.struct_time(tm_year=2014, tm_mon=8, tm_mday=14, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=226, tm_isdst=0)
    
    In : time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(1407945600.0))
    Out: '2014-08-14 00:00:00’
    
    
    
    4.time.time()
    
    返回当前时间的时间戳
    In : time.time()
    Out: 1408008711.730218
    
    5.time.mktime(t)
    
    将一个struct_time转换为时间戳,如下time.localtime接收一个时间戳返回一个struct_time,而time.mktime接收一个struct_time,返回一个时间戳
    In : time.localtime(1407945600.0)
    Out: time.struct_time(tm_year=2014, tm_mon=8, tm_mday=14, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=226, tm_isdst=0)
    In : time.mktime(time.localtime(1407945600.0))
    Out: 1407945600.0
    time 模块常用方法小记

    datetime模块

    datetime模块常用的主要有下面这四个类:
    
    1. datetime.date: 是指年月日构成的日期(相当于日历)
    2. datetime.time: 是指时分秒微秒构成的一天24小时中的具体时间(相当于手表)
    3. datetime.datetime: 上面两个合在一起,既包含时间又包含日期
    4. datetime.timedelta: 时间间隔对象(timedelta)。一个时间点(datetime)加上一个时间间隔(timedelta)可以得到一个新的时间点(datetime)。比如今天的上午3点加上5个小时得到今天的上午8点。同理,两个时间点相减会得到一个时间间隔。
    
    
    
    1.datetime.date 类
    
    1.新建一个date对象,日期为今天,既可以直接调用datetime.date.today(),也可以直接向datetime.date()传值,如下:
    In : today = datetime.date.today()
    In : today
    Out: datetime.date(2014, 8, 15)
    In : t = datetime.date(2014,8,15)
    In : t
    Out: datetime.date(2014, 8, 15)
    
    2.datetime.date.strftime(format) 格式化为需要的时间,如常用的 “年-月-日 小时:分钟:秒” 格式
    In : today.strftime('%Y-%m-%d %H:%M:%S')
    Out: '2014-08-15 00:00:00’
    date对象中小时、分钟、秒默认都是0,纪元年的那个时间
    
    3.datetime.date.timple() 转成struct_time格式,这样传递给time.mktime(t)  后,直接转成时间戳格式
    In : today.timetuple()
    Out: time.struct_time(tm_year=2014, tm_mon=8, tm_mday=15, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=4, tm_yday=227, tm_isdst=-1)
    In : time.mktime(today.timetuple())
    Out: 1408032000.0
    
    4.datetime.date.replace(year, month, day)  返回一个替换后的date对象
    In : today.replace(year=2013)
    Out: datetime.date(2013, 8, 15)
    
    5.datetime.date.fromtimestamp(timestamp) 将时间戳转化为date对象
    In : datetime.date.fromtimestamp(1408058729)
    Out: datetime.date(2014, 8, 15)
    
    
    
    2.datetime.time 类
    
    1.新建一个time对象
    In : t
    Out: datetime.time(8, 45, 20)
    
    2.datetime.time.(format)格式化输出
    In : t.strftime('%Y-%m-%d %H:%M:%S')
    Out: '1900-01-01 08:45:20’
    time对应的年、月、日为1900、01、01,纪元年的那个时间
    
    3.datetime.time.replace([hour[, minute[, second[, microsecond[, tzinfo]]]]])  返回一个替换后的time对象
    In : t.replace(hour=9)
    Out: datetime.time(9, 45, 20)
    
    
    
    3.datetime.datetime类
    
    1.新建一个datetime对象,日期为今天,既可以直接调用datetime.datetime.today(),也可以直接向datetime.datetime()传值,如下:
    In : d1 = datetime.datetime.today()
    In : d1
    Out: datetime.datetime(2014, 8, 15, 8, 12, 34, 790945)
    In : d2 = datetime.datetime(2014, 8, 15, 8, 12, 34, 790945)
    In : d2
    Out: datetime.datetime(2014, 8, 15, 8, 12, 34, 790945)
    
    2.datetime.datetime.now([tz]) 当不指定时区时,和datetime.datetime.today()是一样的结果,如下
    In : datetime.datetime.now()
    Out: datetime.datetime(2014, 8, 15, 8, 14, 50, 738672)
    
    3..datetime.datetime.strftime(format) 格式化为需要的时间,如常用的 “年-月-日 小时:分钟:秒” 格式
    In : d1
    Out: datetime.datetime(2014, 8, 15, 8, 12, 34, 790945)
    In : d1.strftime('%Y-%m-%d %H:%M:%S')
    Out: '2014-08-15 08:12:34’
    
    4.datetime.datetime.timple() 转成struct_time格式,这样传递给time.mktime(t)  后,直接转成时间戳格式
    In : d1
    Out: datetime.datetime(2014, 8, 15, 8, 12, 34, 790945)
    In : d1.timetuple()
    Out: time.struct_time(tm_year=2014, tm_mon=8, tm_mday=15, tm_hour=8, tm_min=12, tm_sec=34, tm_wday=4, tm_yday=227, tm_isdst=-1)
    In : time.mktime(d1.timetuple())
    Out: 1408061554.0
    
    5.datetime.datetime.replace(year, month, day)  返回一个替换后的date对象
    In : d1
    Out: datetime.datetime(2014, 8, 15, 8, 12, 34, 790945)
    In : d1.replace(year=2000)
    Out: datetime.datetime(2000, 8, 15, 8, 12, 34, 790945)
    
    6.datetime.datetime.fromtimestamp(timestamp) 将时间戳转化为datetime对象
    In : time.time()
    Out: 1408061894.081552
    In : datetime.datetime.fromtimestamp(1408061894)
    Out: datetime.datetime(2014, 8, 15, 8, 18, 14)
    4.datetime.timedelta类
    
    时间的加减法用,如下:
    In : today = datetime.datetime.today()
    In : yesterday = today - datetime.timedelta(days=1)
    In : yesterday
    Out: datetime.datetime(2014, 8, 14, 15, 8, 25, 783471)
    In : today
    Out: datetime.datetime(2014, 8, 15, 15, 8, 25, 783471)
    datetime 模块常用方法小记

    几种格式之间的转换

    random模块

    random模块用于生成随机数,废话不多说,下面介绍几个随机数的常用方法:

     import random
    #随机小数
     random.random()      # 大于0且小于1之间的小数
    out: 0.7664338663654585
     random.uniform(1,3) #大于1小于3的小数
    out: 1.6270147180533838
    
    
    #随机整数
     random.randint(1,5)  # 大于等于1且小于等于5之间的整数
     random.randrange(1,10,2) # 大于等于1且小于10之间的奇数
    
    
    #随机选择一个返回
    random.choice([1,'23',[4,5]])  # #1或者23或者[4,5]
    #随机选择多个返回,返回的个数为函数的第二个参数
     random.sample([1,'23',[4,5]],2) # #列表元素任意2个组合
    out: [[4, 5], '23']
    
    
    #打乱列表顺序
    item=[1,3,5,7,9]
     random.shuffle(item) # 打乱次序
    item
    out: [5, 1, 3, 7, 9]
    random.shuffle(item)
     item
    out: [5, 9, 7, 1, 3]

    小练习:

    """
    大写字母 小写字母 数字
    
    5位数的随机验证码
    提示:
    chr
    random.choice
    封装成一个函数,用户想生成几位就生成几位
    """
    def get_code(n):
        code = ''
        for i in range(n):
            # 先生成随机的大写字母 小写字母 数字
            upper_str = chr(random.randint(65,90))
            lower_str = chr(random.randint(97,122))
            random_int = str(random.randint(0,9))
            # 从上面三个中随机选择一个作为随机验证码的某一位
            code += random.choice([upper_str,lower_str,random_int])
        return code
    res = get_code(4)
    print(res)
    生成验证码

    os模块

     os模块是与操作系统交互的一个接口

    #OS模块
    
    #os模块就是对操作系统进行操作,使用该模块必须先导入模块:
    import os
    
    #getcwd() 获取当前工作目录(当前工作目录默认都是当前文件所在的文件夹)
    result = os.getcwd()
    print(result)
    
    #chdir()改变当前工作目录
    os.chdir('/home/sy')
    result = os.getcwd()
    print(result)
    
    open('02.txt','w')
    
    #操作时如果书写完整的路径则不需要考虑默认工作目录的问题,按照实际书写路径操作
    open('/home/sy/下载/02.txt','w')
    
    #listdir() 获取指定文件夹中所有内容的名称列表
    result = os.listdir('/home/sy')
    print(result)
    
    #mkdir()  创建文件夹
    #os.mkdir('girls')
    #os.mkdir('boys',0o777)
    
    #makedirs()  递归创建文件夹
    #os.makedirs('/home/sy/a/b/c/d')
    
    #rmdir() 删除空目录
    #os.rmdir('girls')
    
    #removedirs 递归删除文件夹  必须都是空目录
    #os.removedirs('/home/sy/a/b/c/d')
    
    #rename() 文件或文件夹重命名
    #os.rename('/home/sy/a','/home/sy/alibaba'
    #os.rename('02.txt','002.txt')
    
    #stat() 获取文件或者文件夹的信息
    #result = os.stat('/home/sy/PycharmProject/Python3/10.27/01.py)
    #print(result)
    
    #system() 执行系统命令(危险函数)
    #result = os.system('ls -al')  #获取隐藏文件
    #print(result)
    
    #环境变量
    '''
    环境变量就是一些命令的集合
    操作系统的环境变量就是操作系统在执行系统命令时搜索命令的目录的集合
    '''
    #getenv() 获取系统的环境变量
    result = os.getenv('PATH')
    print(result.split(':'))
    
    #putenv() 将一个目录添加到环境变量中(临时增加仅对当前脚本有效)
    #os.putenv('PATH','/home/sy/下载')
    #os.system('syls')
    
    #exit() 退出终端的命令
    
    #os模块中的常用值
    #curdir  表示当前文件夹   .表示当前文件夹  一般情况下可以省略
    print(os.curdir)
    
    #pardir  表示上一层文件夹   ..表示上一层文件夹  不可省略!
    print(os.pardir)
    
    #os.mkdir('../../../man')#相对路径  从当前目录开始查找
    #os.mkdir('/home/sy/man1')#绝对路径  从根目录开始查找
    
    #name 获取代表操作系统的名称字符串
    print(os.name) #posix -> linux或者unix系统  nt -> window系统
    
    #sep 获取系统路径间隔符号  window ->    linux ->/
    print(os.sep)
    
    #extsep 获取文件名称和后缀之间的间隔符号  window & linux -> .
    print(os.extsep)
    
    #linesep  获取操作系统的换行符号  window -> 
      linux/unix -> 
    
    print(repr(os.linesep))
    
    
    
    #导入os模块
    import os
    
    #以下内容都是os.path子模块中的内容
    
    #abspath()  将相对路径转化为绝对路径
    path = './boys'#相对
    result = os.path.abspath(path)
    print(result)
    
    #dirname()  获取完整路径当中的目录部分  &  basename()获取完整路径当中的主体部分
    path = '/home/sy/boys'
    result = os.path.dirname(path)
    print(result)
    
    result = os.path.basename(path)
    print(result)
    
    #split() 将一个完整的路径切割成目录部分和主体部分
    path = '/home/sy/boys'
    result = os.path.split(path)
    print(result)
    
    #join() 将2个路径合并成一个
    var1 = '/home/sy'
    var2 = '000.py'
    result = os.path.join(var1,var2)
    print(result)
    
    #splitext() 将一个路径切割成文件后缀和其他两个部分,主要用于获取文件的后缀
    path = '/home/sy/000.py'
    result = os.path.splitext(path)
    print(result)
    
    #getsize()  获取文件的大小
    #path = '/home/sy/000.py'
    #result = os.path.getsize(path)
    #print(result)
    
    #isfile() 检测是否是文件
    path = '/home/sy/000.py'
    result = os.path.isfile(path)
    print(result)
    
    #isdir()  检测是否是文件夹
    result = os.path.isdir(path)
    print(result)
    
    #islink() 检测是否是链接
    path = '/initrd.img.old'
    result = os.path.islink(path)
    print(result)
    
    #getctime() 获取文件的创建时间 get create time
    #getmtime() 获取文件的修改时间 get modify time
    #getatime() 获取文件的访问时间 get active time
    
    import time
    
    filepath = '/home/sy/下载/chls'
    
    result = os.path.getctime(filepath)
    print(time.ctime(result))
    
    result = os.path.getmtime(filepath)
    print(time.ctime(result))
    
    result = os.path.getatime(filepath)
    print(time.ctime(result))
    
    #exists() 检测某个路径是否真实存在
    filepath = '/home/sy/下载/chls'
    result = os.path.exists(filepath)
    print(result)
    
    #isabs() 检测一个路径是否是绝对路径
    path = '/boys'
    result = os.path.isabs(path)
    print(result)
    
    #samefile() 检测2个路径是否是同一个文件
    path1 = '/home/sy/下载/001'
    path2 = '../../../下载/001'
    result = os.path.samefile(path1,path2)
    print(result)
    
    
    #os.environ 用于获取和设置系统环境变量的内置值
    import os
    #获取系统环境变量  getenv() 效果
    print(os.environ['PATH'])
    
    #设置系统环境变量 putenv()
    os.environ['PATH'] += ':/home/sy/下载'
    os.system('chls')
    os模块的使用

     

    sys模块

    sys模块是与python解释器交互的一个接口

    函数

    sys.argv #命令行参数List,第一个元素是程序本身路径
    sys.path #返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
    sys.modules.keys() #返回所有已经导入的模块列表
    sys.modules #返回系统导入的模块字段,key是模块名,value是模块
    sys.exc_info() #获取当前正在处理的异常类,exc_type、exc_value、exc_traceback当前处理的异常详细信息
    sys.exit(n) #退出程序,正常退出时exit(0)
    sys.hexversion #获取Python解释程序的版本值,16进制格式如:0x020403F0
    sys.version #获取Python解释程序的版本信息
    sys.platform #返回操作系统平台名称
    sys.maxint # 最大的Int值
    sys.stdout #标准输出
    sys.stdout.write('aaa') #标准输出内容
    sys.stdout.writelines() #无换行输出
    sys.stdin #标准输入
    sys.stdin.read() #输入一行
    sys.stderr #错误输出
    sys.exc_clear() #用来清除当前线程所出现的当前的或最近的错误信息
    sys.exec_prefix #返回平台独立的python文件安装的位置
    sys.byteorder #本地字节规则的指示器,big-endian平台的值是'big',little-endian平台的值是'little'
    sys.copyright #记录python版权相关的东西
    sys.api_version #解释器的C的API版本
    sys.version_info #'final'表示最终,也有'candidate'表示候选,表示版本级别,是否有后继的发行
    sys.getdefaultencoding() #返回当前你所用的默认的字符编码格式
    sys.getfilesystemencoding() #返回将Unicode文件名转换成系统文件名的编码的名字
    sys.builtin_module_names #Python解释器导入的内建模块列表
    sys.executable #Python解释程序路径
    sys.getwindowsversion() #获取Windows的版本
    sys.stdin.readline() #从标准输入读一行,sys.stdout.write(a) 屏幕输出a
    sys.setdefaultencoding(name) #用来设置当前默认的字符编码(详细使用参考文档)
    sys.displayhook(value) #如果value非空,这个函数会把他输出到sys.stdout(详细使用参考文档)
    View Code

    常用功能

    sys.arg 获取位置参数
    print(sys.argv)
    
    执行该脚本,加参数的打印结果
    python3 m_sys.py  1 2 3 4 5
    
    ['m_sys.py', '1', '2', '3', '4', '5']
    可以发现 sys.arg返回的是整个位置参数,类似于shell的$0 $1...
    sys.exit(n) 程序退出,n是退出是返回的对象
    sys.version 获取python版本
    >>> sys.version
    '3.5.1 (v3.5.1:37a07cee5969, Dec  5 2015, 21:12:44) 
    [GCC 4.2.1 (Apple Inc. build 5666) (dot 3)]'
    sys.path 返回模块的搜索路径列表,可通过添加自定义路径,来添加自定义模块
    >>> sys.path
    ['', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python35.zip', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/plat-darwin', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/lib-dynload', '/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages']
    
    sys.platform 返回当前系统平台 linux平台返回linux,windows平台返回win32,MAC返回darwin
    >>> sys.platform
    'darwin
    sys.stdout.write() 输出内容
    >>> sys.stdout.write('asd')
    asd3
    >>> sys.stdout.write('asd')
    asd3
    >>> sys.stdout.write('as')
    as2
    View Code

    序列化模块

    序列化就是将原本的字典,列表等内容转化成一个字符串的过程

    比如,我们在python代码中计算的一个数据需要给另外一段程序使用,那我们怎么给?
    现在我们能想到的方法就是存在文件里,然后另一个python程序再从文件里读出来。
    但是我们都知道,对于文件来说是没有字典这个概念的,所以我们只能将数据转换成字典放到文件中。
    你一定会问,将字典转换成一个字符串很简单,就是str(dic)就可以办到了,为什么我们还要学习序列化模块呢?
    没错序列化的过程就是从dic 变成str(dic)的过程。现在你可以通过str(dic),将一个名为dic的字典转换成一个字符串,
    但是你要怎么把一个字符串转换成字典呢?
    聪明的你肯定想到了eval(),如果我们将一个字符串类型的字典str_dic传给eval,就会得到一个返回的字典类型了。
    eval()函数十分强大,但是eval是做什么的?e官方demo解释为:将字符串str当成有效的表达式来求值并返回计算结果。
    BUT!强大的函数有代价。安全性是其最大的缺点。
    想象一下,如果我们从文件中读出的不是一个数据结构,而是一句"删除文件"类似的破坏性语句,那么后果实在不堪设设想。
    而使用eval就要担这个风险。
    所以,我们并不推荐用eval方法来进行反序列化操作(将str转换成python中的数据结构)
    为什么要有序列化模块

    序列化的目的

    1、以某种存储形式使自定义对象持久化
    2、将对象从一个地方传递到另一个地方。
    3、使程序更具维护性。

    json & pickle 模块

    用于序列化的两个模块(推荐json)

    • json,用于字符串 和 python数据类型间进行转换(字符串,列表,元组(内部还是列表),字典,布尔值,整型,浮点型,None)
    • pickle,用于python特有的类型 和 python的数据类型间进行转换(python的所有数据类型)

     #json

    json模块提供了四个功能: dumps, dump, loads, load

    import json
    dic = {'k1':'v1','k2':'v2','k3':'v3'}
    str_dic = json.dumps(dic)  #序列化:将一个字典转换成一个字符串
    print(type(str_dic),str_dic)  #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
    #注意,json转换完的字符串类型的字典中的字符串是由""表示的
    
    dic2 = json.loads(str_dic)  #反序列化:将一个字符串格式的字典转换成一个字典
    #注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
    print(type(dic2),dic2)  #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
    
    
    list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
    str_dic = json.dumps(list_dic) #也可以处理嵌套的数据类型 
    print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
    list_dic2 = json.loads(str_dic)
    print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]
    
    loads和dumps
    loads和dumps
    import json
    f = open('json_file','w')
    dic = {'k1':'v1','k2':'v2','k3':'v3'}
    json.dump(dic,f)  #dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
    f.close()
    
    f = open('json_file')
    dic2 = json.load(f)  #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
    f.close()
    print(type(dic2),dic2)
    load和dump
    import json
    f = open('file','w')
    json.dump({'国籍':'中国'},f)
    ret = json.dumps({'国籍':'中国'})
    f.write(ret+'
    ')
    json.dump({'国籍':'美国'},f,ensure_ascii=False)
    ret = json.dumps({'国籍':'美国'},ensure_ascii=False)
    f.write(ret+'
    ')
    f.close()
    ensure_ascii关键字参数
    Serialize obj to a JSON formatted str.(字符串表示的json对象) 
    Skipkeys:默认值是False,如果dict的keys内的数据不是python的基本类型(str,unicode,int,long,float,bool,None),设置为False时,就会报TypeError的错误。此时设置成True,则会跳过这类key 
    ensure_ascii:,当它为True的时候,所有非ASCII码字符显示为uXXXX序列,只需在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示。) 
    If check_circular is false, then the circular reference check for container types will be skipped and a circular reference will result in an OverflowError (or worse). 
    If allow_nan is false, then it will be a ValueError to serialize out of range float values (nan, inf, -inf) in strict compliance of the JSON specification, instead of using the JavaScript equivalents (NaN, Infinity, -Infinity). 
    indent:应该是一个非负的整型,如果是0就是顶格分行显示,如果为空就是一行最紧凑显示,否则会换行且按照indent的数值显示前面的空白分行显示,这样打印出来的json数据也叫pretty-printed json 
    separators:分隔符,实际上是(item_separator, dict_separator)的一个元组,默认的就是(‘,’,’:’);这表示dictionary内keys之间用“,”隔开,而KEY和value之间用“:”隔开。 
    default(obj) is a function that should return a serializable version of obj or raise TypeError. The default simply raises TypeError. 
    sort_keys:将数据根据keys的值进行排序。 
    To use a custom JSONEncoder subclass (e.g. one that overrides the .default() method to serialize additional types), specify it with the cls kwarg; otherwise JSONEncoder is used.
    其他参数说明
    import json
    data = {'username':['李华','二愣子'],'sex':'male','age':16}
    json_dic2 = json.dumps(data,sort_keys=True,indent=2,separators=(',',':'),ensure_ascii=False)
    print(json_dic2)
    json的格式化输出

    #pickle

    pickle模块提供了四个功能:dumps、dump(序列化,存)、loads(反序列化,读)、load  (不仅可以序列化字典,列表...可以把python中任意的数据类型序列化

    import pickle
    dic = {'k1':'v1','k2':'v2','k3':'v3'}
    str_dic = pickle.dumps(dic)
    print(str_dic)  #一串二进制内容
    
    dic2 = pickle.loads(str_dic)
    print(dic2)    #字典
    
    import time
    struct_time  = time.localtime(1000000000)
    print(struct_time)
    f = open('pickle_file','wb')
    pickle.dump(struct_time,f)
    f.close()
    
    f = open('pickle_file','rb')
    struct_time2 = pickle.load(f)
    print(struct_time2.tm_year)
    pickle

    为什么放着强大的pickle不用,却要推荐使用json呢? 其实原因很简单,因为json是一种所有语言都可以识别的数据结构,而pickle只能够

    在python里面自己和自己玩.

    subprocess模块(了解)

     subprocess是python创建子进程的工具,其实和c中的fork出一个子进程,然后在子进程中运行exec执行另外一个进程很类似。

      subprocess包中有很多方法创建子进程,这些函数创建子进程的行为不太一样,我们可以更具需求选择不同的方式来创建子进程。

      使用subprocess包中的函数创建子进程的时候,要注意:

      1) 在创建子进程之后,父进程是否暂停,并等待子进程运行。

      2) 函数返回什么

      3) 当returncode不为0时,父进程如何处理。

    """
    1.用户通过网络连接上了你的这台电脑
    2.用户输入相应的命令 基于网络发送给了你这台电脑上某个程序
    3.获取用户命令 里面subprocess执行该用户命令
    4.将执行结果再基于网络发送给用户
    这样就实现  用户远程操作你这台电脑的操作
    """
    while True:
        cmd = input('cmd>>>:').strip()
        import subprocess
        obj = subprocess.Popen(cmd,shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
        # print(obj)
        print('正确命令返回的结果stdout',obj.stdout.read().decode('gbk'))
        print('错误命令返回的提示信息stderr',obj.stderr.read().decode('gbk'))
    subprocess之远程操作原理
  • 相关阅读:
    使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL
    URL中“#” “?” &“”号的作用
    JavaScript中事件捕获(Event capturing)-------------->由外向内,事件冒泡(Event bubblin)---------->由内向外
    单页面应用程序案例
    【344】Jupyter relevant problems
    【343】MathJax、LaTex、Mathml 数学公式
    【342】Linear Regression by Python
    【341】Numpy 相关应用
    【340】GIS related knowledge
    java中通过反射获取方法并且调用(getMethod和invoke深入)实践
  • 原文地址:https://www.cnblogs.com/linxidong/p/11207960.html
Copyright © 2011-2022 走看看