zoukankan      html  css  js  c++  java
  • 7.18 常用模块

    一。collections

      collections模块中提供了除了dict,list,str等数据类型之外的其他数据类型:Counter、deque、defaultdict、namedtuple和OrderedDict等

        1.namedtuple: 生成可以使用名字来访问元素内容的tuple

        2.deque: 双端队列,可以快速的从另外一侧追加和推出对象

        3.Counter: 计数器,主要用来计数

        4.OrderedDict: 有序字典

        5.defaultdict: 带有默认值的字典

      1.namedtuple具名元组

      普通的元组不具有描述自己定义的数据的功能,而具名元组定义了一个可以描述元组的数据类型:

    from collections import namedtuple
    point = namedtuple('坐标',['x','y','z'])  
    p = point(1,2,5)  
    print(p)
    print(type(p))
    print(p.x)
    print(p.y)
    print(p.z)
    #输出结果>>>坐标(x=1, y=2, z=5)
    #<class '__main__.坐标'>
    #1
    #2
    #5

      导入模块后,可以使用namedtuple调用函数,namedtuple可以传入两个参数,第一个是对元组的描述,第二个是可迭代对象,所以,除了列表,还可以写成这样:

    point = namedtuple('坐标','x y z')

      注意,参数与参数之间需要使用空格隔开。

      定义好一个具名元组后,就可以对其进行传参了,传入的参数要与可迭代中的元素一样。

      2.deque

      补充:queue队列模块

    # import queue
    # q = queue.Queue() 
    # q.put('first')  
    # q.put('second')
    # q.put('third')
    # print(q.get()) 
    # print(q.get())
    # print(q.get())
    # print(q.get()) 
    #输出结果>>>first
    #second
    #third

      使用queue模块创建一个队列q,再使用put方法对其传值,使用get对其取值,当值被取完时继续调用get方法,等待列表给值。

      deque双端队列,是一个两边都可以取值和传值的队列。

    from collections import deque
    q = deque(['a','b','c'])
    q.append('x')
    print(q)
    q.appendleft('y')
    print(q)
    q.pop()
    print(q)
    q.popleft()
    print(q)
    #输出结果>>>deque(['a', 'b', 'c', 'x'])
    #deque(['y', 'a', 'b', 'c', 'x'])
    #deque(['y', 'a', 'b', 'c'])
    #deque(['a', 'b', 'c'])

      在deque中可以使用append和appendleft对队列进行左右 的加值,pop和popleft对其进行左右的删值。deque传值是传可迭代对象。

      在双端队列中可以使用insert对其进行索引取值,这是deque不合理的地方。

      3.Ordereddict有序字典

      在正常定义一个字典时,产生的字典是无序的,而使用ordereddict产生的字典是有序的。有序字典的定义方式是:

    order_d = OrderedDict([('a',1),('b',2),('c',3)])

      其输出也是这个,并不会以无序字典的方式打印,或者

    order_d1 = OrderedDict()
    order_d1['x'] = 1
    order_d1['y'] = 2
    order_d1['z'] = 3
    print(order_d1)
    for i in order_d1:
        print(i)
    print(order_d1)

      这个字典是可以使用for循环遍历取值的。使用keys()对其进行取值时会按照插入顺序,而不是key本身的顺序。

      4.defaultdict默认字典

      当你需要把列表中的值进行判断大小(66),,并对其值放入字典中,字典的value是一个列表,不用defaultdict可以使用如下办法。

    values = [11, 22, 33,44,55,66,77,88,99,90]
    my_dict = {}
    for value in  values:
        if value>66:
            if my_dict.has_key('k1'):
                my_dict['k1'].append(value)
            else:
                my_dict['k1'] = [value]
        else:
            if my_dict.has_key('k2'):
                my_dict['k2'].append(value)
            else:
                my_dict['k2'] = [value]

      而使用了defaultdict()方法后x,对其传入一个数据类型,当字典被创建后,其value会被自动转换成传入的那个数据类型,所以上述题目可以简化成:

    from collections import defaultdict
    values = [11, 22, 33,44,55,66,77,88,99,90]
    my_dict = defaultdict(list)
    for value in  values:
        if value>66:
            my_dict['k1'].append(value)
        else:
            my_dict['k2'].append(value)

      使dict时,如果引用的Key不存在,就会抛出KeyError。如果希望key不存在时,返回一个默认值,就可以用defaultdict

    >>> from collections import defaultdict
    >>> dd = defaultdict(lambda: 'N/A')
    >>> dd['key1'] = 'abc'
    >>> dd['key1'] # key1存在
    'abc'
    >>> dd['key2'] # key2不存在,返回默认值
    'N/A'

    5.Counter计数

      当你需要统计一个字符串中某个字符出现的次数时,如题

    s='aaaaabbbbbbvcccccc'
    dict1=dict({})
    for i in s:
        if i not in dict1:
            dict1[i]=1
        else:
            dict1[i]+=1
    print(dict1)
    #输出结果>>>{'a': 5, 'b': 6, 'v': 1, 'c': 6}

      而使用counter计数就可以直接生成字典:

    from collections import Counter
    s = 'abcdeabcdabcaba'
    res = Counter(s)
    print(res)
    #输出结果>>>Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2, 'e': 1})

    二。time时间模块

      时间模块有三种表现形式:

      1.时间戳

      2.格式化时间(用来展示给人看的)

      3.结构化时间 

      1.time.time()

    import time
    print(time.time())
    #输出结果>>>1563445995.928969

      输出的是现在的时间距离1970-1-1的秒数,

      2.strftime()

      格式化时间输出的时间比较工整,它与%s差不多,不过有特定的符号接受年月日、

    print(time.strftime('%Y-%m-%d'))
    print(time.strftime('%Y-%m-%d %H:%M:%S'))
    #输出结果>>>2019-07-18
    #2019-07-18 18:43:16

      如上,月和日的字符是小写,其他均为大写,使用%X可以代表时分秒。

      在strftime中还有其他的特殊字符,日后用作翻阅如:

    %y 两位数的年份表示(00-99%Y 四位数的年份表示(000-9999%m 月份(01-12%d 月内中的一天(0-31%H 24小时制小时数(0-23%I 12小时制小时数(01-12%M 分钟数(00=59%S 秒(00-59%a 本地简化星期名称
    %A 本地完整星期名称
    %b 本地简化的月份名称
    %B 本地完整的月份名称
    %c 本地相应的日期表示和时间表示
    %j 年内的一天(001-366%p 本地A.M.或P.M.的等价符
    %U 一年中的星期数(00-53)星期天为星期的开始
    %w 星期(0-6),星期天为星期的开始
    %W 一年中的星期数(00-53)星期一为星期的开始
    %x 本地相应的日期表示
    %X 本地相应的时间表示
    %Z 当前时区的名称
    %% %号本身

      3.结构化时间

      使用time.local可以打印结构化时间, 

    print(time.localtime())
    #输出结果>>>time.struct_time(tm_year=2019, tm_mon=7, tm_mday=18, tm_hour=18, tm_min=51, tm_sec=5, tm_wday=3, tm_yday=199, tm_isdst=0)

      结构化时间中分别代表了以下值,用做以后索引:

    索引(Index)属性(Attribute)值(Values)
    0 tm_year(年) 比如2011
    1 tm_mon(月) 1 - 12
    2 tm_mday(日) 1 - 31
    3 tm_hour(时) 0 - 23
    4 tm_min(分) 0 - 59
    5 tm_sec(秒) 0 - 60
    6 tm_wday(weekday) 0 - 6(0表示周一)
    7 tm_yday(一年中的第几天) 1 - 366
    8 tm_isdst(是否是夏令时) 默认为0

      初次之外,字符串时间,结构化时间,格式化时间之间是可以互相转换的:

      时间戳转化为结构化时间:

    print(time.localtime(time.time()))
    #输出结果>>>time.struct_time(tm_year=2019, tm_mon=7, tm_mday=18, tm_hour=19, tm_min=13, tm_sec=1, tm_wday=3, tm_yday=199, tm_isdst=0)

      或者转换为伦敦时间:

    print(time.gmtime(time.time()))
    #输出结果>>>time.struct_time(tm_year=2019, tm_mon=7, tm_mday=18, tm_hour=11, tm_min=15, tm_sec=12, tm_wday=3, tm_yday=199, tm_isdst=0)

      结构化时间转换为时间戳:

    res = time.localtime(time.time())
    print(time.time())
    print(time.mktime(res))
    #输出结果>>>1563448581.7627177
    #1563448581.0

      结构化时间转换为字符串时间:

    print(time.strftime('%Y-%m',time.localtime()))
    #输出结果>>>2019-07

      字符串时间转换为结构化时间:

    print(time.strptime(time.strftime('%Y-%m',time.localtime()),'%Y-%m'))
    #输出结果>>>time.struct_time(tm_year=2019, tm_mon=7, tm_mday=1, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=0, tm_yday=182, tm_isdst=-1)

      结构化时间转换成格式化串:

    print(time.asctime(time.localtime(1500000000)))
    print(time.asctime())
    #输出结果>>>Fri Jul 14 10:40:00 2017
    #Thu Jul 18 19:27:51 2019

      如果不传值,显示的是当前时间

      时间戳转化成格式化串

    print(time.ctime())
    print(time.ctime(1500000000))
    #输出结果>>>Thu Jul 18 19:29:23 2019
    #Fri Jul 14 10:40:00 2017

      time.sleep(n)

      将程序搁置n秒

      datetime模块

      显示年月日和年月日时分秒:

    import datetime
    print(datetime.date.today()) 
    print(datetime.datetime.today())
    #输出结果>>>2019-07-18
    #2019-07-18 19:33:33.857248

      下面还有一些获取时间相关的方法:

    import datetime
    print(datetime.date.today())  # date>>>:年月日
    print(datetime.datetime.today())  # datetime>>>:年月日 时分秒
    res = datetime.date.today()
    res1 = datetime.datetime.today()
    print(res.year)
    print(res.month)
    print(res.day)
    print(res.weekday())  # 0-6表示星期  0表示周一
    print(res.isoweekday())
    #输出结果>>>2019-07-18
    #2019-07-18 19:38:59.237848
    #2019
    #7
    #18
    #3
    #4

      其中,year获取年,month代表月,day代表日,weekday代表星期,但这里从0开始,代表星期一,isoweekday是代表真正的星期。

       在这个模块可以对时间进行计算

    timetel_t = datetime.timedelta(days=7)  # timedelta对象
    print(timetel_t)
    #输出结果>>>7 days, 0:00:00

      timedelta是一个时间增量,在进行时间运算时,遵循以下规则:

      日期对象 = 日期对象 +/- timedelta对象

      timedelta对象 = 日期对象 +/- 日期对象,如:

    current_time = datetime.date.today()  # 日期对象
    timetel_t = datetime.timedelta(days=7)  # timedelta对象
    print(timetel_t)
    res1 = current_time+timetel_t  # 日期对象
    print(current_time - timetel_t)
    print(res1-current_time)
    #输出结果>>>7 days, 0:00:00
    #2019-07-11
    #7 days, 0:00:00

      utc时间

    dt_today = datetime.datetime.today()
    dt_now = datetime.datetime.now()
    dt_utcnow = datetime.datetime.utcnow()
    print(dt_today)
    print(dt_now)
    print(dt_utcnow)
    #输出结果>>>2019-07-18 19:56:12.536702
    #2019-07-18 19:56:12.536702
    #2019-07-18 11:56:12.536702

    三。random模块

      random是获取随机数等随机项的模块

      如:random.randint(x,y)随机生成x到y之间的数

      random.random()随机生成0-1之间的小数。

      random.shuffle()对一个列表进行随机打乱。

      random.choice()对一个列表中的元素进行随机选择。

    import random
    print(random.randint(1,6))  # 随机取一个你提供的整数范围内的数字  包含首尾
    print(random.random())  # 随机取0-1之间小数
    print(random.choice([1,2,3,4,5,6]))  # 摇号 随机从列表中取一个元素
    res = [1,2,3,4,5,6]
    random.shuffle(res)  # 洗牌
    print(res)
    #输出结果>>>4
    #0.394731321911586
    #4
    #[2, 1, 5, 3, 6, 4]

      小练习:生成n、位随机验证码,带有数字,大写字母和小写字母

    def get_code(n):
        code = ''
        for i in range(n):
            # 先生成随机的大写字母 小写字母 数字
            upper_str = chr(random.randint(65,90))
            lower_str = chr(random.randint(97,122))
            random_int = str(random.randint(0,9))
            # 从上面三个中随机选择一个作为随机验证码的某一位
            code += random.choice([upper_str,lower_str,random_int])
        return code
    res = get_code(4)
    print(res)

    四。os模块

      os模块是与操作系统进行对接的模块

      os.path.dirname(__file__) 获取该文件的上一层文件名

      os.path.join(x,y) 拼接地址

      os.listdir() 将该文件夹下的所有文件读取出看来,成为一个列表。

      os.mkdir('文件夹名'),生成一个文件夹,在当文件夹下

      os.path.exists()判断文件夹是否存在

      os.path.isfile(),判断文件是否存在,不能判断文件夹。

      os.rmdir(''),删除文件夹,(只能删除空文件夹)。

      os.chdir(''),切换到该目录里

      os.getcwd(),查看当前目录

      os.path.getsize(),获取文件大小,获取的是字节

      其他可能用到的如下:

    os.makedirs('dirname1/dirname2')    可生成多层递归目录
    os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
    os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname
    os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
    os.listdir('dirname')    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
    os.remove()  删除一个文件
    os.rename("oldname","newname")  重命名文件/目录
    os.stat('path/filename')  获取文件/目录信息
    
    os.system("bash command")  运行shell命令,直接显示
    os.popen("bash command).read()  运行shell命令,获取执行结果
    os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
    os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd
    
    os.path
    os.path.abspath(path) 返回path规范化的绝对路径
    os.path.split(path) 将path分割成目录和文件名二元组返回 
    os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 
    os.path.basename(path) 返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素
    os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
    os.path.isabs(path)  如果path是绝对路径,返回True
    os.path.isfile(path)  如果path是一个存在的文件,返回True。否则返回False
    os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
    os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
    os.path.getatime(path)  返回path所指向的文件或者目录的最后访问时间
    os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
    os.path.getsize(path) 返回path的大小

    五。sys模块

      sys模块是与python解释器打交道的

      sys.path.append(),将某个路径添加到系统环境变量的。

       sys.argv:在终端运行该文件可以获取终端输入的内容。并生成列表。

      其他内容:

    sys.argv           命令行参数List,第一个元素是程序本身路径
    sys.exit(n)        退出程序,正常退出时exit(0),错误退出sys.exit(1)
    sys.version        获取Python解释程序的版本信息
    sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
    sys.platform       返回操作系统平台名称

    六。序列化模块

       序列:字符串

      序列化:其他数据类型转换成字符串的过程。 

      写入文件的数据必须是字符串,基于网络传输的数据必须是二进制

      反序列化:字符串转化成其他数据类型。

      在数据传输过程中都是以二进制传输,而且在不同语言之间需要进行序列和反序列,所有有一个模块可以进行之间的转化。

      json模块

      json是所有语言都支持的模块。

      json支持的数据类型比较少,如:字符串,列表,字典,整型,元组(转成列表)

      pickle模块

      pickle与json不同的是它只支持python的转化,但能转化所有数字类型

      在存数据如文件是,必须要经序列化。

      json.encoder,可以查询json中支持哪些数据类型的序列化

    +-------------------+---------------+
    | Python | JSON |
    +===================+===============+
    | dict | object |
    +-------------------+---------------+
    | list, tuple | array |
    +-------------------+---------------+
    | str | string |
    +-------------------+---------------+
    | int, float | number |
    +-------------------+---------------+
    | True | true |
    +-------------------+---------------+
    | False | false |
    +-------------------+---------------+
    | None | null |
    +-------------------+---------------+

      除此之外其他都不支持,

    d = {"name":"jason"}
    print(d)
    res = json.dumps(d)  
    print(res,type(res))
    res1 = json.loads(res)
    print(res1,type(res1))
    #输出结果>>>{'name': 'jason'}
    #{"name": "jason"} <class 'str'>
    #{'name': 'jason'} <class 'dict'>

      在json模块中,damps可以将字典转化成字典型的字符串,而loads可以将字典型的字符串转化成字典。

       dump和load

    import json
    f = open('json_file','w')
    dic = {'k1':'v1','k2':'v2','k3':'v3'}
    json.dump(dic,f)  
    f.close()
    f = open('json_file')
    dic2 = json.load(f)  
    f.close()
    print(type(dic2),dic2)

      dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件,而load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回。

      注意,在使用dump写入数据到文件中时,是不加空格的,所以要想写入多条数据可以使用dumps手动拼接回车符接在后面,在使用loads返回一行,循环。

    d1 = {'name':'朱志坚'}
    print(json.dumps(d1,ensure_ascii=False))
    #输出结果>>>{"name": "朱志坚"}

      当使用dumps序列化时,可能会把其中的ascii码进行二进制转化,为了避免这种情况,可以使用ensure_ascii取false值使得其不转码。

      pickle模块

      在pickle模块中dumps方法会直接将对象转换成二进制,loads将其转换成原类型。

      在dump方法的使用中,文件的打开模式必须时b模式。

     七。subprocess子进程

      sub  子

      process 进程

       其中obj=subprocess.popen('文件名'shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)

      使用obj.stdout.read().decode("gbk')进行输出正确的指令进程

      使用obj.stderr.read()输出错误的指令

    while True:
        cmd = input('cmd>>>:').strip()
        import subprocess
        obj = subprocess.Popen(cmd,shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
        # print(obj)
        print('正确命令返回的结果stdout',obj.stdout.read().decode('gbk'))
        print('错误命令返回的提示信息stderr',obj.stderr.read().decode('gbk'))

       其应用范围是可以全程连接其他电脑,使用这个模块获取用户命令,执行命令,就实现了远程操作。

     

     

     

     

     

     

     

     

     

     

  • 相关阅读:
    git与eclipse集成之代码提交
    git与eclipse集成之创建及切换个人本地分支
    git与eclipse集成之导入组件到Eclipse工程
    ural1086. Cryptography
    ural 1118. Nontrivial Numbers
    ural 1104. Don’t Ask Woman about Her Age暴力
    ural 1141. RSA Attack RSA算法
    51nod 1119 机器人走方格 V2组合数
    2016 ACM/ICPC Asia Regional Qingdao Online1001 &&hdoj 5878 I Count Two Three
    51nod 1010 只包含因子2 3 5的数 打表二分
  • 原文地址:https://www.cnblogs.com/LZXlzmmddtm/p/11210340.html
Copyright © 2011-2022 走看看