zoukankan      html  css  js  c++  java
  • Python学习笔记

    模块与包

    一个模块就是一个包含了Python定义和声明的文件,文件名就是模块名加上.py的后缀,导入一个py文件,解释器解释该py文件,导入一个包,解释器解释该包下的 __init__.py 文件,所以如果我们要创建一个包文件,那么该文件下必须要有__init__.py文件。

    从目录级别来组织模块的,本质上也是被导入的,目录下有 __init__ 文件的都可以理解为包,在import时,其实导入的就是包下的 __init__.py 文件。

    • 无论是import形式,还是from...import形似,凡是在导入语句中(而不是使用时)遇到带点的,就是在导入包
    • 包是目录级的(文件夹),文件夹是用来组织py文件的。(包的本质就是一个包含 __init__.py 文件的目录)
    • import导入文件时,产生的名称空间来源于文件,import包,产生的命名空间同样来源于文件,既包下面的__init__.py,导入包的本质就是导入该文件

    包的import *

    这个* 其实读取的就是 __init__ 文件里面的所有函数,所以一般不要用*
    通过在父包内的__init__文件中利用相对路径进行导入子包的模块或者方法,来达到通过(父包.方法)来调用,屏蔽了不同子包路径过长的问题

    模块

    要想使用模块需要先行倒入,那么根据导入方式的不同主要有两种方式:import 和 from。

    import导入

    导入操作:
      1)import导入模块就会执行要导入的模块的所有代码
      2)产生新的名称空间
      3)拿到一个模块名,指向模块中的代码
    语法:

    import module as alias  # 导入时并定义别名
    import module,module1,module2  # 一次导入多个模块(不建议)
    

    调用方式:使用包名.函数名来执行导入的函数

    import time
    print(time.strftime('%Y-%m-%d %H:%M:%S'))
    
    # 导入time模块
    # 使用 time.strftime()来调用strftime()函数
    

    注意:使用import方式会导入包中的所有函数。

    from导入      

    导入操作:
      1)会执行要导入的模块的所有代码,调用时只通过func就可以调用
      2)如果func和本文件中存在同名func,那么就会覆盖
    语法:

    from module import func  # 调用时可以直接使用func,而不必使用module.func来调用
    from module import * # 导入所有函数
    

    PS:在被导入模块的__init__.py文件中定义__all__ = ['module','module1'],这样在导入其时,用*,只能导入 __all__ 定义的模块

    调用方式:直接使用函数名进行调用。 

    from time import strftime
    print(strftime('%Y-%m-%d %H:%M:%S'))

    PS:func来自哪个文件,那么func内部调用的变量,以其所在文件中的环境变量为准

    模块中的特殊关键字及路径

    模块文件中有一些Python提供的特殊关键字,例如
    __file__ :打印当前文件的文件名
    __name__ :显示当前模块是否被导入,显示:__main__ 表示没有被导入,显示:模块名, 表示被此模块被导入。
    PS:如果我们写的Python文件中的某个函数或者类会被其他人调用,使用if __name__ == '__main__' ,后面写主逻辑,这样在别的地方导入,就不会执行下面的代码段,而直接运行文件时,就会执行。

    模块路径      

    顾名思义,导入模块是需要先找到该模块,和在linux中执行命令是相同的,在Python中导入模块的搜索顺序:

    1. 先从内存中寻找
    2. 然后在内置模块中寻找
    3. 然后在sys.path中查找

    关于sys.path,类似于shell中的PATH,其是list类型,每个元素为路径的字符串形式,列表的第一个路径默认为当前路径,使用sys.path.append('dirpath'),就可以把路径加入到sys.path中

    Python内置模块 

    Python中内置了很多模块,可以提供很多实用的功能,下面将会列举部分模块。

    datetime模块

    提供时间功能的模块其实不止datetime,Python内置的还有一个time模块,time模块可以完成格式化输出,但是用起来没有datetime模块方便,但在下面场景下会用到time模块

    import time
    for i in range(1,10):
        print(i)
        time.sleep(1)     # 类似于Linux中的sleep命令。

    获取当前日期和时间

    datetime.now() 格式化输出一个datetime.datetime对象,打印则显示当前时间

    from datetime import datetime
    print(type(datetime.now()))
    print(datetime.now())

    注意到datetime是模块,datetime模块还包含一个datetime类,通过from datetime import datetime导入的才是datetime这个类,如果仅导入import datetime,则必须引用全名datetime.datetime.now()

    获取指定的日期与时间

    通过是datetime对象实例化的时候,传入指定的时间参数,来获取指定的日期与时间的时间格式字符。

    from datetime import  datetime
    
    timer = datetime(2017,11,9,11,20)
    print(timer)
    

    注意:时间日期如果是个位数,不能手动补0,比如9可以,09就不行。

    获取时间戳

    在计算机中,时间实际上是用数字表示的。我们把1970年1月1日 00:00:00 UTC+00:00时区的时刻称为epoch time(元时间),记为0(1970年以前的时间timestamp为负数),当前时间就是相对于epoch time的秒数,称为timestamp(时间戳)。

    • 所以针对于元时间来说:timestamp = 0 = 1970-1-1 00:00:00 UTC+0:00
    • 对应的北京时间是:timestamp = 0 = 1970-1-1 08:00:00 UTC+8:00(因为北京属于东八区)

    可见timestamp的值与时区毫无关系,因为timestamp一旦确定,其UTC时间就确定了,转换到任意时区的时间也是完全确定的,这就是为什么计算机存储的当前时间是以timestamp表示的,因为全球各地的计算机在任意时刻的timestamp都是完全相同的(假定时间已校准)。

    from datetime import datetime
    
    print(datetime.now().timestamp())
    
    # 注意 timestamp(),方法可以作用在datetime.datetime对象上。 (datetime(2017,11,9,11,50)因为返回的是datetime.datetime对象,所以也可以使用timestamp()来转换)
    

    时间戳转换为格式化时间

    要把timestamp转换为datetime,使用datetime提供的fromtimestamp()方法:

    from datetime import datetime
    t = datetime.now().timestamp()
    print(t)
    t2 = datetime.fromtimestamp(t)
    print(t2) 

    注意到timestamp是一个浮点数,它没有时区的概念,而datetime是有时区的。上述转换是在timestamp和本地时间做转换。如果我们计算机本地时间为 UTC +8,那么获得的时间就是基于本地UTC时间的。

    获取前几个小时或后几天

    获取前几个小时或后几天,其实是对日期和时间进行加减,得到新的datetime。加减可以直接用+-运算符,不过需要导入timedelta这个类:

    from datetime import  datetime,timedelta
    
    now = datetime.now()
    
    timer = now - timedelta(hours=10)
    
    print(timer)
    
    # timedelta 默认为天,其他参数还有 days,hours,minutes等。
    # 传递的参数可以为负数
    

    datetime对象转换为字符串时间

    如果已经有了datetime对象,要把它格式化为一个特定的字符串显示给用户,就需要转换为str,转换方法是通过strftime()实现的,同样需要一个日期和时间的格式化字符串:

    from datetime import  datetime
    
    str_time = datetime.now().strftime('%Y-%M-%d %H:%M:%S')
    
    print(str_time)
    

    字符串时间转换为datetime对象

    很多时候,用户输入的日期和时间是字符串,要处理日期和时间,首先必须把str转换为datetime。转换方法是通过datetime.strptime()实现,需要一个日期和时间的格式化字符串:‘

    from datetime import datetime
    
    str_time = '2017-11-09 17:15:48'
    
    date_time = datetime.strptime(str_time,'%Y-%m-%d %H:%M:%S')
    print(date_time)
    

    logging模块

    logging模块用于日志的打印记录等,是一个健壮的Python程序所必须具有的模块。

    logging模块支持的日志级别主要有五种:DEBUG,INFO,WARNING,ERROR,CRITICAL。优先级为:CRITICAL > ERROR > WARNING > INFO > DEBUG 。 默认的级别为WARNING。Python只会打印比当前级别高的日志,比如我同时刷出了INFO和ERROR级别的日志,如果我的日志级别设置的为WAIRNING,那么只会打印ERROR的日志。

    基本使用

    引入logging模块,通过logging.级别来输出日志信息

    import logging
    
    logging.debug('debug level message')
    logging.info('info level message')
    logging.warning('warning level message')
    logging.error('error level message')
    logging.critical('crtical level message')
    

    注意:由于默认级别为WARNING,所以上面的例子只会打印WARNING、ERROR、CRITICAL输出的信息

    定义日志格式并输出到文件

    logging提供了基础的日志模版,可以定义日志的输出格式,以及输出位置

    import logging
    
    
    logging.basicConfig(level=logging.DEBUG,
                        format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                        datefmt='%Y-%m-%d %H:%M:%S',
                        filename='log.log',
                        filemode='w')
    
    logging.debug('debug level message')
    logging.info('info level message')
    logging.warning('warning level message')
    logging.error('error level message')
    logging.critical('crtical level message')
    

    basicConfig支持的参数含义为:

    • level:为日志级别,可选参数有logging.DEBUG,logging.INFO,logging.WARNING,logging.ERROR,logging.CRITICAL,分别对应logging的五种日志级别。
    • filename: 表示日志文件的名称及路径。
    • filemode: 表示日志文件的打开模式,默认不指定的情况下为a,可以改为w。
    • datefmt: 对时间进行格式定制,和时间的格式化字符是相同的。
    • format: 对日志格式进行定义。
     1 %(name)s  # Logger的名字
     2 %(levelno)s  # 数字形式的日志级别
     3 %(levelname)s # 文本形式的日志级别
     4 %(pathname)s # 调用日志输出函数的模块的完整路径名,可能没有
     5 %(filename)s # 调用日志输出函数的模块的文件名
     6 %(module)s # 调用日志输出函数的模块名
     7 %(funcName)s # 调用日志输出函数的函数名
     8 %(lineno)d # 调用日志输出函数的语句所在的代码行
     9 %(created)f # 当前时间,用UNIX标准的表示时间的浮 点数表示
    10 %(relativeCreated)d # 输出日志信息时的,自Logger创建以 来的毫秒数
    11 %(asctime)s # 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
    12 %(thread)d # 线程ID。可能没有
    13 %(threadName)s # 线程名。可能没有
    14 %(process)d # 进程ID。可能没有
    15 %(message)s # 用户输出的消息
    format支持的日志格式

    当然logging还有更多灵活的模块:logger,handler,filter,formatter。参考:http://www.jb51.net/article/88449.htm 

    多模块利用logging记录日志

    我们可以把logging写到一个模块中,然后在需要记录的地方,导入模块,记录信息即可。

    # writelog模块:
    import logging
    
    logging.basicConfig(level=logging.WARNING,
                        format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                        datefmt='%Y-%m-%d %H:%M:%S',
                        filename='log.log',
                        filemode='a')
    
    
    
    
    # 需要记录日志的py文件
    import writelog
    
    writelog.logging.debug('debug level message')
    writelog.logging.info('info level message')
    writelog.logging.warning('warning level message')
    writelog.logging.error('error level message')
    writelog.logging.critical('crtical level message')
    

    OS模块 

    OS模块简单的来说它是一个Python的系统编程的操作模块,可以处理文件和目录这些我们日常手动需要做的操作,和所在的操作系统版本无关。

    查看OS模块的帮助文档

    >>> import os  # 导入os模块
    >>> help(os)   # 查看os模块帮助文档,里面详细的模块相关函数和使用方法
    

    常用功能介绍 

    os模块中提供了特别多的和系统相关的操作功能,这里列举一些常用功能 

    os.getcwd()   # 获取当前路径
    os.chdir()  # 切换当前目录,当路径中存在的时候,由于是转意的意思,那么就需要对进行转意,那么路径就是c:\User,或者在目录前面加r,表示后面的字符串不进行解释
    os.curdir()  # 获取当前目录名
    os.pardir()  # 获取上级目录名
    os.mkdir('dir')  # 创建目录,注意只能创建一级目录
    os.makedirs('dir_path')  # 创建多级目录
    os.rmdir('dir')  # 删除一个目录
    os.removedir('dir_path')  # 删除多级目录(目录为空的话)
    os.listdir('dir')  # 显示目录下的所有文件,默认为当前目录,返回的结果为list
    os.remove('file')  # 删除一个文件
    os.rename('old_name','new_name')  # 修改文件名称
    os.stat('file/dir')  # 获取文件/目录的stat信息
    os.sep  # 返回当前操作系统的路径分隔符
    # Windows下:\ , Linux下:/
    os.linesep  # 返回当前操作系统的换行符
    # Windows下:
      ,Linux下:
    
    os.pathsep  # 返回当前操作系统环境变量分隔符
    # Windows下:;   ,   Linux下: :
    os.name  # 返回当前系统的类型
    # nt 表示Windows,  posix表示Linux
    os.system('Commmand')  # 执行命令
    os.environ  # 获取系统环境变量,使用字典存储
    os.path.abspath('dir/file')  # 获取dir/file的绝对路径
    os.path.split('path')  # 把路径分割为目录和文件名组成的元组格式,不管path是否存在
    os.dirname('path')  # 获取文件的父目录名称,不管path是否存在
    os.basename('path')  # 获取文件的名称,不管path是否存在
    os.path.exists('path')  # 判断path是否存在,return bool
    os.path.isabs('path')  # 判断path是否是从根开始,return bool
    # Linux下:从/开始    Windows下从C,D,E盘开始
    os.path.isfile('path')  # 判断path是否是一个文件
    os.path.isdir('path')  # 判断path是否是一个目录
    os.path.join('path1','path2')  # 把path1和path2进行组合
    os.path.getatime('path')  # 获取文件的atime时间,返回时间戳
    os.path.getmtime('path')  # 获取文件的mtime时间,返回时间戳
    os.path.getsize('name')  # 获取文件的大小
    

    commands模块

    commands模块专门用于调用Linux shell命令,并返回状态和结果,和os的popen功能类似,该模块一共有三个函数:getoutput,getstatus,getstatusoutput

    commands.getoutput('Linux shell command')   # 执行Linux shell命令,并获取命令执行的结果
    commands.getstatus('filename')    # 传递filename,执行 'ls -ld  filename' 的命令。
    commands.getstatusoutput('Linux shell command')   # 执行Linux shell命令,返回的是一个元组.。(命令返回code,结果)
    

    实例:

    >>> import commands
    >>> commands.getoutput('who')
    'DahlHin  console  Nov  9 09:38 
    DahlHin  ttys000  Nov 10 10:30 '
    >>> commands.getstatus('.pip')
    'drwxr-xr-x  3 DahlHin  staff  96 10 21 21:44 .pip'
    >>> commands.getstatusoutput('asasas')
    (32512, 'sh: asasas: command not found')
    >>> 
    

    注意:commands模块在Python 3.x中已经被subprocess替代!

    sys模块

    sys模块负责程序与python解释器的交互,提供了一系列的函数和变量,用于操控python的运行时环境。 

    常用函数:

    sys.path # 列出当前Python环境变量,也就是导入时模块的搜索路径
    sys.argv # 类似于shell脚本的$1 $2 ,用于传递命令行参数,使用列表进行传递
    sys.stdout.write(‘#’) # 在屏幕上输出,但是不换行,配合for循环,比较适合用来做进度条等
    sys.stdout.flush() # 配合sys.stdout.write使用,把每次输出的信息,强制刷新到屏幕上,达到动态的效果
    
    1 import sys,time
    2 for i in range(20):
    3     sys.stdout.write('=')
    4     sys.stdout.flush()
    5     time.sleep(1)
    进度条的动态效果

    注意:我们可以把自己写的一些模块加到Python环境变量中去,由于sys.path是list类型,所以只需要append('path'),就可以完成添加。

     1 sys.modules.keys() # 返回所有已经导入的模块列表
     2 sys.exc_info()  # 获取当前正在处理的异常类,exc_type、exc_value、exc_traceback当前处理的异常详细信息
     3 sys.exit(n)  # 退出程序,正常退出时exit(0)
     4 sys.hexversion  # 获取Python解释程序的版本值,16进制格式如:0x020403F0
     5 sys.version  # 获取Python解释程序的版本信息
     6 sys.maxint  # 最大的Int值
     7 sys.maxunicode  # 最大的Unicode值
     8 sys.modules  # 返回系统导入的模块字段,key是模块名,value是模块
     9 sys.platform # 返回操作系统平台名称
    10 sys.stdout  # 标准输出
    11 sys.stdin  # 标准输入
    12 sys.stderr  # 错误输出
    13 sys.exc_clear()  # 用来清除当前线程所出现的当前的或最近的错误信息
    14 sys.exec_prefix  # 返回平台独立的python文件安装的位置
    15 sys.byteorder  # 本地字节规则的指示器,big-endian平台的值是'big',little-endian平台的值是'little'
    16 sys.copyright  # 记录python版权相关的东西
    17 sys.api_version  # 解释器的C的API版本
    其他的sys模块函数

    json&pickle模块

    json和pickle模块是用来做序列化的,为什么要序列化?序列化可以持久保存状态,还可以跨平台数据交互。

    如何序列化?可以使用json或者pickle模块

    1. json(跨平台) 支持字典(dict)、列表(list)、字符串(str)、整型浮点型(int/float)、bool(True,False),null(None)。
    2. pickle(纯Python),可以序列化存储python所有的对象,甚至是一个函数,但是只能和Python程序进行交互,其他凭他不支持。

    eval不能识别非Python语法的数据类型,所以很多时候要用json

    json

    json支持跨平台的序列化存储以及反序列化读取。

    • 序列化:dump,dumps
    • 反序列化:load,loads
    1 # json.dumps 表示序列化,会返回一个序列化后的对象。
    2 
    3 import json
    4 
    5 a = [1,2,3,4]
    6 
    7 b = json.dumps(a)
    8 
    9 print(type(b))
    json.dumps
     1 # json.dump 表示序列化存储到文件中去
     2 
     3 import json
     4 
     5 a = [1,2,3,4,5]
     6 
     7 with open('log.log','w') as f:
     8     json.dump(a,f)
     9 
    10 
    11 # dump 需要两个参数,持久化的存储的对象,第二个是一个可写的文件描述符。
    json.dump
     1 # json.loads 从json字符串反序列化为对象
     2 import json
     3 
     4 a =  '[1, 2, 3, 4]'
     5 
     6 print(type(a))
     7 
     8 b = json.loads(a)
     9 
    10 print(type(b))
    11 
    12 print(b)
    json.loads
    1 # json.load 从文件中反序列化为对象
    2 import json
    3 
    4 with open('hello.txt','r') as f:
    5     b = json.load(f)
    6 
    7 print(b)
    json.load

    pickle

    pickle仅python支持,在序列化到文件中的时候没需要用b模式打开才可以。

    • 序列化:dump,dumps
    • 反序列化:load,loads
     1 # pickle.dumps 把对象序列化为bytes格式数据
     2 import pickle
     3 
     4 a = {
     5     'name':'daxin',
     6     'age':18,
     7     'job':'Linux'
     8 }
     9 
    10 b = pickle.dumps(a)
    11 print(b)
    12 print(type(b))
    pickle.dumps
     1 # pickle.dump 序列化到文件中
     2 import pickle
     3 
     4 a = {
     5     'name':'daxin',
     6     'age':18,
     7     'job':'Linux'
     8 }
     9 
    10 with open('hello.txt','wb') as f:
    11     pickle.dump(a,f)
    pickle.dump
    1 # pickle.loads 把bytes对象反序列化
    2 import pickle
    3 
    4 b = b'x80x03}qx00(Xx04x00x00x00nameqx01Xx05x00x00x00daxinqx02Xx03x00x00x00ageqx03Kx12Xx03x00x00x00jobqx04Xx05x00x00x00Linuxqx05u.'
    5 
    6 a = pickle.loads(b)
    7 
    8 print(a)
    pickle.loads
    1 # pickle.load 从文件中反序列化
    2 import pickle
    3 
    4 with open('hello.txt','rb') as f:
    5     a = pickle.load(f)
    6 
    7 print(a)
    pickle.load

    注意:

      json序列化后的对象类型为str,pickle序列化后的对象类型为bytes,所以pickle序列化/反序列化时对文件的操作需要用b模式。

    备份一个好用的json转换网站:https://www.json.cn/

    random模块

    顾名思义,用来产生随机数的模块,它有 如下几个常用的方法

    random.randint(a,b)         # 在a,b之间随机选出一个数(包含a,b本身)
    random.randrange(a,b,step)  # 这里和range的使用方法是相同的
    random.choice(iterable)     # 在一个可迭代对象中随机选择
    random.shuffle(seq)         # 原地对序列进行洗牌(随机打乱)
    

      

  • 相关阅读:
    对MIME格式的邮件文件进行解码获取其可读内容和附件等
    终于知道RTM的含义了
    当CodeSmith不在时……
    windows server 2008 设置多用户同时远程登录
    关于FAST比较全的博文
    安装web apps
    添加RMS问题
    安装Fast Search For Sharepoint 2010
    sharepoint 2010 企业SN
    安装exchange出错
  • 原文地址:https://www.cnblogs.com/dachenzi/p/7808198.html
Copyright © 2011-2022 走看看