zoukankan      html  css  js  c++  java
  • Python【第五篇】模块、包、常用模块

    一、模块(Module)

    在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护。

    为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式。在Python中,一个.py文件就称之为一个模块(Module)。

    使用模块的好处:

    • 最大的好处是大大提高了代码的可维护性。其次,编写代码不必从零开始。当一个模块编写完毕,就可以被其他地方引用。我们在编写程序的时候,也经常引用其他模块,包括Python内置的模块和来自第三方的模块。
    • 使用模块还可以避免函数名和变量名冲突。每个模块有独立的命名空间,因此相同名字的函数和变量完全可以分别存在不同的模块中,所以,我们自己在编写模块时,不必考虑名字会与其他模块冲突

    模块分类

    模块分为三种:

    • 内置标准模块(又称标准库)执行help('modules')查看所有python自带模块列表
    • 第三方开源模块,可通过pip install 模块名 联网安装
    • 自定义模块

    模块调用

    import module
    from module import xx
    from module.xx.xx import xx
    

    注意:模块一旦被调用,即相当于执行了另外一个py文件里的代码 

    模块安装

    最常用的模块安装方式就是pip安装了,python3 -m pip install 模块名

    模块被安装在python安装目录下的Libsite-packages,比如我的安装在这个目录:C:Python36Libsite-packages

    如果是因为网速问题,超时了,可以加大pip安装时候的超时时间,设置为1000秒,pip --default-timeout=1000 install selenium==2.53.6 

    当然,我们也可以更换模块安装源:

    pip3 install --index-url https://pypi.douban.com/simple selenium==2.53.6

    python3 -m pip install --index-url https://pypi.doubanio.com/simple/ flask --trusted-host pypi.douban.com

    python3 -m pip install -i https://pypi.doubanio.com/simple/ flask --trusted-host pypi.douban.com

    二、包(Package)

    当你的模块文件越来越多,就需要对模块文件进行划分,比如把负责跟数据库交互的都放一个文件夹,把与页面交互相关的放一个文件夹

    .
    └── my_project
        ├── mobileBank #代码目录
        │   ├── admin.py
        │   ├── apps.py
        │   ├── models.py
        │   ├── tests.py
        │   └── views.py
        ├── manage.py
        └── my_proj #配置文件目录
            ├── settings.py
            ├── urls.py
            └── wsgi.py
    

    像上面这样,一个文件夹管理多个模块文件,这个文件夹就被称为包;

    注意,在python3里,即使目录下没__int__.py文件也能创建成功,猜应该是解释器优化所致,但创建包还是要记得加上这个文件 吧。

    根据上面的结构,如何实现在crm/views.py里导入proj/settings.py模块?直接导入的话,会报错,说找到不模块。

    添加环境变量,把父亲级的路径添加到sys.path中,就可以了,这样导入 就相当于从父亲级开始找模块了。

    import sys ,os
    
    BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__))) #__file__的是打印当前被执行的模块.py文件相对路径,注意是相对路径
    print(BASE_DIR)
    
    sys.path.append(BASE_DIR)  
    

    三、常用模块

    os

    os 模块提供了很多允许你的程序与操作系统直接交互的功能

    os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径(其实是py解释器启动的目录)
    os.chdir("dirname")  改变当前脚本工作目录;相当于shell下cd
    os.curdir  返回当前目录: ('.'),注意,os.curdir后面没有括号
    os.pardir  获取当前目录的父目录字符串名:('..')
    os.makedirs('dirname1/dirname2')  可生成多层递归目录,os.makedirs('dirname1dirname2') 也可以,但是最好前面加上r
    os.removedirs('dirname1')    若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
    os.mkdir('dirname')    生成单级目录;相当于shell中mkdir dirname
    os.rmdir('dirname')    删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
    os.listdir('dirname')    列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
    os.walk和os.listdir的结果一样(目录在只有文件,包含目录的情况待测试)
    os.walk() 通过在目录树种游走输出在目录中的文件名,向上或者向下。产生一个三个元素的元组 (dirpath, dirnames, filenames),分别是文件夹路径, 文件夹名字, 文件名,
    os.remove()  删除一个文件,参数写上文件路径
    os.rename("oldname","newname")  重命名文件/目录,和os.renames("oldname","newname")、os.replace("oldname","newname")功能相同,相当于可以实现文件的重命名,文件的移动,文件的移动并重命名,
    os.rename(r'F:practicem2123-2.txt', r'F:practicem1123.txt')
    os.stat('path/filename')  获取文件/目录信息,返回一个类,其中文件大小属性是filesize,和getsize一样,得到的是文件的字节数
    os.sep    输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"
    os.linesep    输出当前平台使用的行终止符(换行),win下为"
    ",Linux和MAC下为"
    "
    os.pathsep    输出用于分割文件路径的字符串 win下为分号;,Linux下为冒号:
    os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
    os.system("bash command")  运行shell命令,直接显示,如os.system('dir'),命令执行成功,在结果下还会返回0,命令执行不成功,返回非0
    os.getenv('HOME') 读取操作系统环境变量HOME的值
    os.environ  获取系统环境变量
    os.environ.setdefault('HOME','/home/wgy') 设置系统环境变量,仅程序运行时有效
    os.chmod(file) 修改文件权限与时间戳
    os.get_terminal_size() 获取当前终端的大小,调整终端窗口大小,行列值跟着变化
    os.kill(10884,signal.SIGKILL) 杀死进程10884
    os.path.abspath(path)  返回path规范化的绝对路径
    os.path.split(path)  将path分割成目录和文件名二元组返回
    os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
    os.path.basename(path)  返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素
    os.path.isabs(path)  如果path是绝对路径,返回True,windows有多个根,比如c:\,d:,linux只有一个根/
    os.path.exists(path)  如果path存在,返回True;如果path不存在,返回False
    os.path.isfile(path)  如果path是一个存在的文件,返回True,否则返回False
    os.path.isdir(path)  如果path是一个存在的目录,则返回True。否则返回False
    os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
    os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间,返回时间戳
    os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间,返回时间戳
    os.path.getsize(path) 返回path的大小(返回的是文件中字节个数,数字和英文是1个字节,中文是3个字节)
    

    sys

    sys.exit(n) # 退出程序,正常退出时exit(0)
    sys.version # 获取Python解释程序的版本信息
    sys.maxint # 最大的Int值(py2),py3中为sys.maxsize
    sys.path  # 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
    sys.platform  # 返回操作系统平台名称
    sys.stdout.write('please:')  # 标准输出 , 引出进度条的例子, 注,在py3上不行,可以用print代替
    sys.stdin.read() # 会一直等待用户输入,哪怕用户输入了,只能ctrl+c结束
    sys.getrecursionlimit() # 获取最大递归层数
    sys.setrecursionlimit(1200) # 设置最大递归层数
    sys.getdefaultencoding()  # 获取解释器默认编码
    sys.getfilesystemencoding  # 获取内存数据存到文件里的默认编码
    sys.modules  # 是一个dictionary,表示系统中所有可用的module,面向对象中, 反射会用到
    

    time

    在Python中,通常有这几种方式来表示时间:时间戳、格式化的时间字符串、元组(struct_time)共九个元素。由于Python的time模块实现主要调用C库,所以各个平台可能有所不同。

    几个定义:

      UTC(Coordinated Universal Time,世界协调时)亦即格林威治天文时间,世界标准时间。在中国为UTC+8。DST(Daylight Saving Time)即夏令时。

      时间戳(timestamp)的方式:通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回的是float类型。

      元组(struct_time)方式:struct_time元组共有9个元素,返回struct_time的函数主要有gmtime(),localtime(),strptime()。下面列出这种方式元组中的几个元素:

    索引(Index)    属性(Attribute)    值(Values)
    0     tm_year(年)                 比如2011 
    1     tm_mon(月)             1 - 12
    2     tm_mday(日)                 1 - 31
    3     tm_hour(时)                 0 - 23
    4     tm_min(分)             0 - 59
    5     tm_sec(秒)             0 - 61
    6     tm_wday(weekday)            0 - 6(0表示周日)
    7     tm_yday(一年中的第几天)    1 - 366
    8     tm_isdst(是否是夏令时)            默认为-1
    

    常用方法

    time.localtime([secs]):将一个时间戳转换为当前时区的struct_time。secs参数未提供,则以当前时间为准。
    time.gmtime([secs]):和localtime()方法类似,gmtime()方法是将一个时间戳转换为UTC时区(0时区)的struct_time。
    time.time():返回当前时间的时间戳。
    time.mktime(t):将一个struct_time转化为时间戳。
    time.sleep(secs):线程推迟指定的时间运行。单位为秒。
    time.asctime([t]):把一个表示时间的元组或者struct_time表示为这种形式:'Wed Jun 14 12:36:17 2017'。如果没有参数,将会将time.localtime()作为参数传入。
    time.ctime([secs]):把一个时间戳(按秒计算的浮点数)转化为time.asctime()的形式。如果参数未给或者为None的时候,将会默认time.time()为参数。它的作用相当于time.asctime(time.localtime(secs))。
    time.strftime(format[, t]):把一个代表时间的元组或者struct_time(如由time.localtime()和time.gmtime()返回)转化为格式化的时间字符串。如果t未指定,将传入time.localtime()。
    

    示例:

    import time
    print(time.time())
    print(time.ctime())
    print(time.localtime())
    print(time.strftime('%Y_%m_%d %H:%M:%S'))
    

    1497414977.1362307
    Wed Jun 14 12:36:17 2017
    time.struct_time(tm_year=2017, tm_mon=6, tm_mday=14, tm_hour=12, tm_min=36, tm_sec=17, tm_wday=2, tm_yday=165, tm_isdst=0)
    2017_06_14 12:36:17

    datetime

    相比于time模块,datetime模块的接口则更直观、更容易调用

    datetime.date:表示日期的类。常用的属性有year, month, day;
    datetime.time:表示时间的类。常用的属性有hour, minute, second, microsecond;
    datetime.datetime:表示日期时间。
    datetime.timedelta:表示时间间隔,即两个时间点之间的长度。
    datetime.tzinfo:与时区有关的相关信息。
    

    random

    程序中有很多地方需要用到随机字符,比如登录网站的随机验证码,通过random模块可以很容易生成随机字符串。

    import random
    print(random.random())  # (0,1)----float    大于0且小于1之间的小数
    print(random.randint(1, 3))  # [1,3]    大于等于1且小于等于3之间的整数,包含3
    print(random.randrange(1, 3))  # [1,3)    大于等于1且小于3之间的整数,不包含3
    print(random.choice([1, '23', [4, 5]]))  # 1或者23或者[4,5],返回一个给定数据集合中的随机元素
    print(random.choice('abcde'))
    print(random.sample([1, '23', [4, 5]], 2))  # 列表元素任意2个组合,返回一个列表
    print(random.sample('python', 3)) # 返回一个列表
    
    '''
    0.8069726390185565
    2
    1
    1
    d
    [[4, 5], '23']
    ['y', 'p', 'o']
    '''
    

    hashlib

    hashlib是一个加密模块,提供了常见的加密算法,比如MD5,SHA1,SHA256等,它通过一个函数,把任意长度的数据转换为一个长度固定的数据串,常用来保存密码等,比如将用户的密码用MD5加密后,保存到数据库,用户登录时先计算用户输入的明文口令的MD5,然后和数据库存储的MD5对比,如果一致,说明密码输入正确,如果不一致,密码肯定错误。

    import hashlib
    
    passwd = hashlib.sha256()
    passwd.update('123456'.encode('utf-8'))  # 假设密码是123456 将其转换为字节,传入函数
    print(passwd.hexdigest())  # 8d969eef6ecad3c29a3a629280e686cf0c3f5d5a86aff3ca12020c923adc6c92
    
    passwd = hashlib.sha256('UncleYong'.encode('utf-8'))  # 对原始密码加一个复杂字符串来提高安全性,俗称“加盐”
    print(passwd.hexdigest())  # 66d184cfeedb54b8f0e7819e01a2ab28ec7038ff7677716740c7e0d1962f84b1
    passwd.update('123456'.encode('utf-8'))  # d217b3c0f274dbaf8fe145df567a9f53df056527d01b541bb1a6997373485f26
    print(passwd.hexdigest())
    

    re

    正则表达式就是字符串的匹配规则,在多数编程语言里都有相应的支持,python里对应的模块是re

    '.'     默认匹配除
    之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行
    '^'     匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","
    abc
    eee",flags=re.MULTILINE)
    '$'     匹配字符结尾, 若指定flags MULTILINE ,re.search('foo.$','foo1
    foo2
    ',re.MULTILINE).group() 会匹配到foo1
    '*'     匹配*号前的字符0次或多次, re.search('a*','aaaabac')  结果'aaaa'
    '+'     匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
    '?'     匹配前一个字符1次或0次 ,re.search('b?','jack').group() 匹配b 0次
    '{m}'   匹配前一个字符m次 ,re.search('b{3}','jackxbbbs').group()  匹配到'bbb'
    '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
    '|'     匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
    '(...)' 分组匹配, re.search("(abc){2}a(123|45)", "abcabca456c").group() 结果为'abcabca45'
    
    
    'A'    只从字符开头匹配,re.search("Aabc","jackabc") 是匹配不到的,相当于re.match('abc',"jackabc") 或^
    ''    匹配字符结尾,同$ 
    'd'    匹配数字0-9
    'D'    匹配非数字
    'w'    匹配[A-Za-z0-9]
    'W'    匹配非[A-Za-z0-9]
    's'     匹配空白字符、	、
    、
     , re.search("s+","ab	c1
    3").group() 结果 '	'
    

    json

    如果要在不同的平台间传递信息的话,就可以用到Json模块,json用于字符串 和 python数据类型间进行转换,只能支持intstrlist upledict

    json提供了四个功能:dumps、dump、loads、load

    json:dumps & loads

    import json
    data = {'k1':123,'k2':'Hello'}
    # json.dumps 将数据通过特殊的形式转换为所有程序语言都认识的字符串
    j_str = json.dumps(data)
    print(j_str, type(j_str))
    res = json.loads(j_str)
    print(res, type(res))
    
    '''
    {"k1": 123, "k2": "Hello"} <class 'str'>
    {'k1': 123, 'k2': 'Hello'} <class 'dict'>
    '''
    

    json:dump

    import json
    data = {'k1':123,'k2':'Hello'}
    # json.dump 将数据通过特殊的形式转换为所有程序语言都认识的字符串,并写入文件
    json.dump(data,open('D:/result.json','w'))
    

    json:load

    import json
    res = json.load(open('D:/result.json', 'r'))
    print(res,type(res))
    
    '''
    {'k1': 123, 'k2': 'Hello'} <class 'dict'>
    '''
    

    logging

    logging是用来纪录日志的模块,可以自动帮我们纪录程序运行中出现的错误,出了问题可以方便我们后来去日志中查找原因,在实际开发中非常好用。

    日志级别

    日志格式

    import logging
    
    class IgnoreBackupLogFilter(logging.Filter):
        def filter(self, record):  # 固定写法
            return "db backup" not in record.getMessage()
    
    logger = logging.getLogger('my_log')
    
    logger.addFilter(IgnoreBackupLogFilter())
    
    sh = logging.StreamHandler()
    sh.setLevel(logging.INFO)
    
    fh = logging.FileHandler('test.log', mode='a', encoding='utf-8')
    fh.setLevel(logging.INFO)
    
    logger.addHandler(sh)
    logger.addHandler(fh)
    
    formater = logging.Formatter('%(asctime)s - %(pathname)s[line:%(lineno)d] - %(levelname)s: %(message)s')
    sh.setFormatter(formater)
    fh.setFormatter(formater)
    
    logger.debug('debug级别,最低级别,http://www.cnblogs.com/UncleYong/')
    logger.info('info级别,正常输出信息,http://www.cnblogs.com/UncleYong/')
    logger.warning('waring级别,http://www.cnblogs.com/UncleYong/')
    logger.error('error级别,http://www.cnblogs.com/UncleYong/')
    logger.critical('critical级别,http://www.cnblogs.com/UncleYong/,db backup')
    

    四、练习题(参考答案已放在Q群文件中)

    1.利用内置函数chr(),ord()以及random模块写一个简单随机4位验证码。

  • 相关阅读:
    CentOS6.4 64位系统安装jdk
    oracle安装界面中文乱码解决
    亦步亦趋在CentOS 6.4下安装Oracle 11gR2(x64)
    CentOS 6.3(x86_64)下安装Oracle 10g R2
    Spring中映射Mongodb中注解的解释
    MongoDB 创建基础索引、组合索引、唯一索引以及优化
    MongoDB 用MongoTemplate查询指定时间范围的数据
    Java获取泛化类型
    SpringBoot标准Properties
    java如何获取一个对象的大小【转】
  • 原文地址:https://www.cnblogs.com/uncleyong/p/6230231.html
Copyright © 2011-2022 走看看