什么是模块?
一个模块就是一个包含了Python定义和声明的文件,文件名就是模块名字加上.py的后缀。
但其实import加载的模块分为以下四个通用类别:
1、使用Python编写的代码(.py文件);
2、已被比编译为共享库或DLL的C或者C++的扩展;
3、包好一组模块的包;
4、使用C编写并连接到Python解释器的内置模块。
为何要使用模块?
如果你退出Python解释器然后重新进入,那么你之前定义的函数或者变量都将丢失,因此我们通常将程序写到文件中,以便永久保存下来。需要时就通过Python test.py的方式去执行,此时test.py被称为脚本script。
随着程序的发展,功能越来越多,为了方便管理,我们通常将程序分成一个个的文件,这样做程序的结构清晰,方便管理。这是我们不仅仅可以把这些文件当做脚本去执行,还可以把它们当做模块来导入到其它的模块中,实现了功能的重复利用。
模块的导入:直接导入文件的名字,不需要带着后缀
模块中的函数调用:模块名.函数名()
模块导入的时候后台做了以下三件事:
1、开辟了一个新的命名空间;
2、执行模块内的代码;
3、将模块里面的名字都和模块绑定在一起。
模块在一个程序中只会被导入一次,不会被重复导入。
模块导入后,会将模块存储在内存中,当再次导入时就到内存中去查看是否导入过这个模块,如果有导入过后就不继续导入了。
常用模块及功能图
一、collections模块
collections模块功能:在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter、deque、 defaultdict、namedtuple、OrderedDict等。
1、namedtuple:生成可以使用名字来访问元素内容的tuple;
我们知道tuple可以表示不变集合,例如一个点的二维坐标就可以表示成:
p = (1,2)
但是,看到(1,2)很难看出这个tuple是用来表示一个坐标的。
这时namedtuple就派上了用场:
from collections import namedtuple #调用模块 Point = namedtuple('Point',['x','y']) p = Point(1,2) print(p.x) #输出结果1 print(p.y) #输出结果2
2、deque:双端队列,可以快速的从另外一侧追加和推出对象;
使用list存储数据时,按索引访问元素很快,但是插入和删除元素就很慢了,因为list时线性存储,数据量大的时候插入和删除的效率很低。
deque是为了高效实现插入和删除操作的双向列表,使用适合用于队列和栈:
from collections import deque q = deque(['a','b','c']) q.append('x') #默认从最后增加 print(q) q.appendleft('y') #指定从左边开始增加 print(q)
deque实现了list的append()和pop()外,还支持appendleft()和popleft(),这样就可以非常高效地从头部添加或删除元素。
3、Counter:计数器,主要用来计数;
Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。Counter类和其他语言的bags或multisets很相似。
4、defaultdict:带有默认值的字典:
有如下值集合 [
11
,
22
,
33
,
44
,
55
,
66
,
77
,
88
,
99
,
90.
..],将所有大于
66
的值保存至字典的第一个key中,将小于
66
的值保存至第二个key的值中。
dic1 = {} list2 = [11,22,33,44,55,66,77,88,99,90] for i in list2: if i >= 66: dic1.setdefault('k1',[]).append(i) else: dic1.setdefault('k2',[]).append(i) print(('大于66的数字有:%s')%dic1['k1']) print(('小于66的数字有:%s')%dic1['k2']) #输出结果:大于66的数字有:[66, 77, 88, 99, 90] #小于66的数字有:[11, 22, 33, 44, 55]
defaultdict字典解决方法
from collections import defaultdict values = [11,22,33,44,55,66,77,88,99,90] my_dict = defaultdict(list) for value in values: if value > 66: my_dict['k1'].append(value) else: my_dict['ke'].append(value) print(my_dict)
5、OrderedDict:
使用dict时,key时无序的。在对dict做迭代时,我们无法确定key的顺序。
如果要保持key的顺序,可以用OrferedDict:
二、时间模块(time)
在Python中,通常有这三种方式来表示时间:时间戳、元祖(struct)、格式化的时间字符串
1)时间(timestamp):通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行‘type(time())’,返回的是float类型。
2)格式化的时间字符串(Format String):‘1999-12-06’
%y 两位数的年份表示(00-99) %Y 四位数的年份表示(000-9999) %m 月份(01-12) %d 月内中的一天(0-31) %H 24小时制小时数(0-23) %I 12小时制小时数(01-12) %M 分钟数(00=59) %S 秒(00-59) %a 本地简化星期名称 %A 本地完整星期名称 %b 本地简化的月份名称 %B 本地完整的月份名称 %c 本地相应的日期表示和时间表示 %j 年内的一天(001-366) %p 本地A.M.或P.M.的等价符 %U 一年中的星期数(00-53)星期天为星期的开始 %w 星期(0-6),星期天为星期的开始 %W 一年中的星期数(00-53)星期一为星期的开始 %x 本地相应的日期表示 %X 本地相应的时间表示 %Z 当前时区的名称 %% %号本身
3)元祖(struct_time):struct_time元祖共有9个元素:(年月日时分秒,一年中第几周,一年中第几天等)
首先,我们先导入time模块,来认识一下Python中表示时间的几中格式:
#导入时间模块 import time
#时间戳 # print(time.time()) #输出结果:1502182682.9042535
#时间字符串: # t = time.strftime("%Y-%m-%d %X") # print(t) #输出结果:2017-08-08 16:59:36
# 时间元祖:localtime将一个时间戳转换为当前时区的struct_time print(time.localtime()) #输出结果 time.struct_time(tm_year=2017, tm_mon=7, tm_mday=24,tm_hour=13, tm_min=59, tm_sec=37,tm_wday=0, tm_yday=205, tm_isdst=0)
小结:时间戳是计算机能够识别的时间,时间字符串是人类能够看懂的时间,元祖则是用来操作时间的。
集中格式之间如何转换?
三、random模块
描述:random()方法是返回随机生成的一个实数,它在(0-1)范围内。
语法如下:
import random random.random()
注意事项:random()是不能直接访问的,需要导入random模块,然后通过random()静态对象调用该方法。
实例:以下展示了使用random()方法的实例:
import random # 第一个随机数 print ("random() : ", random.random()) #输出结果:random() : 0.09331619659624946 # 第二个随机数 print ("random() : ", random.random()) #输出结果:random() : 0.8664962793234653 import random print(random.randint(1,5)) #大于等于1且小于等于5之间的整数 print(random.randrange(1,10,2)) #大于等于1且小于等于10,步长为2 # 随机选择一个返回 print(random.choice([1,'23',[4,5]])) #随机选择1个返回。 print(random.choice([1,'23',[4,5]]),2) #随机选择多个返回,返回的个数为函数的第二个参数。
四、OS模块
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd os.curdir 返回当前目录: ('.') os.pardir 获取当前目录的父目录字符串名:('..') os.makedirs('dirname1/dirname2') 可生成多层递归目录 os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.remove() 删除一个文件 os.rename("oldname","newname") 重命名文件/目录 os.stat('path/filename') 获取文件/目录信息 os.sep 输出操作系统特定的路径分隔符,win下为"\",Linux下为"/" os.linesep 输出当前平台使用的行终止符,win下为" ",Linux下为" " os.pathsep 输出用于分割文件路径的字符串 win下为;,Linux下为: os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix' os.system("bash command") 运行shell命令,直接显示 os.popen("bash command) 运行shell命令,获取执行结果 os.environ 获取系统环境变量 os.path os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以/或结尾,那么就会返回空值。 即os.path.split(path)的第二个元素 os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False os.path.isabs(path) 如果path是绝对路径,返回True os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.getatime(path) 返回path所指向的文件或者目录的最后访问时间 os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间 os.path.getsize(path) 返回path的大小
注意:os.stat('path/filename') 获取文件/目录信息 的结构说明
stat 结构: st_mode: inode 保护模式 st_ino: inode 节点号。 st_dev: inode 驻留的设备。 st_nlink: inode 的链接数。 st_uid: 所有者的用户ID。 st_gid: 所有者的组ID。 st_size: 普通文件以字节为单位的大小;包含等待某些特殊文件的数据。 st_atime: 上次访问的时间。 st_mtime: 最后一次修改的时间。 st_ctime: 由操作系统报告的"ctime"。在某些系统上(如Unix)是最新的元数据更改的时间,在其它系统上(如Windows)是创建时间(详细信息参见平台的文档)。
五、SYS模块
sys模块是与Python解释器交互的一个接口
sys.argv 命令行参数List,第一个元素是程序本身路径
sys.exit(n) 退出程序,正常退出时exit(0)
sys.version 获取Python解释程序的版本信息
sys.maxint 最大的Int值
sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
sys.platform 返回操作系统平台名称
六、序列化模块
1、什么叫有序化?
将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化。
2、序列化的目的:
a.以某种存储形式使自定义对象持久化;
b.将对象从一个地方传递到另一个地方;
c.使程序更具维护性。