---恢复内容开始---
一,re 正则模块
二、time datetime 时间模块
三、random 模块
四、OS模块
五、sys模块
六、shutil模块
七、json&pickle模块
一,正则模块re
一:什么是正则?
正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。
import re
print(re.findall('w','egon 123 = — - +')) #w 匹配字母数字下划线
打印结果:['e', 'g', 'o', 'n', '1', '2', '3']
正则常用操作
# Author:land
#print(re.findall('w','egon 123 + _ - +')) #w 匹配字母数字下划线
#?: 代表?号左边的字符出现0次或者1次
#*: 代表*号左边的字符出现0次或者无穷次
#+: 代表+号左边的字符出现1次或者无穷次
#{m,n}: 代表号左边的字符出现0次或者无穷次
#.* 贪婪匹配
#.*? 非贪婪匹配 (用这个)
#re.search() #值匹配成功一次就返回
#re.match() #从开头取
import re
# print(re.findall('w','egon 123 = — - +')) #w 匹配字母数字下划线
# print(re.findall('W','egon 123 = — - +')) #w 匹配非字母数字下划线
# print(re.findall('s','egon 123 = — - +')) #s 匹配任意空白字符
# print(re.findall('S','egon 123 = — - +')) #S
#重复. * ? + {m,n}
# . 代表匹配任意一个字符
# print(re.findall('a.b','alb a b a-b aaaaab'))
# # a.b
#
# print(re.findall('a.b','alb a
b a-b aaaaab',re.DOTALL)) #匹配出
#? ?号代表她左边的字符出现0次或者1次
# print(re.findall('ab?','ab a b a-b abbbb'))
#* *号代表她左边的字符出现0次或者无穷次
# print(re.findall('ab*','ab a b a-b aabbbbb'))
#+ +号代表她左边的字符出现1次或者无穷次
# print(re.findall('ab+','ab a b a-b aabbbbb'))
# {m,n} 代表左边的字符出现m到n次
#print(re.findall('ab{1,3}','ab a b a-b aabbbbb'))
#.* 贪婪匹配
#print(re.findall('a.*b','ab jfnj cc xxxxaayyybbbbb'))
#.*? 非贪婪匹配 常用
#print(re.findall('a.*?b','ab jfnj cc xxxxaayyybbbbb'))
#| 或者
# print(re.findall('compla(y|ies)','too girl complay and complaies'))
# print(re.findall('compla(?:y|ies)','too complay and complaies'))
# print(re.findall(r'a\c','ac alc aBc')) #r的意思是不要做语法级别的转义 #不加r会报错
# print(re.findall('a\\c','ac alc aBc')) #不加r的时候
#[] 去[]号内任意一个字符
#re模块其他方法
#re.search() 只匹配成功一次就返回
# print(re.search('a[^-+*/]b','axb azb aAb alb a-b a+b'))
# print(re.search('a[*]b','axb azb aAb alb a-b a+b')) #没结果返回none
# print(re.search('a[0-9]b','axb azb aAb a2b a-b a+b').group())
#re.split() 以冒号分割
#print(re.split(':','root:x:0:0::/root:/bin/bash'))
#re.sub() 就替换的意思
print(re.sub('root','admin','root:x::0:0:/bin/bash')) #把root替换为admin
#re.compile()
二、time 时间模块
在Python中,通常有这几种方式来表示时间:
- 时间戳(timestamp):通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回的是float类型。
- 格式化的时间字符串(Format String)
- 结构化的时间(struct_time):struct_time元组共有9个元素共九个元素:(年,月,日,时,分,秒,一年中第几周,一年中第几天,夏令时)
# Author:land
import time
#print(time.time())
#print(time.localtime()) #结构化时间
#print(time.localtime().tm_mday)
#print(time.gmtime())
print(time.strftime('%Y-%m-%d %H:%M:%S'))
import datetime print(datetime.datetime.now()) print(datetime.datetime.fromtimestamp(2222222)) print(datetime.datetime.now()+datetime.timedelta(days=3)) #3天以后的时间 print(datetime.datetime.now()+datetime.timedelta(days=-3)) #3天以前的时间 print(datetime.datetime.now()+datetime.timedelta(hours=3)) #3小时以后的时间 print(datetime.datetime.now().replace(year=1999,hour=12))
三、random 模块
# Author:land
import random
# print(random.random()) #取0-1之间的小树
# print(random.randint(1,3))
# print(random.randrange(1,3))
# print(random.choice([1,'jdu','fg']))
#
# print(random.uniform(1,3))
#随机生成字母数字验证码
def mak_code(n):
res='' #定义一个空字符串
for i in range(n):
s1=str(random.randint(0,9)) #获取一盒随机整数 然后转换成字符
s2=chr(random.randint(65,90)) #获取A-Z的大写字母
res+=random.choice([s1,s2]) #然后随机选择一个进行相加n次
return res #返回res
print(mak_code(4))
四、OS模块
os模块是与操作系统交互的一个接口
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径
os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd
os.curdir 返回当前目录: ('.')
os.pardir 获取当前目录的父目录字符串名:('..')
os.makedirs('dirname1/dirname2') 可生成多层递归目录
os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname
os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
os.remove() 删除一个文件
os.rename("oldname","newname") 重命名文件/目录
os.stat('path/filename') 获取文件/目录信息
os.sep 输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"
os.linesep 输出当前平台使用的行终止符,win下为"
",Linux下为"
"
os.pathsep 输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command") 运行shell命令,直接显示
os.environ 获取系统环境变量
os.path.abspath(path) 返回path规范化的绝对路径
os.path.split(path) 将path分割成目录和文件名二元组返回
os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path) 返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path) 如果path是绝对路径,返回True
os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False
os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False
os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小
五、sys模块
1 sys.argv 命令行参数List,第一个元素是程序本身路径 2 sys.exit(n) 退出程序,正常退出时exit(0) 3 sys.version 获取Python解释程序的版本信息 4 sys.maxint 最大的Int值 5 sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值 6 sys.platform 返回操作系统平台名称
六、shutil模块
高级的 文件、文件夹、压缩包 处理模块
shutil.copyfileobj(fsrc, fdst[, length])
将文件内容拷贝到另一个文件中
1 import shutil
2
3 shutil.copyfileobj(open('old.xml','r'), open('new.xml', 'w'))
shutil.copyfile(src, dst)
拷贝文件
1 shutil.copyfile('f1.log', 'f2.log') #目标文件无需存在
shutil.copymode(src, dst)
仅拷贝权限。内容、组、用户均不变
1 shutil.copymode('f1.log', 'f2.log') #目标文件必须存在
shutil.copystat(src, dst)
仅拷贝状态的信息,包括:mode bits, atime, mtime, flags
1 shutil.copystat('f1.log', 'f2.log') #目标文件必须存在
shutil.copy(src, dst)
拷贝文件和权限
1 import shutil
2
3 shutil.copy('f1.log', 'f2.log')
shutil.copy2(src, dst)
拷贝文件和状态信息
1 import shutil
2
3 shutil.copy2('f1.log', 'f2.log')
shutil.ignore_patterns(*patterns)
shutil.copytree(src, dst, symlinks=False, ignore=None)
递归的去拷贝文件夹
1 import shutil
2
3 shutil.copytree('folder1', 'folder2', ignore=shutil.ignore_patterns('*.pyc', 'tmp*')) #目标目录不能存在,注意对folder2目录父级目录要有可写权限,ignore的意思是排除
七、json&pickle模块
用eval内置方法可以将一个字符串转成python对象,不过,eval方法是有局限性的,对于普通的数据类型,json.loads和eval都能用,但遇到特殊类型的时候,eval就不管用了,所以eval的重点还是通常用来执行一个字符串表达式,并返回表达式的值。
什么是序列化?
我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。
为什么要序列化?
1:持久保存状态
需知一个软件/程序的执行就在处理一系列状态的变化,在编程语言中,'状态'会以各种各样有结构的数据类型(也可简单的理解为变量)的形式被保存在内存中。
内存是无法永久保存数据的,当程序运行了一段时间,我们断电或者重启程序,内存中关于这个程序的之前一段时间的数据(有结构)都被清空了。
在断电或重启程序之前将程序当前内存中所有的数据都保存下来(保存到文件中),以便于下次程序执行能够从文件中载入之前的数据,然后继续执行,这就是序列化。
具体的来说,你玩使命召唤闯到了第13关,你保存游戏状态,关机走人,下次再玩,还能从上次的位置开始继续闯关。或如,虚拟机状态的挂起等。
2:跨平台数据交互
序列化之后,不仅可以把序列化后的内容写入磁盘,还可以通过网络传输到别的机器上,如果收发的双方约定好实用一种序列化的格式,那么便打破了平台/语言差异化带来的限制,实现了跨平台数据交互。
反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。
如何序列化之json和pickle:
json
如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。
JSON表示的对象就是标准的JavaScript语言的对象,JSON和Python内置的数据类型对应如下:

1 import json
2
3 dic={'name':'alvin','age':23,'sex':'male'}
4 print(type(dic))#<class 'dict'>
5
6 j=json.dumps(dic)
7 print(type(j))#<class 'str'>
8
9
10 f=open('序列化对象','w')
11 f.write(j) #-------------------等价于json.dump(dic,f)
12 f.close()
13 #-----------------------------反序列化<br>
14 import json
15 f=open('序列化对象')
16 data=json.loads(f.read())# 等价于data=json.load(f)

1 import pickle
2
3 dic={'name':'alvin','age':23,'sex':'male'}
4
5 print(type(dic))#<class 'dict'>
6
7 j=pickle.dumps(dic)
8 print(type(j))#<class 'bytes'>
9
10
11 f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes'
12 f.write(j) #-------------------等价于pickle.dump(dic,f)
13
14 f.close()
15 #-------------------------反序列化
16 import pickle
17 f=open('序列化对象_pickle','rb')
18
19 data=pickle.loads(f.read())# 等价于data=pickle.load(f)
20
21
22 print(data['age'])