本周的主要学习内容是摸快,包括模块的使用,模块中个种方法的使用。
模块,用一砣代码实现了某个功能的代码集合。
类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合。而对于一个复杂的功能来,可能需要多个函数才能完成(函数又可以在不同的.py文件中),n个 .py 文件组成的代码集合就称为模块。
模块的定义:
用来从逻辑上组织python代码,本质是.py结尾的python的文件
包的定义:
用来从逻辑上组织模块
本质就是一个文件夹,必须带有一个__init__.py的文件
导入包的本质就是执行该包下的__init__.py文件。
导入的方式:
import 模块名 import的本质是搜索路径和路径搜索
from xxx import *
from import 和 import 区别:
from import logger as logger_houyafan # 将导入的名字换个名字 防止冲突调用
导入的模块 实际上就是将模块运行一遍 结果传给模块的变量名
可以只解释函数中的某一个变量 或 值
from 方法名 import 变量,方法 直接用就可以 不需要在加调用的名
一、time和datetime模块
time的模块主要注意时间格式的各种切换
time.time()是获取的unix时间戳
time.loccaltime() 返回的是struct_time的一个元组
变成日期格式的化可以使用
time.strftime("%Y-%m-%d %H:%M:%S",time.localtime())
相反的将和石化的时间通过strptime转换为元组
time.strptime()
import time,datetime # 1970 年到 现在 print(time.time()) # unix时间戳 time.localtime() # print(time.timezone) # 标准时间相差的时间 时间是秒 time.sleep(2) # 睡两秒 time.gmtime()# 传一个时间戳 返回一个元组的时间 默认不传获取 获取utc的时间 与现在时间相差8小时 time.localtime()# 转换一个元组 时间日期 可以unix时间转换成元组 utc+8 # 取struct_time 中的值 x=time.localtime() print(x.tm_year) # 增加tm来获取 # mktime(x)s将 元组的时间 转换为 秒的形式 print(time.mktime(x)) # strftime() 格式化时间 随心所欲 print(time.strftime("%Y-%m-%d %H:%M:%S",x)) time1=time.strftime("%Y-%m-%d %H:%M:%S",x) # strptime 将格式化的时间转为元组 print(time.strptime(time1,"%Y-%m-%d %H:%M:%S")) # 将格式化的时间 转为元组 # 将当前的时间转为 格式化的时间 可以直接传入struct_time(tuple) time.asctime() # ctime 传入时间戳 于 asctime转出来的样式相同 接受参数不同 ctime是字符串 time.ctime() # datetime datetime.datetime().now()# 年月日分十秒 格式化的时间 datetime.datetime().now()+datetime.timedelta(3) # 当前时间加三天的时间 可以获取未来 以前的以前
二、random模块
随机模块,作用是生成随机数,或根据要求随机一定范围内的数或字符或浮点数等
random.random() # 随机浮点数的值 random.randint(1,3)# 随机整数 前后都能取到 1 2 3 random.randrange(3) # 顾头不顾尾 值的随机只有0 1 2 random.choice('abcd')# 放入的是序列 可以传入字符串、列表 随机字符 随机取值
random.sample('hello',2)# 随机取数列的两位
random.uniform(1,3) # 增加区间 随机1到三
random.shuffle() # 洗牌功能 list打乱顺序
三、os模块
提供对操作系统进行调用的接口
os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") 改变当前脚本工作目录;相当于shell下cd os.curdir 返回当前目录: ('.') os.pardir 获取当前目录的父目录字符串名:('..') os.makedirs('dirname1/dirname2') 可生成多层递归目录 os.removedirs('dirname1') 若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 os.mkdir('dirname') 生成单级目录;相当于shell中mkdir dirname os.rmdir('dirname') 删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname os.listdir('dirname') 列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.remove() 删除一个文件 os.rename("oldname","newname") 重命名文件/目录 os.stat('path/filename') 获取文件/目录信息 os.sep 输出操作系统特定的路径分隔符,win下为"\",Linux下为"/" os.linesep 输出当前平台使用的行终止符,win下为" ",Linux下为" " os.pathsep 输出用于分割文件路径的字符串 os.name 输出字符串指示当前使用平台。win->'nt'; Linux->'posix' os.system("bash command") 运行shell命令,直接显示 os.environ 获取系统环境变量 os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素 os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False os.path.isabs(path) 如果path是绝对路径,返回True os.path.isfile(path) 如果path是一个存在的文件,返回True。否则返回False os.path.isdir(path) 如果path是一个存在的目录,则返回True。否则返回False os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.getatime(path) 返回path所指向的文件或者目录的最后存取时间 返回的时间戳 os.path.getmtime(path) 返回path所指向的文件或者目录的最后修改时间 返回的时间戳 os.chmod("/usr/local",7)#给文件/目录加权限
四、sys模块
sys模块包括了一组非常实用的服务,内含很多函数方法和变量,用来处理Python运行时配置以及资源,从而可以与前当程序之外的系统环境交互,如:Python解释器。
sys.argv 命令行参数List,第一个元素是程序本身路径 sys.exit(n) 退出程序,正常退出时exit(0) sys.version 获取Python解释程序的版本信息 sys.maxint 最大的Int值 sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量 的值
sys.path中含有多种操作环境变量的方法 如 insert index pop append等 如需使用时 用help(sys.path) 查看使用即可 sys.platform 返回操作系统平台名称 sys.stdout.write('please:') sys.stdout.flash() 实时写入内存 val = sys.stdin.readline()[:-1]
五、shutil模块
六、json和pickle
用于序列化的两个模块
- json,用于字符串 和 python数据类型间进行转换
- pickle,用于python特有的类型 和 python的数据类型间进行转换
Json模块提供了四个功能:dumps、dump、loads、load
pickle模块提供了四个功能:dumps、dump、loads、load
import json json.dumps 将字典转为字符串 json.loads 将字符串转为字典 import json b={'a':12} string=json.dumps(b) print(string,type(string)) dict1=json.loads(string) print(dict1,type(dict1))
pickle 将字符串或字典转换为二进制文件 与json使用方式相同 pickle 可以序列化python中所有的数据 import pickle b={'a':12} string=pickle.dumps(b) print(string,type(string)) dict1=pickle.loads(string) print(dict1,type(dict1)) b={'a':12} with open('test.test','w')as f: pickle.dump(b,f) b是内存对象 f是写入文件 load 方法同样
七、shelve 模块
shelve模块是一个简单的k,v将内存数据通过文件持久化的模块,可以持久化任何pickle可支持的python数据格式
import shelve d = shelve.open('shelve_test') #打开一个文件 class Test(object): def __init__(self,n): self.n = n t = Test(123) t2 = Test(123334) name = ["alex","rain","test"] d["test"] = name #持久化列表 d["t1"] = t #持久化类 d["t2"] = t2 d.close()
八、xml处理模块
xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,但json使用起来更简单,不过,古时候,在json还没诞生的黑暗年代,大家只能选择用xml呀,至今很多传统公司如金融行业的很多系统的接口还主要是xml。
xml的格式如下,就是通过<>节点来区别数据结构的:
来看一段XML代码
<?xml version="1.0"?> <data> <country name="Liechtenstein"> <rank updated="yes">2</rank> <year>2008</year> <gdppc>141100</gdppc> <neighbor name="Austria" direction="E"/> <neighbor name="Switzerland" direction="W"/> </country> <country name="Singapore"> <rank updated="yes">5</rank> <year>2011</year> <gdppc>59900</gdppc> <neighbor name="Malaysia" direction="N"/> </country> <country name="Panama"> <rank updated="yes">69</rank> <year>2011</year> <gdppc>13600</gdppc> <neighbor name="Costa Rica" direction="W"/> <neighbor name="Colombia" direction="E"/> </country> </data>
然后我们通过python支持的xml解析方法解析
九、re正则
'.' 默认匹配除 之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行 '^' 匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a"," abc eee",flags=re.MULTILINE) '$' 匹配字符结尾,或e.search("foo$","bfoo sdfsf",flags=re.MULTILINE).group()也可以 '*' 匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac") 结果为['abb', 'ab', 'a'] '+' 匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb'] '?' 匹配前一个字符1次或0次 '{m}' 匹配前一个字符m次 '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb'] '|' 匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC' '(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c 'A' 只从字符开头匹配,re.search("Aabc","alexabc") 是匹配不到的 '' 匹配字符结尾,同$ 'd' 匹配数字0-9 'D' 匹配非数字 'w' 匹配[A-Za-z0-9] 'W' 匹配非[A-Za-z0-9] 's' 匹配空白字符、 、 、 , re.search("s+","ab c1 3").group() 结果 ' ' '(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}
最常用的python匹配方法
re.match 从头开始匹配
re.search 匹配包含
re.findall 把所有匹配到的字符放到以列表中的元素返回
re.splitall 以匹配到的字符当做列表分隔符
re.sub 匹配字符并替换
反斜杠的困扰
与大多数编程语言相同,正则表达式里使用""作为转义字符,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\":前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。Python里的原生字符串很好地解决了这个问题,这个例子中的正则表达式可以使用r"\"表示。同样,匹配一个数字的"\d"可以写成r"d"。有了原生字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。
'.'
默认匹配除
之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行
'^'
匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r
"^a"
,
"
abc
eee"
,flags
=
re.MULTILINE)
'$'
匹配字符结尾,或e.search(
"foo$"
,
"bfoo
sdfsf"
,flags
=
re.MULTILINE).group()也可以
'*'
匹配
*
号前的字符
0
次或多次,re.findall(
"ab*"
,
"cabb3abcbbac"
) 结果为[
'abb'
,
'ab'
,
'a'
]
'+'
匹配前一个字符
1
次或多次,re.findall(
"ab+"
,
"ab+cd+abb+bba"
) 结果[
'ab'
,
'abb'
]
'?'
匹配前一个字符
1
次或
0
次
'{m}'
匹配前一个字符m次
'{n,m}'
匹配前一个字符n到m次,re.findall(
"ab{1,3}"
,
"abb abc abbcbbb"
) 结果
'abb'
,
'ab'
,
'abb'
]
'|'
匹配|左或|右的字符,re.search(
"abc|ABC"
,
"ABCBabcCD"
).group() 结果
'ABC'
'(...)'
分组匹配,re.search(
"(abc){2}a(123|456)c"
,
"abcabca456c"
).group() 结果 abcabca456c
'A'
只从字符开头匹配,re.search(
"Aabc"
,
"alexabc"
) 是匹配不到的
''
匹配字符结尾,同$
'd'
匹配数字
0
-
9
'D'
匹配非数字
'w'
匹配[A
-
Za
-
z0
-
9
]
'W'
匹配非[A
-
Za
-
z0
-
9
]
's'
匹配空白字符、 、
、
, re.search(
"s+"
,
"ab c1
3"
).group() 结果
' '
'(?P<name>...)'
分组匹配 re.search(
"(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})"
,
"371481199306143242"
).groupdict(
"city"
) 结果{
'province'
:
'3714'
,
'city'
:
'81'
,
'birthday'
:
'1993'
}