1、logging
日志开关,设置全局只打印什么级别的日子,默认是warning以下的都不打印
改默认级别:依次升高
logging.debug("")
logging.info("")
logging.warning("")
logging.error("")
logging.critical("")
看当前日志级别
输出到文件里:
logging.basicConfig(filename="app.log", level=logging.DEBUG)
#DEBUG以上的都输出了,再执行就往后追加,改成warning后,包含warning和以上级别的输出
缺少时间啊,下面加上时间
logging.basicConfig(filename="app.log", level=logging.DEBUG,format='%(asctime)s-%(message)s',datefmt='%Y-%m-%d %H:%M:%S')
输出:
2017-07-28 22:40:37-内容
时间至少一个套路,还有很多套路:见套路表 :
日志格式
%(name)s |
Logger的名字 |
%(levelno)s |
数字形式的日志级别 |
%(levelname)s |
文本形式的日志级别 |
%(pathname)s |
调用日志输出函数的模块的完整路径名,可能没有 |
%(filename)s |
调用日志输出函数的模块的文件名 |
%(module)s |
调用日志输出函数的模块名 |
%(funcName)s |
调用日志输出函数的函数名 |
%(lineno)d |
调用日志输出函数的语句所在的代码行 |
%(created)f |
当前时间,用UNIX标准的表示时间的浮 点数表示 |
%(relativeCreated)d |
输出日志信息时的,自Logger创建以 来的毫秒数 |
%(asctime)s |
字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒 |
%(thread)d |
线程ID。可能没有 |
%(threadName)s |
线程名。可能没有 |
%(process)d |
进程ID。可能没有 |
%(message)s |
用户输出的消息 |
可以打印时间,am pm模块名,行号,函数名,错误级别,进程号,线程号等
-------------------------------需求来了-------想要日志即在屏幕上又在文件里同时输出怎么办——?
Python提供四个类关于日志的
logger类,提供应用程序可以直接使用的接口,用户直接调用这个接口
handler类:将logger创建的日志输出到哪里?将logger创建的日志发屏幕,或者记录,或者远程机器或者邮件
filter类:过滤包含什么字段怎么发,复杂用的比较少
formatter:决定日志记录的最终输出格式
会用到三个类
输出信息前获得一个logger,通常一个模块对应一个logger
LOG = logging.getLogger("chat.gui") 例如chat.gui为名字
自己起个名字,MySQL或者ngix 都有两个日志,分别由两个logger输出。分门别类的输出文件
Logger.setLevel()设置级别,最低级别,低于该级别被忽略
addfilter()不说了
addhandler() 通过logger记录一条日志,添加handler到logger通过几个handler,就同时发到几个地方
几个handler:-------》
1.StreamHandler 屏幕.使用这个Handler可以向类似与sys.stdout或者sys.stderr的任何文件对象(file object)输出信息。它的构造函数是:StreamHandler([strm])其中strm参数是一个文件对象。默认是sys.stderr
2.FileHandler 文件
每个handler可以分别设置级别
Handler.setLevel() Handler.setFormatter() Handler.addFilter() Handler.remove...
定义日志格式Format
可以定义不同的文件格式,文件可以和屏幕不一样
ch = logging.formatter("asdfasdfasdf")
formater 跟handler关联
hdler.setFormatter(ch)
吧handler告诉logging
logger.addHandler(hdler)
这样子,就实现了日志记录目的地的多样性,和输出格式的多样性
先getlogger,屏幕,文件handler,再定义两种格式,格式跟handler绑定,再把handler跟logger绑定。
import logging # logging.basicConfig(filename="aaaaa.log", # level=logging.CRITICAL, # format='%(asctime)s-%(levelname)s : %(message)s', # datefmt='%Y-%m-%d %H:%M:%S') # # level low to top # logging.debug("!!!!!debug") # logging.info("!!!!info") # logging.warning("!!!!warning") # logging.error("!!!!error") # logging.critical("!!!!!!") # ---- 在屏幕和文件中输出------------------ log1 = logging.getLogger("logger1") # 名为logger1的log1对象 log1.setLevel(logging.DEBUG) had1 = logging.StreamHandler() # 屏幕和级别 had1.setLevel(logging.INFO) had2 = logging.FileHandler("had2.log", encoding="utf-8") # 文件和级别 had2.setLevel(logging.WARN) fm1 = logging.Formatter('%(asctime)s-%(levelname)s : %(message)s') #格式1 fm2 = logging.Formatter('%(levelname)s : %(message)s') # 格式2 had1.setFormatter(fm1) #绑定formatter had2.setFormatter(fm2) log1.addHandler(had1) #添加handler log1.addHandler(had2) log1.info("aaaa") log1.warning("哈哈哈") # 屏幕: # 2017-07-28 23:11:02,946-INFO : aaaa # 2017-07-28 23:11:02,946-WARNING : 哈哈哈 # 文件: # WARNING : 哈哈哈
再讲一点。
网站访问量大,日志很多几个G,有时候需要写脚本切割,有的程序可以自动切割
咱的logger里可以根据时间和大小进行切割
RotatingFileHandler管理文件大小,达到一定大小改名,依次创建文件。maxBytes指定文件大小
backupCount用于保留日志文件的个数
文件自动截断例子按大小
logging.handlers.RotatingFileHandler(filename="dfa",maxBytes=1,backupCount=3,encoding="utf8")
一共出现四个log,备份三个,显示最新的,把之前的删了,只保留3个
文件自动截断按时间:S 秒 M分 H小时 D天 W每星期 midnight每天凌晨
handlers.TimedRotatingFileHandler(filename="ds",when="S",interval=5,backupCount=3,encoding="utf8")
5秒截断
from logging import handlers log1 = logging.getLogger("name1") hand1 = logging.handlers.RotatingFileHandler(filename="fffff.log", maxBytes=1, backupCount=3, encoding="utf-8") # hand1 = logging.handlers.TimedRotatingFileHandler(filename="fffff.log", # when='s', # interval=1, # backupCount=3) log1.addHandler(hand1) log1.warning("a") log1.warning("b")
2.re模块
[+-]{2,} 和 (+|-){2,} 一样的
[+-]{0,1} 和 (+|-)? 一样的
正则表达式,匹配 “不全是空格” 怎么写? 答案: .*[^ ].*
re.match 从头开始匹配
match(pattern, string, flags=0)
re.search 匹配包含
search(pattern, string, flags=0)re.findall 把所有匹配到的字符放到以列表中的元素返回
findall(pattern, string, flags=0)re.split 以匹配到的字符当做列表分隔符
split(pattern, string, maxsplit=0, flags=0)re.sub 匹配字符并替换
sub(pattern, repl, string, count=0, flags=0)
“d+” "A" "asdfadfa" 次数
flags = re.I
flags = re.M
re.I(re.IGNORECASE): 忽略大小写(括号内是完整写法,下同)
M(MULTILINE): 多行模式,改变
'^'
和
'$'
的行为(参见上图)
S(DOTALL): 点任意匹配模式,改变
'.'
的行为
import re str1 = '123 S 456 S 789 S abc S def' print(re.split('S', str1, maxsplit=0)) #['123 ', ' 456 ', ' 789 ', ' abc ', ' def'] print(re.split('S', str1, maxsplit=1)) #['123 ', ' 456 S 789 S abc S def'] print(re.split('S', str1, maxsplit=2)) #['123 ', ' 456 ', ' 789 S abc S def'] print(re.split('S', str1, maxsplit=3)) #['123 ', ' 456 ', ' 789 ', ' abc S def'] print(re.split('S', str1, maxsplit=4)) #['123 ', ' 456 ', ' 789 ', ' abc ', ' def'] print(re.split('S', str1, maxsplit=5)) #['123 ', ' 456 ', ' 789 ', ' abc ', ' def']
用的场景,经常做文字处理用的比较多,做字符串匹配的
精确匹配 模糊匹配
最基本的匹配:
import re
re.match("inet", "inet 1123sdfasdf")
match是从头开始匹配
匹配不上返回NONE
匹配上了返回<_sre.SRE_Match object; span=(0,4), match='inet'>
通过a.group()可以看到匹配到了哪些字段,动态规则可以看到很多
先看套路:
'.' 默认匹配除 之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行 '^' 匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a"," abc eee",flags=re.MULTILINE) '$' 匹配字符结尾,或e.search("foo$","bfoo sdfsf",flags=re.MULTILINE).group()也可以 '*' 匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac") 结果为['abb', 'ab', 'a'] '+' 匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb'] '?' 匹配前一个字符1次或0次 '{m}' 匹配前一个字符m次 '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb'] '|' 匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC' '(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c 'A' 只从字符开头匹配,re.search("Aabc","alexabc") 是匹配不到的 '' 匹配字符结尾,同$ 'd' 匹配数字0-9 'D' 匹配非数字 'w' 匹配[A-Za-z0-9] 'W' 匹配非[A-Za-z0-9] 's' 匹配空白字符、 、 、 , re.search("s+","ab c1 3").group() 结果 ' '
'S' 匹配非空白字符、
'(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}
re.search整个里面去搜