zoukankan      html  css  js  c++  java
  • Python学习——02-Python基础——【7-模块】——logging、hashlib与模块导入

    6.logging模块(* * * * *)

    1. 日志相关概念
    2. logging模块简介
    3. 使用logging提供的模块级别的函数记录日志
    4. logging模块日志流处理流程
    5. 使用logging四大组件记录日志
    6. 配置logging的几种方式
    7. 向日志输出中添加上下文信息
    8. 参考文档

    一、日志相关概念

    日志是一种可以追踪某些软件运行时所发生事件的方法。软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情。一个事件可以用一个可包含可选变量数据的消息来描述。此外,事件也有重要性的概念,这个重要性也可以被称为严重性级别(level)。

    1.日志的作用

    通过log的分析,可以方便用户了解系统或软件、应用的运行情况;如果你的应用log足够丰富,也可以分析以往用户的操作行为、类型喜好、地域分布或其他更多信息;如果一个应用的log同时也分了多个级别,那么可以很轻易地分析得到该应用的健康状况,及时发现问题并快速定位、解决问题,补救损失。
    简单来讲就是,我们通过记录和分析日志可以了解一个系统或软件程序运行情况是否正常,也可以在应用程序出现故障时快速定位问题。比如,做运维的同学,在接收到报警或各种问题反馈后,进行问题排查时通常都会先去看各种日志,大部分问题都可以在日志中找到答案。再比如,做开发的同学,可以通过IDE控制台上输出的各种日志进行程序调试。对于运维老司机或者有经验的开发人员,可以快速的通过日志定位到问题的根源。可见,日志的重要性不可小觑。日志的作用可以简单总结为以下3点:

    • 程序调试
    • 了解软件程序运行情况,是否正常
    • 软件程序运行故障分析与问题定位

    如果应用的日志信息足够详细和丰富,还可以用来做用户行为分析,如:分析用户的操作行为、类型洗好、地域分布以及其它更多的信息,由此可以实现改进业务、提高商业利益。

    2.日志的等级

    我们先来思考下下面的两个问题:

    • 作为开发人员,在开发一个应用程序时需要什么日志信息?在应用程序正式上线后需要什么日志信息?
    • 作为应用运维人员,在部署开发环境时需要什么日志信息?在部署生产环境时需要什么日志信息?

    在软件开发阶段或部署开发环境时,为了尽可能详细的查看应用程序的运行状态来保证上线后的稳定性,我们可能需要把该应用程序所有的运行日志全部记录下来进行分析,这是非常耗费机器性能的。当应用程序正式发布或在生产环境部署应用程序时,我们通常只需要记录应用程序的异常信息、错误信息等,这样既可以减小服务器的I/O压力,也可以避免我们在排查故障时被淹没在日志的海洋里。那么,怎样才能在不改动应用程序代码的情况下实现在不同的环境记录不同详细程度的日志呢?这就是日志等级的作用了,我们通过配置文件指定我们需要的日志等级就可以了。

    不同的应用程序所定义的日志等级可能会有所差别,分的详细点的会包含以下几个等级:

    • DEBUG
    • INFO
    • NOTICE
    • WARNING
    • ERROR
    • CRITICAL
    • ALERT
    • EMERGENCY

    3.日志字段信息与日志格式

    本节开始问题提到过,一条日志信息对应的是一个事件的发生,而一个事件通常需要包括以下几个内容:

    • 事件发生时间
    • 事件发生位置
    • 事件的严重程度--日志级别
    • 事件内容

    上面这些都是一条日志记录中可能包含的字段信息,当然还可以包括一些其他信息,如进程ID、进程名称、线程ID、线程名称等。日志格式就是用来定义一条日志记录中包含那些字段的,且日志格式通常都是可以自定义的。

    说明:

    输出一条日志时,日志内容和日志级别是需要开发人员明确指定的。对于而其它字段信息,只需要是否显示在日志中就可以了。

    4.日志功能的实现

    几乎所有开发语言都会内置日志相关功能,或者会有比较优秀的第三方库来提供日志操作功能,比如:log4j,log4php等。它们功能强大、使用简单。Python自身也提供了一个用于记录日志的标准库模块--logging。

    二、logging模块简介

    logging模块定义的函数和类为应用程序和库的开发实现了一个灵活的事件日志系统。logging模块是Python的一个标准库模块,由标准库模块提供日志记录API的关键好处是所有Python模块都可以使用这个日志记录功能。所以,你的应用日志可以将你自己的日志信息与来自第三方模块的信息整合起来。

    1. logging模块的日志级别

    logging模块默认定义了以下几个日志等级,它允许开发人员自定义其他日志级别,但是这是不被推荐的,尤其是在开发供别人使用的库时,因为这会导致日志级别的混乱。

    日志等级(level)描述
    DEBUG 最详细的日志信息,典型应用场景是 问题诊断
    INFO 信息详细程度仅次于DEBUG,通常只记录关键节点信息,用于确认一切都是按照我们预期的那样进行工作
    WARNING 当某些不期望的事情发生时记录的信息(如,磁盘可用空间较低),但是此时应用程序还是正常运行的
    ERROR 由于一个更严重的问题导致某些功能不能正常运行时记录的信息
    CRITICAL 当发生严重错误,导致应用程序不能继续运行时记录的信息

    开发应用程序或部署开发环境时,可以使用DEBUG或INFO级别的日志获取尽可能详细的日志信息来进行开发或部署调试;应用上线或部署生产环境时,应该使用WARNING或ERROR或CRITICAL级别的日志来降低机器的I/O压力和提高获取错误日志信息的效率。日志级别的指定通常都是在应用程序的配置文件中进行指定的。

    说明:

    • 上面列表中的日志等级是从上到下依次升高的,即:DEBUG < INFO < WARNING < ERROR < CRITICAL,而日志的信息量是依次减少的;
    • 当为某个应用程序指定一个日志级别后,应用程序会记录所有日志级别大于或等于指定日志级别的日志信息,而不是仅仅记录指定级别的日志信息,nginx、php等应用程序以及这里要提高的python的logging模块都是这样的。同样,logging模块也可以指定日志记录器的日志级别,只有级别大于或等于该指定日志级别的日志记录才会被输出,小于该等级的日志记录将会被丢弃。

    2. logging模块的使用方式介绍

    logging模块提供了两种记录日志的方式:

    • 第一种方式是使用logging提供的模块级别的函数
    • 第二种方式是使用Logging日志系统的四大组件

    其实,logging所提供的模块级别的日志记录函数也是对logging日志系统相关类的封装而已。

    logging模块定义的模块级别的常用函数
    函数说明
    logging.debug(msg, *args, **kwargs) 创建一条严重级别为DEBUG的日志记录
    logging.info(msg, *args, **kwargs) 创建一条严重级别为INFO的日志记录
    logging.warning(msg, *args, **kwargs) 创建一条严重级别为WARNING的日志记录
    logging.error(msg, *args, **kwargs) 创建一条严重级别为ERROR的日志记录
    logging.critical(msg, *args, **kwargs) 创建一条严重级别为CRITICAL的日志记录
    logging.log(level, *args, **kwargs) 创建一条严重级别为level的日志记录
    logging.basicConfig(**kwargs) 对root logger进行一次性配置

    其中logging.basicConfig(**kwargs)函数用于指定“要记录的日志级别”、“日志格式”、“日志输出位置”、“日志文件的打开模式”等信息,其他几个都是用于记录各个级别日志的函数。

    logging模块的四大组件
    组件说明
    loggers 提供应用程序代码直接使用的接口
    handlers 用于将日志记录发送到指定的目的位置
    filters 提供更细粒度的日志过滤功能,用于决定哪些日志记录将会被输出(其它的日志记录将会被忽略)
    formatters 用于控制日志信息的最终输出格式

    说明: logging模块提供的模块级别的那些函数实际上也是通过这几个组件的相关实现类来记录日志的,只是在创建这些类的实例时设置了一些默认值。

    三、使用logging提供的模块级别的函数记录日志

    回顾下前面提到的几个重要信息:

    • 可以通过logging模块定义的模块级别的方法去完成简单的日志记录
    • 只有级别大于或等于日志记录器指定级别的日志记录才会被输出,小于该级别的日志记录将会被丢弃。

    1.最简单的日志输出

    先来试着分别输出一条不同日志级别的日志记录:

    1 import logging
    2 
    3 logging.debug("This is a debug log.")
    4 logging.info("This is a info log.")
    5 logging.warning("This is a warning log.")
    6 logging.error("This is a error log.")
    7 logging.critical("This is a critical log.")

    也可以这样写:

    1 logging.log(logging.DEBUG, "This is a debug log.")
    2 logging.log(logging.INFO, "This is a info log.")
    3 logging.log(logging.WARNING, "This is a warning log.")
    4 logging.log(logging.ERROR, "This is a error log.")
    5 logging.log(logging.CRITICAL, "This is a critical log.")

    输出结果:

    WARNING:root:This is a warning log.
    ERROR:root:This is a error log.
    CRITICAL:root:This is a critical log.

    2. 那么问题来了

    问题1:为什么前面两条日志没有被打印出来?

    这是因为logging模块提供的日志记录函数所使用的日志器设置的日志级别是WARNING,因此只有WARNING级别的日志记录以及大于它的ERRORCRITICAL级别的日志记录被输出了,而小于它的DEBUGINFO级别的日志记录被丢弃了。

    问题2:打印出来的日志信息中各字段表示什么意思?为什么会这样输出?

    上面输出结果中每行日志记录的各个字段含义分别是:

    日志级别:日志器名称:日志内容

    之所以会这样输出,是因为logging模块提供的日志记录函数所使用的日志器设置的日志格式默认是BASIC_FORMAT,其值为:

    "%(levelname)s:%(name)s:%(message)s"
    问题3:如果将日志记录输出到文件中,而不是打印到控制台?

    因为在logging模块提供的日志记录函数所使用的日志器设置的处理器所指定的日志输出位置默认为:
    sys.stderr

    问题4:我是怎么知道这些的?

    查看这些日志记录函数的实现代码,可以发现:当我们没有提供任何配置信息的时候,这些函数都会去调用logging.basicConfig(**kwargs)方法,且不会向该方法传递任何参数。继续查看basicConfig()方法的代码就可以找到上面这些问题的答案了。

    问题5:怎么修改这些默认设置呢?

    其实很简单,在我们调用上面这些日志记录函数之前,手动调用一下basicConfig()方法,把我们想设置的内容以参数的形式传递进去就可以了。

    3. logging.basicConfig()函数说明

    该方法用于为logging日志系统做一些基本配置,方法定义如下:

    logging.basicConfig(**kwargs)

    该函数可接收的关键字参数如下:

    参数名称描述
    filename 指定日志输出目标文件的文件名,指定该设置项后日志信心就不会被输出到控制台了
    filemode 指定日志文件的打开模式,默认为'a'。需要注意的是,该选项要在filename指定时才有效
    format 指定日志格式字符串,即指定日志输出时所包含的字段信息以及它们的顺序。logging模块定义的格式字段下面会列出。
    datefmt 指定日期/时间格式。需要注意的是,该选项要在format中包含时间字段%(asctime)s时才有效
    level 指定日志器的日志级别
    stream 指定日志输出目标stream,如sys.stdout、sys.stderr以及网络stream。需要说明的是,stream和filename不能同时提供,否则会引发 ValueError异常
    style Python 3.2中新添加的配置项。指定format格式字符串的风格,可取值为'%'、'{'和'$',默认为'%'
    handlers Python 3.3中新添加的配置项。该选项如果被指定,它应该是一个创建了多个Handler的可迭代对象,这些handler将会被添加到root logger。需要说明的是:filename、stream和handlers这三个配置项只能有一个存在,不能同时出现2个或3个,否则会引发ValueError异常。

    4. logging模块定义的格式字符串字段

    我们来列举一下logging模块中定义好的可以用于format格式字符串中字段有哪些:

    字段/属性名称使用格式描述
    asctime %(asctime)s 日志事件发生的时间--人类可读时间,如:2003-07-08 16:49:45,896
    created %(created)f 日志事件发生的时间--时间戳,就是当时调用time.time()函数返回的值
    relativeCreated %(relativeCreated)d 日志事件发生的时间相对于logging模块加载时间的相对毫秒数(目前还不知道干嘛用的)
    msecs %(msecs)d 日志事件发生事件的毫秒部分
    levelname %(levelname)s 该日志记录的文字形式的日志级别('DEBUG', 'INFO', 'WARNING', 'ERROR', 'CRITICAL')
    levelno %(levelno)s 该日志记录的数字形式的日志级别(10, 20, 30, 40, 50)
    name %(name)s 所使用的日志器名称,默认是'root',因为默认使用的是 rootLogger
    message %(message)s 日志记录的文本内容,通过 msg % args计算得到的
    pathname %(pathname)s 调用日志记录函数的源码文件的全路径
    filename %(filename)s pathname的文件名部分,包含文件后缀
    module %(module)s filename的名称部分,不包含后缀
    lineno %(lineno)d 调用日志记录函数的源代码所在的行号
    funcName %(funcName)s 调用日志记录函数的函数名
    process %(process)d 进程ID
    processName %(processName)s 进程名称,Python 3.1新增
    thread %(thread)d 线程ID
    threadName %(thread)s 线程名称

    5.经过配置的日志输出

    先简单配置下日志器的日志级别
    1 logging.basicConfig(level=logging.DEBUG)
    2 
    3 logging.debug("This is a debug log.")
    4 logging.info("This is a info log.")
    5 logging.warning("This is a warning log.")
    6 logging.error("This is a error log.")
    7 logging.critical("This is a critical log.")

    输出:

    DEBUG:root:This is a debug log.
    INFO:root:This is a info log.
    WARNING:root:This is a warning log.
    ERROR:root:This is a error log.
    CRITICAL:root:This is a critical log.

    所有等级的日志信息都被输出了,说明配置生效了。

    在配置日志器日志级别的基础上,在配置下日志输出目标文件和日志格式
    1 LOG_FORMAT = "%(asctime)s - %(levelname)s - %(message)s"
    2 logging.basicConfig(filename='my.log', level=logging.DEBUG, format=LOG_FORMAT)
    3 
    4 logging.debug("This is a debug log.")
    5 logging.info("This is a info log.")
    6 logging.warning("This is a warning log.")
    7 logging.error("This is a error log.")
    8 logging.critical("This is a critical log.")

    此时会发现控制台中已经没有输出日志内容了,但是在python代码文件的相同目录下会生成一个名为'my.log'的日志文件,该文件中的内容为:

     

    2017-05-08 14:29:53,783 - DEBUG - This is a debug log.
    2017-05-08 14:29:53,784 - INFO - This is a info log.
    2017-05-08 14:29:53,784 - WARNING - This is a warning log.
    2017-05-08 14:29:53,784 - ERROR - This is a error log.
    2017-05-08 14:29:53,784 - CRITICAL - This is a critical log.
    在上面的基础上,我们再来设置下日期/时间格式
     1 LOG_FORMAT = "%(asctime)s - %(levelname)s - %(message)s"
     2 DATE_FORMAT = "%m/%d/%Y %H:%M:%S %p"
     3 
     4 logging.basicConfig(filename='my.log', level=logging.DEBUG, format=LOG_FORMAT, datefmt=DATE_FORMAT)
     5 
     6 logging.debug("This is a debug log.")
     7 logging.info("This is a info log.")
     8 logging.warning("This is a warning log.")
     9 logging.error("This is a error log.")
    10 logging.critical("This is a critical log.")

    此时会在my.log日志文件中看到如下输出内容:

    05/08/2017 14:29:04 PM - DEBUG - This is a debug log.
    05/08/2017 14:29:04 PM - INFO - This is a info log.
    05/08/2017 14:29:04 PM - WARNING - This is a warning log.
    05/08/2017 14:29:04 PM - ERROR - This is a error log.
    05/08/2017 14:29:04 PM - CRITICAL - This is a critical log.

    掌握了上面的内容之后,已经能够满足我们平时开发中需要的日志记录功能。

    6. 其他说明

    几个要说明的内容:
    • logging.basicConfig()函数是一个一次性的简单配置工具使,也就是说只有在第一次调用该函数时会起作用,后续再次调用该函数时完全不会产生任何操作的,多次调用的设置并不是累加操作。
    • 日志器(Logger)是有层级关系的,上面调用的logging模块级别的函数所使用的日志器是RootLogger类的实例,其名称为'root',它是处于日志器层级关系最顶层的日志器,且该实例是以单例模式存在的。
    • 如果要记录的日志中包含变量数据,可使用一个格式字符串作为这个事件的描述消息(logging.debug、logging.info等函数的第一个参数),然后将变量数据作为第二个参数*args的值进行传递,如:logging.warning('%s is %d years old.', 'Tom', 10),输出内容为WARNING:root:Tom is 10 years old.
    • logging.debug(), logging.info()等方法的定义中,除了msg和args参数外,还有一个**kwargs参数。它们支持3个关键字参数: exc_info, stack_info, extra,下面对这几个关键字参数作个说明。
    关于exc_info, stack_info, extra关键词参数的说明:
    • exc_info: 其值为布尔值,如果该参数的值设置为True,则会将异常异常信息添加到日志消息中。如果没有异常信息则添加None到日志信息中。
    • stack_info: 其值也为布尔值,默认值为False。如果该参数的值设置为True,栈信息将会被添加到日志信息中。
    • extra: 这是一个字典(dict)参数,它可以用来自定义消息格式中所包含的字段,但是它的key不能与logging模块定义的字段冲突。
    一个例子:

    在日志消息中添加exc_info和stack_info信息,并添加两个自定义的字端 ip和user

    1 LOG_FORMAT = "%(asctime)s - %(levelname)s - %(user)s[%(ip)s] - %(message)s"
    2 DATE_FORMAT = "%m/%d/%Y %H:%M:%S %p"
    3 
    4 logging.basicConfig(format=LOG_FORMAT, datefmt=DATE_FORMAT)
    5 logging.warning("Some one delete the log file.", exc_info=True, stack_info=True, extra={'user': 'Tom', 'ip':'47.98.53.222'})

    输出:

    05/08/2017 16:35:00 PM - WARNING - Tom[47.98.53.222] - Some one delete the log file.
    NoneType
    Stack (most recent call last):
      File "C:/Users/wader/PycharmProjects/LearnPython/day06/log.py", line 45, in <module>
        logging.warning("Some one delete the log file.", exc_info=True, stack_info=True, extra={'user': 'Tom', 'ip':'47.98.53.222'})

    四、logging模块日志流处理流程

    在介绍logging模块的高级用法之前,很有必要对logging模块所包含的重要组件以及其工作流程做个全面、简要的介绍,这有助于我们更好的理解我们所写的代码(将会触发什么样的操作)。

    1. logging日志模块四大组件

    在介绍logging模块的日志流处理流程之前,我们先来介绍下logging模块的四大组件:

    组件名称对应类名功能描述
    日志器 Logger 提供了应用程序可一直使用的接口
    处理器 Handler 将logger创建的日志记录发送到合适的目的输出
    过滤器 Filter 提供了更细粒度的控制工具来决定输出哪条日志记录,丢弃哪条日志记录
    格式器 Formatter 决定日志记录的最终输出格式

     

    logging模块就是通过这些组件来完成日志处理的,上面所使用的logging模块级别的函数也是通过这些组件对应的类来实现的。

    这些组件之间的关系描述:
    • 日志器(logger)需要通过处理器(handler)将日志信息输出到目标位置,如:文件、sys.stdout、网络等;
    • 不同的处理器(handler)可以将日志输出到不同的位置;
    • 日志器(logger)可以设置多个处理器(handler)将同一条日志记录输出到不同的位置;
    • 每个处理器(handler)都可以设置自己的过滤器(filter)实现日志过滤,从而只保留感兴趣的日志;
    • 每个处理器(handler)都可以设置自己的格式器(formatter)实现同一条日志以不同的格式输出到不同的地方。

    简单点说就是:日志器(logger)是入口,真正干活儿的是处理器(handler),处理器(handler)还可以通过过滤器(filter)和格式器(formatter)对要输出的日志内容做过滤和格式化等处理操作。

    2. logging日志模块相关类及其常用方法介绍

    下面介绍下与logging四大组件相关的类:Logger, Handler, Filter, Formatter。

    Logger类

    Logger对象有3个任务要做:

    • 1)向应用程序代码暴露几个方法,使应用程序可以在运行时记录日志消息;
    • 2)基于日志严重等级(默认的过滤设施)或filter对象来决定要对哪些日志进行后续处理;
    • 3)将日志消息传送给所有感兴趣的日志handlers。

    Logger对象最常用的方法分为两类:配置方法 和 消息发送方法

    最常用的配置方法如下:

    方法描述
    Logger.setLevel() 设置日志器将会处理的日志消息的最低严重级别
    Logger.addHandler() 和 Logger.removeHandler() 为该logger对象添加 和 移除一个handler对象
    Logger.addFilter() 和 Logger.removeFilter() 为该logger对象添加 和 移除一个filter对象

     

     关于Logger.setLevel()方法的说明:

    内建等级中,级别最低的是DEBUG,级别最高的是CRITICAL。例如setLevel(logging.INFO),此时函数参数为INFO,那么该logger将只会处理INFO、WARNING、ERROR和CRITICAL级别的日志,而DEBUG级别的消息将会被忽略/丢弃。

    logger对象配置完成后,可以使用下面的方法来创建日志记录:

    方法描述
    Logger.debug(), Logger.info(), Logger.warning(), Logger.error(), Logger.critical() 创建一个与它们的方法名对应等级的日志记录
    Logger.exception() 创建一个类似于Logger.error()的日志消息
    Logger.log() 需要获取一个明确的日志level参数来创建一个日志记录

    说明:

    • Logger.exception()与Logger.error()的区别在于:Logger.exception()将会输出堆栈追踪信息,另外通常只是在一个exception handler中调用该方法。
    • Logger.log()与Logger.debug()、Logger.info()等方法相比,虽然需要多传一个level参数,显得不是那么方便,但是当需要记录自定义level的日志时还是需要该方法来完成。

    那么,怎样得到一个Logger对象呢?一种方式是通过Logger类的实例化方法创建一个Logger类的实例,但是我们通常都是用第二种方式--logging.getLogger()方法。

    logging.getLogger()方法有一个可选参数name,该参数表示将要返回的日志器的名称标识,如果不提供该参数,则其值为'root'。若以相同的name参数值多次调用getLogger()方法,将会返回指向同一个logger对象的引用。

    关于logger的层级结构与有效等级的说明:

    • logger的名称是一个以'.'分割的层级结构,每个'.'后面的logger都是'.'前面的logger的children,例如,有一个名称为 foo 的logger,其它名称分别为 foo.bar, foo.bar.baz 和 foo.bam都是 foo 的后代。
    • logger有一个"有效等级(effective level)"的概念。如果一个logger上没有被明确设置一个level,那么该logger就是使用它parent的level;如果它的parent也没有明确设置level则继续向上查找parent的parent的有效level,依次类推,直到找到个一个明确设置了level的祖先为止。需要说明的是,root logger总是会有一个明确的level设置(默认为 WARNING)。当决定是否去处理一个已发生的事件时,logger的有效等级将会被用来决定是否将该事件传递给该logger的handlers进行处理。
    • child loggers在完成对日志消息的处理后,默认会将日志消息传递给与它们的祖先loggers相关的handlers。因此,我们不必为一个应用程序中所使用的所有loggers定义和配置handlers,只需要为一个顶层的logger配置handlers,然后按照需要创建child loggers就可足够了。我们也可以通过将一个logger的propagate属性设置为False来关闭这种传递机制。
    Handler类

    Handler对象的作用是(基于日志消息的level)将消息分发到handler指定的位置(文件、网络、邮件等)。Logger对象可以通过addHandler()方法为自己添加0个或者更多个handler对象。比如,一个应用程序可能想要实现以下几个日志需求:

    • 1)把所有日志都发送到一个日志文件中;
    • 2)把所有严重级别大于等于error的日志发送到stdout(标准输出);
    • 3)把所有严重级别为critical的日志发送到一个email邮件地址。
      这种场景就需要3个不同的handlers,每个handler复杂发送一个特定严重级别的日志到一个特定的位置。

    一个handler中只有非常少数的方法是需要应用开发人员去关心的。对于使用内建handler对象的应用开发人员来说,似乎唯一相关的handler方法就是下面这几个配置方法:

    方法描述
    Handler.setLevel() 设置handler将会处理的日志消息的最低严重级别
    Handler.setFormatter() 为handler设置一个格式器对象
    Handler.addFilter() 和 Handler.removeFilter() 为handler添加 和 删除一个过滤器对象

    需要说明的是,应用程序代码不应该直接实例化和使用Handler实例。因为Handler是一个基类,它只定义了素有handlers都应该有的接口,同时提供了一些子类可以直接使用或覆盖的默认行为。下面是一些常用的Handler:

    Handler描述
    logging.StreamHandler 将日志消息发送到输出到Stream,如std.out, std.err或任何file-like对象。
    logging.FileHandler 将日志消息发送到磁盘文件,默认情况下文件大小会无限增长
    logging.handlers.RotatingFileHandler 将日志消息发送到磁盘文件,并支持日志文件按大小切割
    logging.hanlders.TimedRotatingFileHandler 将日志消息发送到磁盘文件,并支持日志文件按时间切割
    logging.handlers.HTTPHandler 将日志消息以GET或POST的方式发送给一个HTTP服务器
    logging.handlers.SMTPHandler 将日志消息发送给一个指定的email地址
    logging.NullHandler 该Handler实例会忽略error messages,通常被想使用logging的library开发者使用来避免'No handlers could be found for logger XXX'信息的出现。
    Formater类

    Formater对象用于配置日志信息的最终顺序、结构和内容。与logging.Handler基类不同的是,应用代码可以直接实例化Formatter类。另外,如果你的应用程序需要一些特殊的处理行为,也可以实现一个Formatter的子类来完成。

    Formatter类的构造方法定义如下:

    logging.Formatter.__init__(fmt=None, datefmt=None, style='%')

    可见,该构造方法接收3个可选参数:

    • fmt:指定消息格式化字符串,如果不指定该参数则默认使用message的原始值
    • datefmt:指定日期格式字符串,如果不指定该参数则默认使用"%Y-%m-%d %H:%M:%S"
    • style:Python 3.2新增的参数,可取值为 '%', '{'和 '$',如果不指定该参数则默认使用'%'
    Filter类

    Filter可以被Handler和Logger用来做比level更细粒度的、更复杂的过滤功能。Filter是一个过滤器基类,它只允许某个logger层级下的日志事件通过过滤。该类定义如下:

    class logging.Filter(name='')
        filter(record)

    比如,一个filter实例化时传递的name参数值为'A.B',那么该filter实例将只允许名称为类似如下规则的loggers产生的日志记录通过过滤:'A.B','A.B,C','A.B.C.D','A.B.D',而名称为'A.BB', 'B.A.B'的loggers产生的日志则会被过滤掉。如果name的值为空字符串,则允许所有的日志事件通过过滤。

    filter方法用于具体控制传递的record记录是否能通过过滤,如果该方法返回值为0表示不能通过过滤,返回值为非0表示可以通过过滤。

    说明:

    • 如果有需要,也可以在filter(record)方法内部改变该record,比如添加、删除或修改一些属性。
    • 我们还可以通过filter做一些统计工作,比如可以计算下被一个特殊的logger或handler所处理的record数量等。

    3. logging日志流处理流程

    下面这个图描述了日志流的处理流程:

    我们来描述下上面这个图的日志流处理流程:

    • 1)(在用户代码中进行)日志记录函数调用,如:logger.info(...),logger.debug(...)等;
    • 2)判断要记录的日志级别是否满足日志器设置的级别要求(要记录的日志级别要大于或等于日志器设置的级别才算满足要求),如果不满足则该日志记录会被丢弃并终止后续的操作,如果满足则继续下一步操作;
    • 3)根据日志记录函数调用时掺入的参数,创建一个日志记录(LogRecord类)对象;
    • 4)判断日志记录器上设置的过滤器是否拒绝这条日志记录,如果日志记录器上的某个过滤器拒绝,则该日志记录会被丢弃并终止后续的操作,如果日志记录器上设置的过滤器不拒绝这条日志记录或者日志记录器上没有设置过滤器则继续下一步操作--将日志记录分别交给该日志器上添加的各个处理器;
    • 5)判断要记录的日志级别是否满足处理器设置的级别要求(要记录的日志级别要大于或等于该处理器设置的日志级别才算满足要求),如果不满足记录将会被该处理器丢弃并终止后续的操作,如果满足则继续下一步操作;
    • 6)判断该处理器上设置的过滤器是否拒绝这条日志记录,如果该处理器上的某个过滤器拒绝,则该日志记录会被当前处理器丢弃并终止后续的操作,如果当前处理器上设置的过滤器不拒绝这条日志记录或当前处理器上没有设置过滤器测继续下一步操作;
    • 7)如果能到这一步,说明这条日志记录经过了层层关卡允许被输出了,此时当前处理器会根据自身被设置的格式器(如果没有设置则使用默认格式)将这条日志记录进行格式化,最后将格式化后的结果输出到指定位置(文件、网络、类文件的Stream等);
    • 8)如果日志器被设置了多个处理器的话,上面的第5-8步会执行多次;
    • 9)这里才是完整流程的最后一步:判断该日志器输出的日志消息是否需要传递给上一级logger(之前提到过,日志器是有层级关系的)的处理器,如果propagate属性值为1则表示日志消息将会被输出到处理器指定的位置,同时还会被传递给parent日志器的handlers进行处理直到当前日志器的propagate属性为0停止,如果propagate值为0则表示不向parent日志器的handlers传递该消息,到此结束。

    可见,一条日志信息要想被最终输出需要依次经过以下几次过滤:

    • 日志器等级过滤;
    • 日志器的过滤器过滤;
    • 日志器的处理器等级过滤;
    • 日志器的处理器的过滤器过滤;

    需要说明的是: 关于上面第9个步骤,如果propagate值为1,那么日志消息会直接传递交给上一级logger的handlers进行处理,此时上一级logger的日志等级并不会对该日志消息进行等级过滤。

    五、使用logging四大组件记录日志


    现在,我们对logging模块的重要组件及整个日志流处理流程都应该有了一个比较全面的了解,下面我们来看一个例子。

    1. 需求

    现在有以下几个日志记录的需求:

    • 1)要求将所有级别的所有日志都写入磁盘文件中
    • 2)all.log文件中记录所有的日志信息,日志格式为:日期和时间 - 日志级别 - 日志信息
    • 3)error.log文件中单独记录error及以上级别的日志信息,日志格式为:日期和时间 - 日志级别 - 文件名[:行号] - 日志信息
    • 4)要求all.log在每天凌晨进行日志切割

    2. 分析

    • 1)要记录所有级别的日志,因此日志器的有效level需要设置为最低级别--DEBUG;
    • 2)日志需要被发送到两个不同的目的地,因此需要为日志器设置两个handler;另外,两个目的地都是磁盘文件,因此这两个handler都是与FileHandler相关的;
    • 3)all.log要求按照时间进行日志切割,因此他需要用logging.handlers.TimedRotatingFileHandler; 而error.log没有要求日志切割,因此可以使用FileHandler;
    • 4)两个日志文件的格式不同,因此需要对这两个handler分别设置格式器;

    3. 代码实现

     1 import logging
     2 import logging.handlers
     3 import datetime
     4 
     5 logger = logging.getLogger('mylogger')
     6 logger.setLevel(logging.DEBUG)
     7 
     8 rf_handler = logging.handlers.TimedRotatingFileHandler('all.log', when='midnight', interval=1, backupCount=7, atTime=datetime.time(0, 0, 0, 0))
     9 rf_handler.setFormatter(logging.Formatter("%(asctime)s - %(levelname)s - %(message)s"))
    10 
    11 f_handler = logging.FileHandler('error.log')
    12 f_handler.setLevel(logging.ERROR)
    13 f_handler.setFormatter(logging.Formatter("%(asctime)s - %(levelname)s - %(filename)s[:%(lineno)d] - %(message)s"))
    14 
    15 logger.addHandler(rf_handler)
    16 logger.addHandler(f_handler)
    17 
    18 logger.debug('debug message')
    19 logger.info('info message')
    20 logger.warning('warning message')
    21 logger.error('error message')
    22 logger.critical('critical message')

    all.log文件输出

    2017-05-13 16:12:40,612 - DEBUG - debug message
    2017-05-13 16:12:40,612 - INFO - info message
    2017-05-13 16:12:40,612 - WARNING - warning message
    2017-05-13 16:12:40,612 - ERROR - error message
    2017-05-13 16:12:40,613 - CRITICAL - critical message

    error.log文件输出

    2017-05-13 16:12:40,612 - ERROR - log.py[:81] - error message
    2017-05-13 16:12:40,613 - CRITICAL - log.py[:82] - critical message

    六、配置logging的几种方式


    作为开发者,我们可以通过以下3中方式来配置logging:

    • 1)使用Python代码显式的创建loggers, handlers和formatters并分别调用它们的配置函数;
    • 2)创建一个日志配置文件,然后使用fileConfig()函数来读取该文件的内容;
    • 3)创建一个包含配置信息的dict,然后把它传递个dictConfig()函数;

    具体说明请参考另一篇博文《python之配置日志的几种方式》

    七、向日志输出中添加上下文信息


    除了传递给日志记录函数的参数外,有时候我们还想在日志输出中包含一些额外的上下文信息。比如,在一个网络应用中,可能希望在日志中记录客户端的特定信息,如:远程客户端的IP地址和用户名。这里我们来介绍以下几种实现方式:

    • 通过向日志记录函数传递一个extra参数引入上下文信息
    • 使用LoggerAdapters引入上下文信息
    • 使用Filters引入上下文信息

    八、参考文档

     

    7.configparser模块(* *)

    ConfigParser模块在python中是用来读取配置文件,配置文件的格式跟windows下的ini配置文件相似,可以包含一个或多个节(section),每个节可以有多个参数(键=值)。使用的配置文件的好处就是不用再程序中硬编码,可以是你的程序变得灵活起来。 
    注意:在python 3 中ConfigParser模块名已更名为configparser

     1.函数

      1. 读取配置文件

        • read(filename) 直接读取ini文件内容
        • sections() 得到所有的section,并以列表的形式返回
        • options(section) 得到该section的所有option
        • items(section) 得到该section的所有键值对
        • get(section,option) 得到section中option的值,返回为string类型
        • getint(section,option) 得到section中option的值,返回为int类型
        • getfloat(section,option)得到section中option的值,返回为float类型
        • getboolean(section, option)得到section中option的值,返回为boolean类型
      2. 写入配置文件

        • add_section(section) 添加一个新的section
        • has_section(section) 判断是否有section
        • set( section, option, value) 对section中的option进行设置
        • remove_setion(section)删除一个section
        • remove_option(section, option)删除section中的option
        • write(fileobject)将内容写入配置文件。

    2.查询

    1、所有节点;

    2、指定节点下的所有key和values;
    3、指定节点下所有的key;
    4、指定节点和key下的values;
    # #configparser用于处理特定格式的文件,其本质上是利用open来操作文件。
    #导入configparser,并赋值变量,以便频繁调用。
    import configparser
    config = configparser.ConfigParser()
    file = r'my.cnf'
    config.read(file, encoding='utf-8')
    
    
    #1、获取所有节点:
    all_node = config.sections()
    print('所有节点>>> ',all_node)
    
    #所有节点>>>  ['client', 'mysqld', 'mysqldump', 'mysql', 'myisamchk', 'mysqlhotcopy']
    
    ====================================================================================
    
    #2、获取指定节点下的所有(kye,values):
    all_key_values = config.items('myisamchk')
    print("所有的key和values>>> ",all_key_values)
    
    #所有的key和values>>>  [('key_buffer_size', '256M'), ('sort_buffer_size', '256M'), ('read_buffer', '2M'), ('write_buffer', '2M'), ('test_size', '200'), ('test_float', '1.0001'), ('test_boolean', '1')]
    
    
    ====================================================================================
    
    #3、获取指定节点下的所有key:
    all_key_name = config.options('myisamchk')
    print("所有的key名称 >>> ",all_key_name)
    
    #所有的key名称 >>>  ['key_buffer_size', 'sort_buffer_size', 'read_buffer', 'write_buffer', 'test_size', 'test_float', 'test_boolean']
    
    
    ====================================================================================
    
    #4、获取指定节点下的,指定key的values:
    assign_key_values_str = config.get('myisamchk','key_buffer_size')
    print('指定key的values,字符串格式 >>>',assign_key_values_str,type(assign_key_values_str))
    
    assign_key_values_int = config.getint('myisamchk','test_size')
    print('指定key的values,数字格式 >>>',assign_key_values_int,type(assign_key_values_int))
    
    assign_key_values_float =  config.getfloat('myisamchk','test_float')
    print("指定key的values,浮点格式>>> " ,assign_key_values_float , type(assign_key_values_float))
    
    assign_key_values_boolean = config.getboolean('myisamchk','test_boolean')
    print("指定key的values,布尔格式>>>" ,assign_key_values_boolean , type(assign_key_values_boolean))
    
    # 指定key的values,字符串格式 >>> 256M <class 'str'>
    # 指定key的values,数字格式 >>> 200 <class 'int'>
    # 指定key的values,浮点格式>>>  1.0001 <class 'float'>
    # 指定key的values,布尔格式>>> True <class 'bool'>

    检查,添加,删除节点:(添加,删除需要保存到文件里)

    1、检查节点是否存在:
    has_sec = config.has_section('myisamchk')
    print("检索节点是否存在",has_sec)
    ​
    has_sec = config.has_section('myisamchk111')
    print("检索节点是否存在",has_sec)
    ​
    检索节点是否存在 True
    检索节点是否存在 False
    ​
    
    2、添加节点:
    config.add_section('mysql_user')
    config.write(open(file,'w'))
    
    
    3、删除节点:
    config.remove_section('mysql_user')
    config.write(open(file,'w'))

    3.检查、删除、设置指定组内的键值对

    1、检查指定组内键值对:
    has_opt = config.has_option('myisamchk','test_boolean')
    print(has_opt)
    
    
    2、修改指定组内key中的values
    #格式:config.set('指定节点名称','指定key',要修改的values)
    config.set('myisamchk','test_boolean','1')
    config.write(open(file,'w'))
    
    
    3、删除指定组内的key和values:
    config.remove_option('myisamchk','test_boolean')
    config.write(open(file,'w'))

    8.hashlib模块(* *)

    1. 介绍hashlib

      hashlib 是一个提供了一些流行的hash算法的 Python 标准库.其中所包括的算法有 md5, sha1, sha224, sha256, sha384, sha512. 另外,模块中所定义的 new(name, string=”) 方法可通过指定系统所支持的hash算法来构造相应的hash对象.

    2. hashlib的使用

    a. 各hash算法的使用示例

     1 from hashlib import md5, sha1, sha224, sha256, sha384, sha512
     2 from pprint import pprint
     3 
     4 hash_funcs = [md5, sha1, sha224, sha256, sha384, sha512]
     5 
     6 
     7 def hash_show(s):
     8     result = []
     9     for func in hash_funcs:
    10         s_hash_obj = func(s)
    11         s_hash_hex = s_hash_obj.hexdigest()
    12         result.append((s_hash_obj.name, s_hash_hex,  len(s_hash_hex)))
    13     return result
    14 
    15 
    16 if __name__ == '__main__':
    17     s = 'hello python'
    18     rs = hash_show(s)
    19     pprint(rs)

    b. 一个 md5 的使用示例

     1 from hashlib import md5
     2 
     3 m1 = hashlib.md5()    # 构造hash对象
     4 m1.update('hello')
     5 m1.update(' ')
     6 m1.update('python')
     7 
     8 m2 = hashlib.md5('hello python')
     9 
    10 print m1.hexdigest() == m2.hexdigest()    # 两种方式的效果相同

    c. 使用 new(name, string=”) 构造新的哈系对象

    1 import hashlib
    2 
    3 h = hashlib.new('ripemd160', 'hello python')    # ripemd160是一个160位的hash算法. ripemd系列算法基于md4, md5.
    4 print h.hexdigest()

    3. hashlib的实现

     Python 并没有在 hashlib 中提供各种hash算法的实现, 只是提供了一个接口调用.相当于 Linux下的软链接或者 Windows 下的快捷方式一样. Linux 环境下,hashlib 中各hash函数的实现在 _hashlib.x86_64-linux-gun.so 中(具体路径为 /usr/lib/python2.7/lib-dynload/_hashlib.x86_64-linux-gun.so,各不同版本或安装位置的不同,对应相关参数也不同).在系统未提供该共享库的情况下,其实现是 Python 内建的 _md5, _sha, _sha256以及 _sha512.

    4. hashlib中各hash函数的介绍

      • md5: Message Digest Algorithm 5(消息摘要算法第五版) 
         信息摘要算法可以用于确保信息传输完整一致.当然,也有用在加密上的,比如有的数据库在存储用户数据时,选择使用md5加密用户密码.也许,还有连用户名一起加密的.记得之前参加数学建模时,最终提交方案的时候就是用的md5做摘要.在 md5 之前有流行的 md2, md3与 md4 算法,后来罗纳德·李维斯特(Ronald L. Rivest.他就是rsa算法命名中的r,2002年的时候还得了图灵奖)继续改进发明了md5.该算法依然被大量使用,不过,由于其安全性问题,未来的话可能会越来越少的人继续使用了吧.
      • sha: Secure Hash Algorithm(安全哈希算法) 
         sha是美国国家标准与技术研究院与美国国家安全局设计,从94年以来被广泛使用的加密算法.sha系列中的sha1, sha224, sha2556适用于长度不超过2^64二进制位的消息。sha384和sha512适用于长度不超过2^128二进制位的消息。不过,这个也不太安全.2005年的时候国内王小云教授及其团队在sha1算法的破译上就已经取得了很大的成就.今年谷歌已经攻破了sha1算法.另外,Matthew Green(https://twitter.com/matthew_d_green)在这一领域也有不错的成就.
  • 相关阅读:
    Web开发技术大会演讲
    方法的长度
    避免复制与粘贴
    引入工厂方法支持扩展
    利用多态重构为带参方法
    代码质量对系统的影响
    《重构之美》开篇
    老鸟对菜鸟的一些建议
    jQuery 使用 AJAX解决跨域问题jQuery 使用 AJAX解决跨域问题
    uniapp renderjs通信
  • 原文地址:https://www.cnblogs.com/caofu/p/8760064.html
Copyright © 2011-2022 走看看