Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。
# 什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(通常用16进制的字符串表示)。 # 摘要算法就是通过摘要函数f()对任意长度的数据data计算出固定长度的摘要digest,目的是为了发现原始数据是否被人篡改过。 # 摘要算法之所以能指出数据是否被篡改过,就是因为摘要函数是一个单向函数,计算f(data)很容易,但通过digest反推data却非常困难。 # 而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。 # 不管算法多么不同,摘要的功能始终不变 # 对于相同的字符串使用同一个算法进行摘要,得到的值总是不变的 # 使用不同算法对相同的字符串进行摘要,得到的值应该不同 # 不管使用什么算法,hashlib的使用方式永远不变
# 摘要算法 # 密码的密文存储 # 文件的一致性验证 # 在下载的时候 检查我们下载的文件和远程服务器上的文件是否一致 # 两台机器上的两个文件 你想检查这两个文件是否相等 #目前使用最广的还是 MD5 import hashlib # usr = input('username: ') # pwd = input('password: ') # role = input('identity: ') # with open('userinfo','a+',encoding='utf-8') as f: # if usr not in f.read(): # md5 = hashlib.md5() # md5.update(bytes(pwd,encoding='utf-8')) # md5_pwd = md5.hexdigest() # f.write(usr+'|'+md5_pwd+'|'+role) # else: # print('用户名已经存在') # usr = input('username: ') # pwd = input('password: ') # with open('userinfo') as f2: # for line in f2: # username,passwd,role = line.split('|') # md5 = hashlib.md5() # md5.update(bytes(pwd,encoding='utf-8')) # md5_pwd = md5.hexdigest() # if usr == username and md5_pwd == passwd: # print('登陆成功') # else: # print('wrong info') # 加盐 防止撞库破解 md5 ,不过盐也要复杂点,不然也会被撞库 import hashlib # 提供摘要算法的模块 # md5 = hashlib.md5(bytes('盐',encoding='utf-8')) # # md5 = hashlib.md5() # md5.update(b'123456') # print(md5.hexdigest()) # 动态加盐 # 用户名 密码 # 使用用户名的一部分或者 直接使用整个用户名作为盐 # import hashlib # 提供摘要算法的模块 # md5 = hashlib.md5(bytes('盐',encoding='utf-8')+b'') # # md5 = hashlib.md5() # md5.update(b'123456') # print(md5.hexdigest()) # md5 = hashlib.md5(bytes('看你怎么撞库',encoding='utf-8')) md5 = hashlib.md5() md5.update(b'123321') #当如果没有update这个操作,得出的md5也有值,意思是 空密码 print(md5.hexdigest()) #对于文件的验证一致性,是不用加盐的 #摘要算法的update可以多次使用,结果不影响输出md5的值 # md5 = hashlib.md5() # md5.update(b'123') #两处update等价于 md5.update(b'123321') # print(md5.hexdigest()) # md5.update(b'321') # print(md5.hexdigest()) with open('somewhere','r',encoding='utf-8') as f: md5 = hashlib.md5() for line in f: md5.update(bytes(line,encoding='utf-8')) # md5.hexdigest() print(md5.hexdigest()) # with open('somewhere','r',encoding='utf-8') as f: f.seek(4) print(f.read()) md5 = hashlib.md5() md5.update(bytes(f.read(),encoding='utf-8')) print(md5.hexdigest()) print(type(md5.hexdigest())) # # for i in range(5): # print('1') # print(i) # with open('somewhere','rb') as f2: # 用r模式和用rb模式,md5校验码不同 # md5 = hashlib.md5() # for line in f2: # md5.update(line) # # print(md5.hexdigest())
日志是一种可以追踪某些软件运行时所发生事件的方法。
默认情况下Python的logging模块将日志打印到了标准输出中,且只显示了大于等于WARNING级别的日志,这说明默认的日志级别设置为WARNING(日志级别等级CRITICAL > ERROR > WARNING > INFO > DEBUG),默认的日志格式为日志级别:Logger名称:用户输出消息。
import logging #create logger logger = logging.getLogger('log_type') logger.setLevel(logging.INFO) # create console handler and set level to debug ch = logging.StreamHandler() ch.setLevel(logging.INFO) # create file handler and set level to warning fh = logging.FileHandler('log_file') fh.setLevel(logging.INFO) # create formatter formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s') # add formatter to ch and fh ch.setFormatter(formatter) fh.setFormatter(formatter) # add ch and fh to logger logger.addHandler(ch) logger.addHandler(fh) #日志等级按如下顺序 # 'application' code # logger.debug('debug message') #记录一条日志,等级为debug # logger.info('info message') # logger.warn('warn message') # logger.error('error message') # logger.critical('critical message')
logging.basicConfig()函数中可通过具体参数来更改logging模块默认行为,可用参数有: filename:用指定的文件名创建FiledHandler,这样日志会被存储在指定的文件中。 filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。 format:指定handler使用的日志显示格式。 datefmt:指定日期时间格式。 level:设置rootlogger(后边会讲解具体概念)的日志级别 stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件(f=open(‘test.log’,’w’)),默认为sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略。 format参数中可能用到的格式化串: %(name)s Logger的名字 %(levelno)s 数字形式的日志级别 %(levelname)s 文本形式的日志级别 %(pathname)s 调用日志输出函数的模块的完整路径名,可能没有 %(filename)s 调用日志输出函数的模块的文件名 %(module)s 调用日志输出函数的模块名 %(funcName)s 调用日志输出函数的函数名 %(lineno)d 调用日志输出函数的语句所在的代码行 %(created)f 当前时间,用UNIX标准的表示时间的浮 点数表示 %(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数 %(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒 %(thread)d 线程ID。可能没有 %(threadName)s 线程名。可能没有 %(process)d 进程ID。可能没有 %(message)s用户输出的消息
具体可以看: 详细的日志模块