工作中遇到一个小问题,需要在一个日志文件中,删选出包含emrfs sync命令和之后内容的行,格式如下,
[2019-10-31 08:20:16,389] {logging_mixin.py:84} INFO - emrfs sync s3://cf-data-sync/mysql2s3/account/tbl_user_account/
考虑采用正则表达式来做,代码如下
import re pattern = re.compile(r'emrfs sync S+') with open('sync.sh', 'r') as f: line=f.readline() while line: m = pattern.findall(line) if m: print(m[0]) line=f.readline()