import re html = ''' <div><p>九霄龙吟惊天变</p></div> <div><p>风云际汇潜水游</p></div> ''' # 贪婪匹配 pattern = re.compile('<div><p>.*</p></div>',re.S) r_list = pattern.findall(html) print(r_list) # 非贪婪匹配 pattern = re.compile('<div><p>(.*?)</p></div>',re.S) r_list = pattern.findall(html) print(r_list)
匹配任意一个字符的正则表达式:
import re # 方法一 pattern = re.compile('.',re.S) # 方法二 pattern = re.compile('[sS]')
匹配任意多个字符的正则表达式:
import re # 方法一 pattern = re.compile('.*?',re.S) # 方法二 pattern = re.compile('[sS]*?')