zoukankan html css js c++ java
正则模块与正则表达式

# re：正则，全称正则字符串 - re就是有特殊语法的字符串
# re可以将有正则语法的字符串解析为对应的正则对象，用来匹配目标字符串

# 学习re的目的：1.判断目标字符串是否合法 2.在目标字符串中提取想要的信息（信息匹配规则采用正则）


# 基本使用



import re

r1 = re.findall(r'1', '123abc123')
print(r1)

# re.I不区分大小写匹配
r2 = re.findall(r'a', '123abc123ABC', flags=re.I)
print(r2)

# 1.将 r'd' 丢给_compile得到可以匹配数字的 正则对象
# 2.正则对象.findall('目标字符串')
r3 = re.findall(r'd', '123abc123')
print(r3)


re_obj = re.compile(r'd')  # 将 r'd' 丢给_compile得到可以匹配数字的 正则对象
r4 = re_obj.findall('123abc123')  # 正则对象.findall('目标字符串')
print(r4)


#########单个字符###########################################################

# 一、单个字符语法
# 匹配a
print(re.findall(r'a', '123abc嘿嘿'))  # ['a']

# a或b
print(re.findall(r'a|b', '123abc嘿嘿'))  # ['a', 'b'] 不建议使用
print(re.findall(r'[ab]', '123abc嘿嘿'))  # ['a', 'b'] 建议使用

# 非a非b
print(re.findall(r'[^ab]', '123abc嘿嘿'))  # ['1', '2', '3', 'c', '嘿', '嘿']

# 数字
print(re.findall(r'[0-9]', '12abc嘿嘿12'))  # ['1', '2', '1', '2'] 建议使用
print(re.findall(r'd', '12abc嘿嘿12'))  # ['1', '2', '1', '2'] 不建议使用

# 字母
print(re.findall(r'[a-zA-Z]', '12abc[嘿嘿ABC'))  # ['a', 'b', 'c', 'A', 'B', 'C']

# 字母数字_常用汉字：w => 建议使用 [a-zA-Z0-9_]
print(re.findall(r'w', '12abc[_嘿嘿ABC'))  # ['1', '2', 'a', 'b', 'c', '_', '嘿', '嘿', 'A', 'B', 'C']

# 汉字 [u4e00-u9fa5]
print(re.findall(r'[u4e00-u9fa5]', '12abc[_嘿嘿ABC'))  # ['嘿', '嘿']

# 空白字符：s => 建议使用[ f

	v]
print(re.findall(r's', ' f

	v'))  # [' ', 'x0c', '
', '
', '	', 'x0b']

# 非
的任意字符: .
print(re.findall(r'.', ' f

	v*&_.'))  # [' ', 'x0c', '
', '	', 'x0b', '*', '&', '_', '.']

# 只想匹配.字符：.
print(re.findall(r'.', ' f

	v*&_.'))  # ['.']

# re.S: 让.也能匹配
，就可以理解为 . 可以匹配所有字符
print(re.findall(r'.', ' f

	v*&_.', flags=re.S))

# 取对立面 d数字 D非数字  w=>W  s=>S
print(re.findall(r'D', '12abcf嘿嘿12'))  # ['a', 'b', 'c', 'x0c', '嘿', '嘿']


###################分组语法################################################################


# 引子
print(re.findall(r'(?:ab){2}', 'abbabab'))  # ['abab']

# findall(): 没有分组情况下，显示匹配的结果；如果有分组，显示分组结果

# 分组：()
# 取消分组：(?:)
# 有名分组：(?P<名字>)

# 案例：
# 匹配链接
print(re.findall(r'www..+?.com', 'www.baidu.comabcwww.sina.com'))  # ['www.baidu.com', 'www.sina.com']
# 获取链接的域名：['baidu', 'sina']
print(re.findall(r'www.(.+?).com', 'www.baidu.comabcwww.sina.com'))  # ['baidu', 'sina']

# 分组编号: 从左往右数左(进行分组编号
# [('www.baidu.com', 'baidu', 'com'), ('www.sina.edu', 'sina', 'edu')]
res = re.findall(r'(www.(.+?).(com|edu))', 'www.baidu.comabcwww.sina.edu')
print(res)
print(res[0][1])

# 取消分组:(?:) 应用于，要将一些数据作为整体看待，但由不能产生分组
# [('www.baidu.com', 'baidu'), ('www.sina.edu', 'sina')]
res = re.findall(r'(www.(.+?).(?:com|edu))', 'www.baidu.comabcwww.sina.edu')
print(res)


############3正则其他方法###########################################################

# match:不是全文匹配，必须从头开始匹配，且只匹配一次
res = re.match(r'(www.(?P<site_name>.+?).(?:com|edu))', 'www.baidu.comwww.sina.edu')
# 可以通过分组号直接取出分组内容
print(res.group(1))
print(res.group(2))
# print(res.group(0), res)  # 匹配的整体

# 有名分组
print(res.group('site_name'))


# split(): 拆分
print('abc def xyz'.split(' '))
print(re.split(r' ', 'abc def xyz'))
print(re.split(r'[,@ ]', 'abc,def@xyz opq'))


# sub(): 替换
res = re.sub(r'good', 'bed', 'good good day a')
print(res)  # bed bed day a

res = re.sub(r'good', 'bed', 'good good day a', count=1)
print(res)  # bed good day a

res = re.sub(r'good day a', '123', 'good day a!!!')
print(res)  # 123!!!

# 结合分组可以完成数据的重组
res = re.sub(r'(good) (day) (a)', r'today is 3 1 2', 'good day a!!!')
print(res)  # today is a good day!!!



import re

r1 = re.findall(r'1', '123abc123')
print(r1)

r2 = re.findall(r'a', '123abc123ABC', flags=re.I)
print(r2)

# 1.将 r'd' 丢给_compile得到可以匹配数字的 正则对象
# 2.正则对象.findall('目标字符串')
r3 = re.findall(r'd', '123abc123')
print(r3)

re_obj = re.compile(r'd')  # 将 r'd' 丢给_compile得到可以匹配数字的 正则对象
r4 = re_obj.findall('123abc123')  # 正则对象.findall('目标字符串')
print(r4)
查看全文
相关阅读:
菜根谭#39
菜根谭#38
菜根谭#37
菜根谭#36
菜根谭#35
菜根谭#34
菜根谭#33
菜根谭#32
mysqli的使用
 mysql常用修改创建语句
原文地址：https://www.cnblogs.com/1832921tongjieducn/p/10922774.html