元字符
pip Beautiful Soup 美汤
import re 导入
正则的功能:抓取,判断,过滤
. 就是匹配所有all 除了(
) 转义(/.)用于中间有点的时候
[1-9] [1,2,3] [A,B,C] [548932] [9876543210] 匹配范围 区间
d 匹配所有数字0-9
D 除去所有数字
w 匹配单词字符 a-z, A-Z ,0-9, 下划线 用于匹配邮箱
W 除去所有的字母数字 剩(#%)
s 匹配空白 即空格,tab键
S匹配非空白
str.strip()自动去除前后空格
(163|QQ|) 配置表达式 | 是或者的意思
(?= ) 向前查找
ret=re.match("^(?=.*[a-z])(?=.*[A-Z])(?=.*[0-9])[w]{6}$",password)
修饰元字符
greed 贪婪 * +
lazy 懒惰 ?
^a 定制必须是以a开头的
a$ 定制必须以a结尾
[^a] 排除a
(1) 不是元组 是数字1
(1,) 元组必须有逗号
@qq163|QQ|
(163|QQ|) 配置表达式 | 是或者的意思
import re
print(ret.group())
match 是从头开始匹配 否则报错
str=" "
a= re.compile(" ")
print(a.findall(str))
1 import re 2 # 键盘录入 3 n=input("请输入网址:") 4 ret=re.match(r"^(https://www).[0-9a-zA-Z]+.(com)$",n) 5 6 if ret: 7 print("%s输入正确"%(ret.group())) 8 9 else: 10 print("输入网址有误%s"%n)
# 匹配所有汉字 print(re.findall('[u4e00-u9fa5]', data)) # 匹配所有单字符,英文,数字,特殊符号 print(re.findall('[x00-xff]', data)) # 匹配所有非单字符,如汉字和省略号 print(re.findall('[^x00-xff]', data))