问题/需求:
需要将字符串切分,但是分隔符在整个字符串中并不一致
(即:需要用多个分隔符切分字符串)
str.split()方法不可行:
只支持单一分隔符,不支持正则及多个切割符号,不感知空格的数量
解决办法:
re.split()
适用:多个 分隔符,切割功能非常强大
语法: re.split(pattern, string, maxsplit=0)
通过正则表达式将字符串分离。如果用括号将正则表达式括起来,那么匹配的字符串也会被列入到list中返回。maxsplit是分离的次数,maxsplit=1分离一次,默认为0,不限制次数。
例子:
>>> import re
>>> line = 'aa bb cc dd; ee ff. gg- hh ii kk'
>>> line
'aa bb cc dd; ee ff. gg- hh ii kk'
单字符切割:
>>> re.split(';',line)
['aa bb cc dd', ' ee ff. gg- hh ii kk']
两个字符以上切割,放在 [ ] 中(不保留分隔符):
>>> re.split('[;.-]',line)
['aa bb cc dd', ' ee ff', ' gg', ' hh ii kk']
使用 ( ) 捕获分组(保留分割符):
>>> re.split('([;,])',line)
['aa bb cc dd', ';', ' ee ff', '.', ' gg', '-', ' hh ii kk']
使用注意:
pattern中有问号时, 要加 转义,不然切分完全会不同。