正则规则:客观存在的,世界上任何一种语言都能使用它。
在线测试网址:http://tool.chinaz.com/regex
正则语句:只和字符串相关,需要考虑的是:在同一个位置上可以出现的字符范围
推荐参考书:《正则指引》,设计学科:爬虫,数据分析
注意:正则表达式本身也和python没有必然联系,它就是匹配字符串内容的一种规则
在同一个位置可能出现的各种字符组成了一个字符组,在正则表达式中用[……]表示,括号内的内容如有排序,必须按ASCII码的升序排列。
正则表达式,默认匹配原则是贪婪匹配,即往多了匹配
正则表达式写法:先规则后接量词,而且量词的约束范围是离它最近的一个规则
惰性匹配:?后的第一条规则,只找符合该规则的去匹配
*?x:(x是规则;)非贪婪有限匹配,匹配当指定字符前所有字符串