******************
<img src="http://www.abc.com/a.jpg" alt="" /><img src="www.abcd.com/abcc.jpg" alt="" />
<img src="www.abc.com/aaa/cdef/25gfitt8/aaaa.gif" alt="" /><img src="img.abc.com/a/222/a.png" alt="">
<img src="www.abc.com/a.jpg" alt="" />
<img src="abc.net/abc.jpg" alt="" />
******************
设以上内容全部为文本内容,并非html标签。
如何通过正则匹配出所有资源路径,不包含资源名。
单行、多行、转行、路径层次、路径名、资源名都未知。
简单来说就是: 链接中最后一个斜杠/前面的内容。
难点一:同一行中可能有多条资源,即多个斜杠/;
难点二:所有路径层次、名称都未知。
比如:
要匹配的内容:两行(文本)。
<img src="http://www.abc.com/a.jpg" alt="" /><img src="www.abcd.com/abcc.jpg" alt="" />
<img src="222/abcc.jpg" alt="" />
结果:三个匹配到的内容(路径)。
http://www.abc.com/
www.abcd.com/
222/