近日做了一下采集某个网页的内容,并获取其中所有的链接地址及链接标题。
其中用到了HttpWebRequest和正则表达式,代码备忘如下:
这其中,正则表达式迷糊了我一会儿:因为没有使用惰性匹配,导致每一次都只能匹配到一条信息。。。。