以前在做网页静态生成的时候,使用正则表达式分析提取网页链接。最近搜索了解到java有个Jsoup解析网页,对应.net有个nsoup。处理网页非常好用。
Document doc = NSoupClient.Parse(str); Elements es = doc.Select("a.link"); foreach (Element e in es) { a=e.Attr("href"); }
具体使用,百度参考Jsoup的手册就妥了。