用C#写爬虫时候,比较实用的一项技巧。
/// <summary> /// 格式化URL函数 urlX 传入相对URL objurl 传入绝对基URL 基URL 一定要带HTTP:// /// </summary> /// <param name="urlX">传入单个的URL</param> /// <param name="objurl"> /// 传入得到值的页面URL /// </param> /// <returns></returns> public String FormAturl(String urlX, string objurl) { Uri baseUri = new Uri(objurl); // http://www.enet.com.cn/enews/inforcenter/designmore.jsp Uri absoluteUri = new Uri(baseUri, urlX);//相对绝对路径都在这里转 这里的urlx ="../test.html" return absoluteUri.ToString();// http://www.enet.com.cn/enews/test.html }