zoukankan html css js c++ java

【源码】初探C#爬虫，持续更新中。。。

最近看到园子里有人用python做的爬虫软件并且上传的源码，苦于不懂python，便想着用C#也实现一个简易的爬虫软件。于是昨晚花了一个多小时的时间实现了一个简单的爬虫软件，功能十分简单，但是觉得还是想分享出来。。。后续楼主还会把功能继续完善下去。。

一、废话不多说，直接上图上码！

二、其实代码很简单：

  public string CreateWeb(string url)
        {

            StringBuilder sb = new StringBuilder();
            //抓取网页
            WebRequest request = WebRequest.Create(url);
            WebResponse response = request.GetResponse();
            //读取文件流
            StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("utf-8")); //reader.ReadToEnd() 表示取得网页的源码
            //FileStream fs = new FileStream("~/baidu.html", FileMode.OpenOrCreate);
            string strhtml = reader.ReadToEnd();
            //正则匹配网站的图片标签
            string Rxg = @"<img[^<]*(?:(?!</img>)*)";
            //匹配出图片标签的集合
            MatchCollection mc = Regex.Matches(strhtml, Rxg);
            for (int i = 0; i < mc.Count; i++)
            {
                sb.Append(mc[i]);
            
            }
            //返回图片标签HTML输出
            return sb.ToString();
        }

三、总结：其实爬虫的话无非是抓取页面，然后通过一些规则匹配到页面里面的元素。

四、源码：SuperSearch.rar

作者： LiuHuaTao（ LiuHuaTao's Blog on 博客园）
出处：http://www.cnblogs.com/Lhuatao/
本作品由 LiuHuaTao 创作，采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。欢迎转载，但任何转载必须保留完整文章，在显要地方显示署名以及原文链接。如您有任何疑问或者授权方面的协商，请给我留言。

查看全文

相关阅读:
安装express 新建项目遇到问题汇总
 Java IO
python3基础之“函数（1）”
python3基础之“小练习（3）”
python3基础之“小练习（2）”
python3基础之“小练习（1）”
linux命令
 1.环境安装部署汇总
 阶段13-直播~
docker环境问题

原文地址：https://www.cnblogs.com/Lhuatao/p/4481091.html

【源码】初探C#爬虫，持续更新中。。。

一、 废话不多说，直接上图上码！

二、其实代码很简单：

三、总结：其实爬虫的话无非是抓取页面，然后通过一些规则匹配到页面里面的元素。

四、 源码：SuperSearch.rar

一、废话不多说，直接上图上码！

四、源码：SuperSearch.rar