zoukankan      html  css  js  c++  java
  • C#抓取网页HTML内容

    640?wx_fmt=png

    using System;

    using System.Collections.Generic;

    using System.Linq;

    using System.Web;

    using System.Net;

    using System.Text;

    using System.IO;

    using System.Text.RegularExpressions;


    namespace Web

    {

       /// <summary>  

       /// 公共方法类  

       /// </summary>  

       public class WebHandler

       {

          /// <summary>  

          /// 获取网页的HTML码  

          /// </summary>  

          /// <param name="url">链接地址</param>  

          /// <param name="encoding">编码类型</param>  

          /// <returns></returns>  

          public static string GetHtmlStr(string url, string encoding)

          {

             string htmlStr = "";

             try

             {

                if (!String.IsNullOrEmpty(url))

                {

                   WebRequest request = WebRequest.Create(url);            //实例化WebRequest对象  

                   WebResponse response = request.GetResponse();           //创建WebResponse对象  

                   Stream datastream = response.GetResponseStream();       //创建流对象  

                   Encoding ec = Encoding.Default;

                   if (encoding == "UTF8")

                   {

                      ec = Encoding.UTF8;

                   }

                   else if (encoding == "Default")

                   {

                      ec = Encoding.Default;

                   }

                   StreamReader reader = new StreamReader(datastream, ec);

                   htmlStr = reader.ReadToEnd();                  //读取网页内容  

                   reader.Close();

                   datastream.Close();

                   response.Close();

                }

             }

             catch { }

             return htmlStr;

          }

       }  

       

    }


  • 相关阅读:
    LeetCode 867. 转置矩阵
    LeetCode 26. 删除排序数组中的重复项
    LeetCode 905. 按奇偶排序数组
    LeetCode 922. 按奇偶排序数组 II
    CentOS 7.4 系统安装 git
    浅谈final修饰的变量
    【笔试题】京东2017秋招笔试真题
    【笔试题】在 Java 中,如何跳出当前的多重嵌套循环?
    【面试题】反转单链表
    Windows 系统采用批处理命令修改 ip 地址
  • 原文地址:https://www.cnblogs.com/hgmyz/p/12351400.html
Copyright © 2011-2022 走看看