ASP.NET获取HTML代码时的乱码问题 - 走看看

zoukankan html css js c++ java

ASP.NET获取HTML代码时的乱码问题

        //
        //方法GetPageSource：获取指定网页的HTML代码
        //
        public static string GetPageSource(string URL)
        {
            Uri uri =new Uri(URL);

            HttpWebRequest hwReq = (HttpWebRequest)WebRequest.Create(uri);
            HttpWebResponse hwRes = (HttpWebResponse)hwReq.GetResponse();

            hwReq.Method = "Get";
            hwReq.KeepAlive = false;
            //将该属性设置为 true 以发送带有 Keep-alive 值的 Connection HTTP 标头。
            //应用程序使用 KeepAlive 指示持久连接的首选项。
            //当 KeepAlive 属性为 true 时，应用程序与支持它们的服务器建立持久连接。
            //注意   使用 HTTP/1.1 时，Keep-Alive 默认情况下处于打开状态。
            //将 KeepAlive 设置为假可能导致将 Connection: Close 标头发送到服务器。

            StreamReader reader= new StreamReader(hwRes.GetResponseStream(),System.Text.Encoding.GetEncoding("gb2312"));


            return reader.ReadToEnd();
        }
我写了这个方法从指定页面中获取HTML代码。
但当指定页面是UTF-8时，中文即出现乱码。
有什么办法知道指定页面使用的是什么编码？
如果指定页面本来就使用GB2312，我又把它转换为GB2312，会出现什么结果？

查看全文

相关阅读:
Struts2笔记——ONGL表达式语言
 Struts2笔记——自定义拦截器
 Struts2笔记——Action校验器
 Struts2笔记——文件上传
 Struts2笔记——与ServletAPI解耦
 Struts2笔记——通配符和动态方法调用
 Struts2笔记——类型转换
 Struts2笔记——result结果类型
 MongoDB相关资料
 公开数据集

原文地址：https://www.cnblogs.com/bankey/p/806869.html

Copyright © 2011-2022 走看看