zoukankan
html css js c++ java
ASP.NET获取HTML代码时的乱码问题
//
//
方法GetPageSource:获取指定网页的HTML代码
//
public
static
string
GetPageSource(
string
URL)
{
Uri uri
=
new
Uri(URL);
HttpWebRequest hwReq
=
(HttpWebRequest)WebRequest.Create(uri);
HttpWebResponse hwRes
=
(HttpWebResponse)hwReq.GetResponse();
hwReq.Method
=
"
Get
"
;
hwReq.KeepAlive
=
false
;
//
将该属性设置为 true 以发送带有 Keep-alive 值的 Connection HTTP 标头。
//
应用程序使用 KeepAlive 指示持久连接的首选项。
//
当 KeepAlive 属性为 true 时,应用程序与支持它们的服务器建立持久连接。
//
注意 使用 HTTP/1.1 时,Keep-Alive 默认情况下处于打开状态。
//
将 KeepAlive 设置为假可能导致将 Connection: Close 标头发送到服务器。
StreamReader reader
=
new
StreamReader(hwRes.GetResponseStream(),System.Text.Encoding.GetEncoding(
"
gb2312
"
));
return
reader.ReadToEnd();
}
我写了这个方法从指定页面中获取HTML代码。
但当指定页面是UTF-8时,中文即出现乱码。
有什么办法知道指定页面使用的是什么编码?
如果指定页面本来就使用GB2312,我又把它转换为GB2312,会出现什么结果?
查看全文
相关阅读:
中台入门系列1
微服务 2.0 技术栈选型手册
mysql计划任务每天定时执行
更高效地提高redis client多线程操作的并发吞吐设计
azure之MSSQL服务性能测试
.NET Socket服务编程之-高效连接接入编
轻易实现基于linux或win运行的聊天服务端程序
零配置Socket TCP消息通讯服务容器EC
azure存储压测的问题(农码主观意识太强被坑了)
业务逻辑层缓存应该设计
原文地址:https://www.cnblogs.com/bankey/p/806869.html
最新文章
大众点评的实时计算
深入理解FFM原理与实践
千与千寻-成长的故事
使用 bibtex4word 实现在 office word 中管理并插入参考文献
使用 LaTeX 画图系列
LaTeX 中使两张表格并排
LaTeX :font size 修改字体大小的几种方式
【AI】Exponential Stochastic Cellular Automata for Massively Parallel Inference
【RS】Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model
【ML】Predict and Constrain: Modeling Cardinality in Deep Structured Prediction -预测和约束:在深度结构化预测中建模基数
热门文章
RS:关于协同过滤,矩阵分解,LFM隐语义模型三者的区别
Python实现:十进制数与(2~16进制数)之间的互相转换
【RS】Stochastic PCA with ℓ2 and ℓ1 Regularization
Docker搭建Nginx
Linux根目录下各个目录的用途及含义
Docker搭建Mysql
Docker搭建Portainer
Linux环境宿主机进入Docker容器、连接数据库、复制文件
Docke 镜像加速
restTemplate x-www-form-urlencoded
Copyright © 2011-2022 走看看