zoukankan html css js c++ java

程序用伪链进行下载

今天在做资源抓取程序时遇到一个问题，用于下载资源的url并不是资源的真实url,在浏览器中点击，可以下载，但用代码下载回来的东西是一堆html源码。

后来设置了http referer,下载正常了。

1，HttpWebRequest下载

Encoding encode = Encoding.GetEncoding(pagecode);
                //请求URL
                HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);
                req.Referer = url;//referer的作用是签定用户是从何处引用连接的, 很多网站都是通过这个referer来防止盗链
                //设置超时(10秒)
                req.Timeout = 10000;
                //获取Response
                HttpWebResponse rep = (HttpWebResponse)req.GetResponse();
                //创建StreamReader与StreamWriter文件流对象
                StreamReader sr = new StreamReader(rep.GetResponseStream(), encode);
                StreamWriter sw = new StreamWriter(filename, false, encode);
                //写入内容
                sw.Write(sr.ReadToEnd());
                //清理当前缓存区，并将缓存写入文件
                sw.Flush();
                //释放相关对象资源
                sw.Close();
                sw.Dispose();
                sr.Close();
                sr.Dispose();

2，System.Net.WebClient 下载

public void DownFile(string url, string filepath)
        {
            try
            {                
                WriteLog("filepath:" + filepath + " 下载" + url + "开始");
                client.Headers.Add("Referer", url);//referer的作用是签定用户是从何处引用连接的, 很多网站都是通过这个referer来防止盗链

                client.DownloadFile(url, filepath);
                
                WriteLog("filepath:" + filepath + " 下载" + url + "结束");
            }
            catch (Exception ex)
            {
                WriteLog("getSource请求" + url + "发生了异常:" + ex.ToString());
            }
        }

查看全文

相关阅读:
谈谈我的经历--【产品设计中遇到的坑0】系列文章的序
 2017.02.04,读书，2017第二本《把时间当作朋友》读书笔记
 读书《重生，七年就是一辈子》
好剧推荐：This is us
直播预告：产品设计中不得不知的事情
 高德地图事件与插件绑定
 高德地图基础
 es6 Iterator和for...of循环
 class与class的继承
 JS保留两位小数的几种方法

原文地址：https://www.cnblogs.com/crazy29/p/2387706.html