zoukankan      html  css  js  c++  java
  • 请教关于高速请求网页的方法

    类似网页爬行的程序,高速请求网页,一天可能要请求千万级别的程序,反正就是越快越好。假设电脑速度非常快,假设网络速度也非常快。i7cpu 16g内存,100m光纤独享等等。当然,如果不能提供这样的条件也要能跑。


    有几个要求,第一要使用c# 写程序,如果要用其它语言,也只能把它做成模块让c#调用。第二,要稳定,不能自动退出,这程序要24小时运行。第三,要考虑请求的网页有各种问题,404,500错误,超时等等。

    小的功力不够,使用System.Net下的 WebRequest ,加多线程,速度感觉不是很给力。容易闪退,不知道是为什么,另外速度也不够快,平均一分钟只能请求500个网页。有一些其它的工具远超过这个数。不知道他们是怎么做到。除了C或C++写的这个优势外,感觉还是有很多网络知识没精通。在这里肯请高手们赐教。

    请赐教!

  • 相关阅读:
    POJ1661 Help Jimmy
    POJ2533 Longest ordered subsequence
    数字三角形
    第四章 指令系统
    栈和队列
    第三章 存储器的层次结构
    线性表—概念总结及代码示例
    数据的表示和运算
    计算机系统概述
    树-概念性总结及代码示例
  • 原文地址:https://www.cnblogs.com/goodfulcom/p/2839318.html
Copyright © 2011-2022 走看看