zoukankan      html  css  js  c++  java
  • 请教关于高速请求网页的方法

    类似网页爬行的程序,高速请求网页,一天可能要请求千万级别的程序,反正就是越快越好。假设电脑速度非常快,假设网络速度也非常快。i7cpu 16g内存,100m光纤独享等等。当然,如果不能提供这样的条件也要能跑。


    有几个要求,第一要使用c# 写程序,如果要用其它语言,也只能把它做成模块让c#调用。第二,要稳定,不能自动退出,这程序要24小时运行。第三,要考虑请求的网页有各种问题,404,500错误,超时等等。

    小的功力不够,使用System.Net下的 WebRequest ,加多线程,速度感觉不是很给力。容易闪退,不知道是为什么,另外速度也不够快,平均一分钟只能请求500个网页。有一些其它的工具远超过这个数。不知道他们是怎么做到。除了C或C++写的这个优势外,感觉还是有很多网络知识没精通。在这里肯请高手们赐教。

    请赐教!

  • 相关阅读:
    面向对象进阶
    20191011作业
    2019.10.10作业
    类的继承
    面向对象
    2019.10.09作业
    pandas模块
    [BZOJ 2190][SDOI2008]仪仗队(欧拉函数)
    [BZOJ 2729][HNOI2012]排队(组合数学+高精)
    [BZOJ 1491][NOI2007]社交网络(Floyd)
  • 原文地址:https://www.cnblogs.com/goodfulcom/p/2839318.html
Copyright © 2011-2022 走看看