zoukankan      html  css  js  c++  java
  • 用TOPFISHER采集用__doPostBack()分页的网站数据

    用ASP.NET开发的网站经常会用JAVASCRIPT脚本,以__doPostBack()函数来分页,这样就不能直接看到目标网页的参数和地址。

    我们可以通过HttpWatch、ieHTTPHeaders、等工具来分析 HTTP 头,从而获取POST数据,找出规律,看看那个是分页参数,一般类似这样的值“__EVENTTARGET=DataGrid3%3A_ctl24% 3A_ctl1”这部分里就有,最后1 就是页号。只是例子。

    然后自己写程序POST方式访问此页面,并把这些数据完整的当做POST数据传给这个页面,同时修改分页参数,就可以获取全部网页的数据了。 大概就这思路,你在琢磨琢磨。



    YulinCMS(雨林内容管理系统) 是采用微软的.net技术进行架构、功能强大的网站管理软件。用户不需要学习复杂的建站技术,不需要学习太复杂的HTML语言,你就能够利用YulinCMS构建出一个风格统一功能强大的专业网站,大大加快网站的建设周期。


    [原创]用TOPFISHER采集用__doPostBack()分页的网站数据

    用ASP.NET开发的网站经常会用JAVASCRIPT脚本,以__doPostBack
       ()函数来分页,这样就不能直接看到目标网页的参数和地址。下面我来教大家用TOPFISHER页面辅助分析器,结合TOPFISHER来采集__doPostBack
       ()式分页的页面。

    以http://www.ynnw.gov.cn/scxx/schq.aspx这个页面为例:

    1.先用TOPFISHER页面辅助分析器打开http://www.ynnw.gov.cn/scxx/schq.aspx;

    2.在分析器内的WEB窗口,点击分页中的任意一页;

    3.这时候可以看到POST数据窗口中出现了一大堆POST数据;(这些数据就是schq.aspx接收的POST参数,这里我们只需要关注参数中的“__EVENTTARGET=DataGrid3%3A_ctl24%3A_ctl1”这部分,其中的红色部分,其实就是页面的页数)

    4.在TOPFISHER脚本中,用PostUrl()函数,来访问这个页面,并把这些数据完整的当做POST数据传给这个页面,然后再用FOR语句,来修改页面参数,就可以完成全部采集了。


    http://www.topfisher.com/doc/TPAssistant.rar




    c#抓取浏览器网页代码数据(winform)

    http://www.cnblogs.com/fhmsha/archive/2007/07/18/822034.html

  • 相关阅读:
    AJax封装避免页面重复代码
    word 2010 建立多级结构和目录
    (转)C# 选择正确的集合
    IIS7如何部署asp.net网站 (asp.net mvc 5 , asp.net 4.5 , asp.net 4.0 都可以 )
    (转)程序集清单定义与程序集引用不匹配- 分析及解决
    CentOS 6.5 安装 MySQL5.6 并用Navicat for MySQL 连接
    用EF访问Centos下的MySQL
    SQLServer中的页如何影响数据库性能 (转)
    .NET Framework各版本比较
    EntityFramework简介
  • 原文地址:https://www.cnblogs.com/smallfa/p/1044476.html
Copyright © 2011-2022 走看看