zoukankan      html  css  js  c++  java
  • 用TOPFISHER采集用__doPostBack()分页的网站数据

    用ASP.NET开发的网站经常会用JAVASCRIPT脚本,以__doPostBack()函数来分页,这样就不能直接看到目标网页的参数和地址。

    我们可以通过HttpWatch、ieHTTPHeaders、等工具来分析 HTTP 头,从而获取POST数据,找出规律,看看那个是分页参数,一般类似这样的值“__EVENTTARGET=DataGrid3%3A_ctl24% 3A_ctl1”这部分里就有,最后1 就是页号。只是例子。

    然后自己写程序POST方式访问此页面,并把这些数据完整的当做POST数据传给这个页面,同时修改分页参数,就可以获取全部网页的数据了。 大概就这思路,你在琢磨琢磨。



    YulinCMS(雨林内容管理系统) 是采用微软的.net技术进行架构、功能强大的网站管理软件。用户不需要学习复杂的建站技术,不需要学习太复杂的HTML语言,你就能够利用YulinCMS构建出一个风格统一功能强大的专业网站,大大加快网站的建设周期。


    [原创]用TOPFISHER采集用__doPostBack()分页的网站数据

    用ASP.NET开发的网站经常会用JAVASCRIPT脚本,以__doPostBack
       ()函数来分页,这样就不能直接看到目标网页的参数和地址。下面我来教大家用TOPFISHER页面辅助分析器,结合TOPFISHER来采集__doPostBack
       ()式分页的页面。

    以http://www.ynnw.gov.cn/scxx/schq.aspx这个页面为例:

    1.先用TOPFISHER页面辅助分析器打开http://www.ynnw.gov.cn/scxx/schq.aspx;

    2.在分析器内的WEB窗口,点击分页中的任意一页;

    3.这时候可以看到POST数据窗口中出现了一大堆POST数据;(这些数据就是schq.aspx接收的POST参数,这里我们只需要关注参数中的“__EVENTTARGET=DataGrid3%3A_ctl24%3A_ctl1”这部分,其中的红色部分,其实就是页面的页数)

    4.在TOPFISHER脚本中,用PostUrl()函数,来访问这个页面,并把这些数据完整的当做POST数据传给这个页面,然后再用FOR语句,来修改页面参数,就可以完成全部采集了。


    http://www.topfisher.com/doc/TPAssistant.rar




    c#抓取浏览器网页代码数据(winform)

    http://www.cnblogs.com/fhmsha/archive/2007/07/18/822034.html

  • 相关阅读:
    机器学习中的正则化问题(2)——理解正则化
    详解 Python 中的下划线命名规则
    编程面试的算法概念汇总
    group by多字段查询解决礼物统计
    一分钟学会Spring Boot多环境配置切换
    Maven 多模块父子工程 (含Spring Boot示例)
    第1章 Spring Cloud 构建微服务架构(一)服务注册与发现
    第3章 Spring Boot 入门指南
    第5章 Spring Boot 功能
    第4章 CentOS软件安装
  • 原文地址:https://www.cnblogs.com/smallfa/p/1044476.html
Copyright © 2011-2022 走看看