zoukankan      html  css  js  c++  java
  • 网页抓取小工具(IE法)

    网页抓取小工具(IE法)—— 吴姐

    http://club.excelhome.net/thread-1095707-1-1.html

    用IE提取网页资料的好处在于:所见即所得,网页上能看到的信息一般都能获取。
    本工具功能不多,主要是便于提取网页上展示的信息所在元素的代码。希望能对大家有点小帮助。
    网页抓取小工具.rar (22.91 KB, 下载次数: 2426)
    本工具使用方法:
    1、在B1内输入网址,可以是已打开的网页,也可以是未打开的
    2、A2和B2的内容不要更改,第二行的其他单元格可以自行输入元素的各属性名称。其中,innertext单元格有下拉选项
    3、点击“开始分析”分析网页元素。
    4、A列是各元素的对象代码。
    5、在innertext列查找所需提取的内容后,选定该行,点击“生成excel”。
         可以提取Table标签的表格或下载IMG标签的图片。
    6、在新生成的excel里,点击“执行代码”按钮,看是否能生成所需数据。

    如果生成的数据和开始分析的数据不符,原因可能是:
    1、网页未完全加载完毕,对应标签的数据尚未加载,代码自动提取了其后的标签数据。
       可能的解决方法:加上do...loop时间延迟。
    2、网页为动态网页,标签的序号不定。
       可能的解决方法:元素有id名的话用getelementbyid("id名")名获取,没有的话抓包换xmlhttp法提取吧。
    3、需要选择相关选项或需要登录才能提取。
       可能的解决方法:先做登录或选择相关选项等操作后再提取

    这个工具主要针对初学者的,浏览器可以分析,但无法给出具体的某个元素的vba代码。工具里可以直接生成网抓的vba代码。ajax、frame里的内容也能自动生成代码。

    懦夫从不启程,弱者溺与途中,只剩我们前行~
  • 相关阅读:
    C# 连接数据库
    MySQL数据类型char与varchar中数字代表的究竟是字节数还是字符数?
    group by与avg(),max(),min(),sum()函数的关系
    MySQL内连接、外连接、交叉连接
    Mysql 插入中文错误:Incorrect string value: 'xE7xA8x8BxE5xBAx8F...' for column 'course' at row 1
    session和token
    session和cookies
    sessionid如何产生?由谁产生?保存在哪里?
    跨域,你需要知道的全在这里
    匈牙利算法模板
  • 原文地址:https://www.cnblogs.com/dlsunf/p/8446799.html
Copyright © 2011-2022 走看看