zoukankan      html  css  js  c++  java
  • 复杂HTML解析

    面对页面解析难题时候,需要注意问题:

    1、寻找“打印次页”的链接,或者看看网站有没有HTML样式更友好的移动版(把自己的请求头设置成处于移动设备的状态,然后接收网站移动版)。

    2、寻找隐藏在JavaScript文件里的信息。要实现这一点,可能需要查看网页加载的JavaScript文件。比如一个网站上的街道地址(以纬度和经度呈现的)整理成格式整洁的数组时,查看过内嵌谷歌地图的JavaScript文件,里面有每个地址的标记点。虽然网页标题经常会用到,但是这个信息也许可以从网页的URL链接里获取。

    3、如果找的信息只存在于一个网站上,别处没有,那你确实是运气不佳。如果不只限于这个网站,那么可以找找其他数据源。有没有其他网站也显示了同样的数据?网站上显示的数据是不是从其他网站上抓取后攒出来的?

  • 相关阅读:
    java练习6
    java练习5
    java练习4
    java练习3
    java练习2
    java练习1
    用代码实现判断字符串的开头和结尾
    语句练习题2
    语句练习题1
    值类型和引用类型的区别
  • 原文地址:https://www.cnblogs.com/blacksunny/p/6939010.html
Copyright © 2011-2022 走看看