zoukankan      html  css  js  c++  java
  • java爬虫(六)分析AJAX接口获取网页动态内容

    1.实现原理

    2.详细过程

    这里我们直接观察审查元素(检查)中的内容来判断接口


    这里我选取了一个动态网页的查看更多,直接点击在这里插入图片描述
    然后观察network选项卡的变化
    在这里插入图片描述
    这里可以看到网页在无刷新的状态下,通过查看更多加载了很多图片资源,其中第一个文件,查看一下它的Preview选项卡,可以看到这个文件是存储json的


    然后通过Headers选项卡,我们可以看到它请求的URL,
     问题来了:访问这个链接报错

    有一个困惑:从父目录中点击按钮访问某个页面可以产生信息。但是把这个链接单独拿出来在浏览器中访问就会报错如下图

     

     


    这样我们可以遵循链接的规则,去做一下简单的请求在这里插入图片描述
    既然数据被爬取下来了,我们就可以通过操作json的方法,去操作请求下来的数据,非常方便。
    操作json文件

    https://www.pianshen.com/article/9318874742/

    参考 :https://blog.csdn.net/qq_41506882/article/details/104354521

  • 相关阅读:
    [LeetCode] Letter Combinations of a Phone Number
    [LeetCode] Combinations
    [Algorithms] Longest Increasing Subsequence
    2.Orange安装
    1.Orange是什么鬼?
    5.motan之注解方式配置
    4.motan之集群调用
    3.motan之异步调用
    2、motan入门程序
    1、微博RPC框架Motan
  • 原文地址:https://www.cnblogs.com/StarZhai/p/14128011.html
Copyright © 2011-2022 走看看