zoukankan      html  css  js  c++  java
  • 微信公众号的文章爬取有三种方式


    a. 通过微信订阅号在发布文章,可以查找公众号的文章,方式见微信链接。,阅读数、点赞数、评论数仍无法抓取。

    b. 通过搜狗微信搜索微信公众号,但是文章篇幅仍然后有限制,点赞、阅读数、和评论数无法抓取。

    c. 通过“中间人方式”对数据进行拦截,过滤解析后进行抓取。

    这里就时利用第三种c方式对数据进行抓取。

    思路:

    1. 安装代理AnProxy,在手机端安装CA证书,启动代理,设置手机代理;

    2. 获取目标微信公众号的__biz;

    3. 进入微信公众号的历史页面;

    4. 使用Monkeyrunner控制滑屏;获取更多的历史消息;

    5. 记录文章标题,摘要,创建时间,创作类型,地址等等;

    6. 文章列表获取完成后,利用Monkeyrunner进入文章的列表,

    7. 记录文章的阅读数,点赞数,评论数等;

    8. 重复以上操作。

  • 相关阅读:
    struts2 DMI
    MFC添加背景图片
    c++ 副本构造器
    climits
    Qt中的qreal
    Http概述(一)
    重构学习-重构原则
    QDir的mkdir和mkpath区别
    Qt学习笔记网络(一)
    Qt5 新特性
  • 原文地址:https://www.cnblogs.com/sprinng/p/8447966.html
Copyright © 2011-2022 走看看