zoukankan      html  css  js  c++  java
  • 八爪鱼大数据--淘宝评价采集教程(7.3.2版本)

    注册帐号什么的就不说了,安装也是傻瓜式安装,直接从任务页面开始。

    本次教程演示地址:https://item.taobao.com/item.htm?id=523029053649&ali_refid=a3_430673_1006:1110347700:N:%E7%9A%AE%E9%9E%8B:9062e5cd193707339be11717cfe19422&ali_trackid=1_9062e5cd193707339be11717cfe19422&spm=a2e15.8261149.07626516002.7

    步骤一:选择自定义采集,点击“立即使用”

    步骤二:粘贴复制网址,点击“保存网址”

    步骤三:点击右上角“流程”,设置滚动页面,滚动次数按自己要求而定,点击“确定”保存

    步骤四:点击“累计评论1054”,选择黄色框内的“点击该链接”

    步骤五:设置Ajax加载数据为4秒,点击“确定”保存

    步骤六:鼠标滚动页面,找到“下一页”并点击,然后黄色框中选择“循环点击下一页”

    步骤七:对循环翻页进行设置,Ajax加载数据时间为4秒,设置滚动页面,记得点击“确定”进行保存

    步骤八:开始进行淘宝评论采集,鼠标点击网页中的其中一个商家评论区,注意:点击空白处,使黄色框中出现下面这种操作提示

    然后选择“选中子元素”,再选择“选中全部”,最后是“采集数据”,这时候别急着点击“保存并开始采集”,先做完步骤九。

    步骤九:点击完“采集数据”后,上方流程设置区会出现各个字段,每个字段名称是可以修改的,根据你采集到的数据去分类,有些没用的字段是可以进行删除的,下面有删除图标,选中字段再点删除图标即可,切记记得点击“确定”进行保存设置,这一步千万不能漏,下面进行演示。

    修改完字段名称,就可以点击“保存并开始采集”了,当然你不改也没问题,看你个人需求。

     

    步骤十:启动本地采集

    ps:本地采集是免费的,云采集要钱,但是也肯定更牛逼,穷屌丝表示还没试过

    做完上面这一步,剩下就是等数据采集完成了,下面展示一下成功进行采集的页面

    根据你的个人需求可以停止采集,如果你的采集进行了10秒都没有采集到一条,那可能你上面的步骤哪里出了问题,别问我为什么10秒,因为我设置的滚动次数乘以间隔时间就是10秒

    采集完成就可以导出数据了

    这便是我最终采集的数据,不过字段名称没怎么仔细修改,这次的分享就到这里了,希望能对各位有所帮助,如果有问题的也欢迎留言评论,有新需求的我也可以跟大家一起学习探讨。

  • 相关阅读:
    test
    Android初学-AsyncTask下载网络图片
    SFTP Using Chilkat Active component
    test wilddog
    c# multi-ply download ui
    VB6 Common Dialog
    Advanced Find and Replace(文件内容搜索替换工具)v7.8.1简体中文破解版
    【Unity Shaders】Shader中的光照
    GDAL不支持创建PCIDSK的面状矢量格式
    CentOs查看文件的几种方式
  • 原文地址:https://www.cnblogs.com/hrlin/p/8486607.html
Copyright © 2011-2022 走看看