zoukankan      html  css  js  c++  java
  • 爬虫助手spider_tool-JUN

    #使用文档

    --前言,开发工具初衷:作者是Python爬虫工程师,接到公司的爬虫需求比较多,在正式开发写代码前,需要不断的去调试网站接口以及返回的数据来确定是否可行性

    但是调试又得去写代码调试,来来回回折腾的挺麻烦,所以就想着开发这一款工具,来帮助提高开发的效率,工具目的:正式写代码前对app接口,以及网页数据调试,当然这个也可以用作接口的测试工具

    #版本介绍说明

    spider_tool-JUN-测试版
     完成基础功能
    spider_tool-JUN-V0.0.1 完成了生成代码功能,优化了xpath/正则来回切换,增加了软件下载更新地址

     ##功能介绍以及使用说明##

    1.地址url: 字面意思,输入需要请求的接口地址,或网址必须为 http:// 或 https:// 开头 不能直接输入比如:www.baidu.com

    2.请求方法: 目前只添加了最常用的get请求和post请求,选择哪个根据地址需要的请求方法来选,如果后期有其他请求方法需求可以再加

    3.提交:emmm...这个就不多说了,填写好所有需要的参数后提交即可返回对应的数据,提示:如果一些必要参数没有填写会有弹框提示

    4.全部清空:把填写的所有内容清空,包括返回的文本

    5.IP代理:目前只支持 ip:端口这种格式 例如:192.168.0.1:0000  暂时只支持单个,后期会改进使用多个

    6.随机ua:这个是请求头里的随机UserAgent参数,目前只支持随机谷歌chrome ua,如果请求头只想加入一个UserAgent就能访问的话,

    勾选此项就不用再填写请求头文本框内的参数,这个挺方便的

    7.禁止重定向:顾名思义,就是不让地址进行重定向请求,只返回请求未重定向的响应文本,多在请求登录接口上使用

    8.关闭SSL验证:这个的话多用于app接口上使用,如果响应文本报错SSL,那就勾选此项吧

    9.响应解码:添加了目前最常用的utf-8和gbk 对响应文本的编码设置默认utf-8

    10.生成代码:返回Python对应已调试选择好的代码,需要在python环境下运行,依赖包   pip install requests    只生成到了响应数据那块,至于正则/xpath提数那块自定义比较多,暂时没做

     

     11.请求头request_haders: 请求地址url的请求头,目前支持两种格式,一种是直接从网页上复制下来的,另一种是在代码中使用的字典格式

    本人觉得直接网站复制下的功能方便= =字典毕竟还得手动加""引号,如果只需要加个User-Agent就能访问的话建议勾选随机ua功能,不用填写此文本框

     

    ##第一种
    Host: www.cnblogs.com Referer: https:
    //www.cnblogs.com/ User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36
    ##第二种
    {"Host": "www.cnblogs.com","
    User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36"}

    12.cookies: 网页上的cookie对应值直接复制到文本框即可,不需要再加字典的key值

    13.请求参数:这个是方便看url地址中请求的参数,也就是地址中 ?后的参数,目前此文本框只做展示,修改对请求地址url无效

    https://xxxxx?q=js

    14.请求体From_data:目前多用于post请求方法中的请求参数,同请求头一样支持2种格式    注:大多Get请求的参数放在url地址中,POST请求放置于请求体中

    15.响应文本:请求地址返回的响应后台源数据,也就是响应文本,后期会加入搜索功能,现在还在开发中

    16.响应头:响应回的headers参数,目前只做展示,内容同谷歌开发者中网络请求响应头的内容差不多一致

    17.xpath/正则:对响应文本内容进行提取,默认xpath,输入对应的语法即可

    特别说明下:如果请求参数不对或者地址不对,请求超时之类的,提交请求后响应文本会返回对应的Python报错内容,看不懂报错内容可直接百度搜索

    使用技术:Python3.6    requests   Pyqt5  lxml  re剩下的就是功能代码

    ##以上为功能介绍和使用说,如果有好的idea可联系我,联系方式在软件中

    .如果此软件有帮助到你的话可以给作者送丢丢温暖

  • 相关阅读:
    0541-leetcode算法实现之反转字符串II-reverseStrII-python&golang实现
    helm 入门简介与安装(1)
    ubuntu18.04 netplan 设置dns,dns不生效
    服务器报错WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!
    0344-leetcode算法实现之反转字符串-reverse-string-python&golang实现
    python os模块常用方法总结
    0076-leeycode算法实现之最小覆盖子串-minimum-window-substring-python&golang实现
    0904-leetcode算法实现之水果成篮-fruit-into-baskets-python&golang实现
    0209-leetcode算法实现之长度最小子数组-minimum-size-subarray-sum-python&golang实现
    0977-leetcode算法实现之有序数组的平方sqaure-of-a-sorted-array-python&golang实现
  • 原文地址:https://www.cnblogs.com/HugJun/p/13392967.html
Copyright © 2011-2022 走看看