zoukankan      html  css  js  c++  java
  • 用易语言写个简单的小爬虫其中的关键点

    一.请求头

    ctrl+L快捷键创建变量

    变量名 类型
    协议参数 类_POST数据类
    请求头数据 文本型

    协议参数.添加 (“v”, “4.52.0”)

    请求头数据 = 协议参数.获取协议头数据 ()

    二.请求参数比如post

    变量名 类型
    请求data参数 类_POST数据类
    请求data提交内容 文本型

    请求data参数.添加 (“type”, “0”)

    请求data提交内容 = 请求data参数.获取JSON文本 ()

    三.进行请求

    调用网页_访问S方法

    .子程序 网页_访问S, 文本型, , 源码由[洫蜘蛛]提供,使用WinHttp的 API方式访问网页,如果返回是“?”请查询返回协议头是否有“Content-Encoding: gzip“表示gzip压缩过网页,可用 网页_GZIP解压()命令解压,如果返回是乱码,则返回原始文本,请自行转换编码,失败返回空文本,请取出状态文本。
    .参数 网址, 文本型, , 完整的网页地址,必须包含http://或者https://
    .参数 访问方式, 整数型, 可空 , 0=GET 1=POST 2=HEAD  3=PUT  4=OPTIONS  5=DELETE  6=TRACE  7=CONNECT
    .参数 提交信息, 文本型, 可空 , POST专用
    .参数 提交Cookies, 文本型, 参考 可空 , 设置提交时的cookie
    .参数 返回Cookies, 文本型, 参考 可空 , 返回的Cookie
    .参数 附加协议头, 文本型, 可空 , 一行一个请用换行符隔开,建议填写常量值或文本值,防止因传参引发错误
    .参数 返回协议头, 文本型, 参考 可空 , 返回的协议头
    .参数 禁止重定向, 逻辑型, 可空 , 默认不禁止网页重定向
    .参数 网站登录用户名, 文本型, 可空 , 自动登录网页用户名 如路由器
    .参数 网站登录密码, 文本型, 可空 , 
    .参数 代理地址, 文本型, 可空 , 代理地址,格式为 8.8.8.8:88
    .参数 代理帐号, 文本型, 可空 , 
    .参数 代理密码, 文本型, 可空 , 
    .参数 超时时间, 整数型, 可空 , 可以被省略,单位:秒,默认30秒,如果提供大于0的数值,则修改操作超时时间。
    .参数 返回重定向, 文本型, 参考 可空 , 可以被省略,提供参数时只能提供文本型变量,用于当发生重定向时取回页面重定向的地址。
    .参数 返回状态文本, 文本型, 参考 可空 , 
    .参数 返回原始数据, 字节集, 参考 可空 , 可以被省略,返回原始网页编码
    .参数 是否自动合并更新Cookie, 逻辑型, 可空 , 默认为真,自动合并更新
    .参数 是否补全必要协议头, 逻辑型, 可空 , 当附件协议头为空时自动添加必要的UA协议头 默认为真,假将不再添加非传入协议头
    .参数 字节集提交, 字节集, 可空 , 提交字节集数据
    .参数 是否处理协议头大小写, 逻辑型, 可空 , 将协议头中的键名首字母处理为大写  默认为真
    

    四.返回内容改成utf8编码

    编码_utf8到gb2312(返回值)

    五.展示效果图(涉及一些加密打码请谅解)


  • 相关阅读:
    黑马程序员——正则表达式
    黑马程序员——集合框架知识点总结
    黑马程序员——String类知识点详细
    黑马程序员——System、Runtime、Date、Calender、Math静态类
    黑马程序员——IO流总结
    黑马程序员——多线程中的安全问题 :
    获取一段字符串中含有某一子字符串的个数的方法定义:
    debian彻底删除apache2
    linux下mysql的安装
    markdown学习
  • 原文地址:https://www.cnblogs.com/pythonywy/p/13626559.html
Copyright © 2011-2022 走看看