zoukankan      html  css  js  c++  java
  • curl使用介绍

    linux curl是通过url语法在命令行下上传或下载文件的工具软件,它支持http,https,ftp,ftps,telnet等多种协议,常被用来抓取网页和监控Web服务器状态。

    一、Linux curl用法举例:

    1. linux curl抓取网页:

    抓取百度:
    curl http://www.baidu.com

    如发现乱码,可以使用iconv转码
    curl http://iframe.ip138.com/ic.asp|iconv -fgb2312

    iconv的用法请参阅:在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题

    2. Linux curl使用代理:

    linux curl使用http代理抓取页面:
    curl -x 111.95.243.36:80 http://iframe.ip138.com/ic.asp|iconv -fgb2312
    curl -x 111.95.243.36:80 -U aiezu:password http://www.baidu.com

    使用socks代理抓取页面:
    curl --socks4 202.113.65.229:443 http://iframe.ip138.com/ic.asp|iconv -fgb2312
    curl --socks5 202.113.65.229:443 http://iframe.ip138.com/ic.asp|iconv -fgb2312

    代理服务器地址可以从爬虫代理上获取。

    3. linux curl处理cookies

    接收cookies:
    curl -c /tmp/cookies http://www.baidu.com #cookies保存到/tmp/cookies文件

    发送cookies:
    curl -b "key1=val1;key2=val2;" http://www.baidu.com #发送cookies文本
    curl -b /tmp/cookies http://www.baidu.com #从文件中读取cookies

    4. linux curl发送数据:

    linux curl get方式提交数据:
    curl -G -d "name=value&name2=value2" http://www.baidu.com

    linux curl post方式提交数据:
    curl -d "name=value&name2=value2" http://www.baidu.com #post数据
    curl -d a=b&c=d&txt@/tmp/txt http://www.baidu.com #post文件

    以表单的方式上传文件:
    curl -F file=@/tmp/me.txt http://www.aiezu.com

    相当于设置form表单的method="POST"和enctype='multipart/form-data'两个属性。

    5. linux curl http header处理:

    设置http请求头信息:
    curl -A "Mozilla/5.0 Firefox/21.0" http://www.baidu.com #设置http请求头User-Agent
    curl -e "http://pachong.org/" http://www.baidu.com #设置http请求头Referer
    curl -H "Connection:keep-alive User-Agent: Mozilla/5.0" http://www.aiezu.com

    设置http响应头处理:
    curl -I http://www.aiezu.com #仅仅返回header
    curl -D /tmp/header http://www.aiezu.com #将http header保存到/tmp/header文件

    6. linux curl认证:
    curl -u aiezu:password http://www.aiezu.com #用户名密码认证
    curl -E mycert.pem https://www.baidu.com #采用证书认证

    6. 其他:

    curl -# http://www.baidu.com #以“#”号输出进度条
    curl -o /tmp/aiezu http://www.baidu.com #保存http响应到/tmp/aiezu

    linux 使用curl小经验教训:
    http请求地址的url要使用""括起来。当有存在多个参数使用&连接时可能会出错。

  • 相关阅读:
    JS数组存储(两个数组相等,一个改变,另一个跟着改变)
    图片404加载失败后如何处理
    为什么重写equals方法,还必须要重写hashcode方法
    Java中HashMap和TreeMap的区别深入理解
    java中String数组和List的互相转化
    log4j重复打印的解决方法
    mysql 允许在唯一索引的字段中出现多个null值
    elasticsearch 常见查询及聚合的JAVA API
    A记录(主机名解析)、CNAME(别名解析)和URL转发(域名转发)
    域名解析中的cname解析和显性URL跳转和隐性URL跳转三者有什么区别
  • 原文地址:https://www.cnblogs.com/xiewenming/p/8515827.html
Copyright © 2011-2022 走看看