zoukankan      html  css  js  c++  java
  • CURL详解

      1 CURL详解
      2    
      3 目前为止最全的CURL中文说明了,学PHP的要好好掌握.有很多的参数.大部份都很有用.真正掌握了它和正则,一定就是个采集高手了.
      4 PHP中的CURL函数库(Client URL Library Function)
      5 curl_close — 关闭一个curl会话
      6 curl_copy_handle — 拷贝一个curl连接资源的所有内容和参数
      7 curl_errno — 返回一个包含当前会话错误信息的数字编号
      8 curl_error — 返回一个包含当前会话错误信息的字符串
      9 curl_exec — 执行一个curl会话
     10 curl_getinfo — 获取一个curl连接资源句柄的信息
     11 curl_init — 初始化一个curl会话
     12 curl_multi_add_handle — 向curl批处理会话中添加单独的curl句柄资源
     13 curl_multi_close — 关闭一个批处理句柄资源
     14 curl_multi_exec — 解析一个curl批处理句柄
     15 curl_multi_getcontent — 返回获取的输出的文本流
     16 curl_multi_info_read — 获取当前解析的curl的相关传输信息
     17 curl_multi_init — 初始化一个curl批处理句柄资源
     18 curl_multi_remove_handle — 移除curl批处理句柄资源中的某个句柄资源
     19 curl_multi_select — Get all the sockets associated with the cURL extension, which can then be "selected"
     20 curl_setopt_array — 以数组的形式为一个curl设置会话参数
     21 curl_setopt — 为一个curl设置会话参数
     22 curl_version — 获取curl相关的版本信息
     23 curl_init()函数的作用初始化一个curl会话,curl_init()函数唯一的一个参数是可选的,表示一个url地址。
     24 curl_exec()函数的作用是执行一个curl会话,唯一的参数是curl_init()函数返回的句柄。
     25 curl_close()函数的作用是关闭一个curl会话,唯一的参数是curl_init()函数返回的句柄。
     26 <!--?php
     27 $ch = curl_init("http://www.baidu.com/");
     28 curl_exec($ch);
     29 curl_close($ch);
     30 ?-->
     31 curl_version()函数的作用是获取curl相关的版本信息,curl_version()函数有一个参数,不清楚是做什么的
     32 <!--?php
     33     print_r(curl_version())
     34 ?-->
     35 curl_getinfo()函数的作用是获取一个curl连接资源句柄的信息,curl_getinfo()函数有两个参数,第一个参数是curl的资源句柄,第二个参数是下面一些常量:
     36 <!--?php
     37 $ch = curl_init("http://www.baidu.com/");
     38 print_r(curl_getinfo($ch));
     39 ?-->
     40 可选的常量包括:
     41 CURLINFO_EFFECTIVE_URL
     42 最后一个有效的url地址
     43 CURLINFO_HTTP_CODE
     44 最后一个收到的HTTP代码
     45 CURLINFO_FILETIME
     46 远程获取文档的时间,如果无法获取,则返回值为“-1”
     47 CURLINFO_TOTAL_TIME
     48 最后一次传输所消耗的时间
     49 CURLINFO_NAMELOOKUP_TIME
     50 名称解析所消耗的时间
     51 CURLINFO_CONNECT_TIME
     52 建立连接所消耗的时间
     53 CURLINFO_PRETRANSFER_TIME
     54 从建立连接到准备传输所使用的时间
     55 CURLINFO_STARTTRANSFER_TIME
     56 从建立连接到传输开始所使用的时间
     57 CURLINFO_REDIRECT_TIME
     58 在事务传输开始前重定向所使用的时间
     59 CURLINFO_SIZE_UPLOAD
     60 上传数据量的总值
     61 CURLINFO_SIZE_DOWNLOAD
     62 下载数据量的总值
     63 CURLINFO_SPEED_DOWNLOAD
     64 平均下载速度
     65 CURLINFO_SPEED_UPLOAD
     66 平均上传速度
     67 CURLINFO_HEADER_SIZE
     68 header部分的大小
     69 CURLINFO_HEADER_OUT
     70 发送请求的字符串
     71 CURLINFO_REQUEST_SIZE
     72 在HTTP请求中有问题的请求的大小
     73 CURLINFO_SSL_VERIFYRESULT
     74 Result of SSL certification verification requested by setting CURLOPT_SSL_VERIFYPEER
     75 CURLINFO_CONTENT_LENGTH_DOWNLOAD
     76 从Content-Length: field中读取的下载内容长度
     77 CURLINFO_CONTENT_LENGTH_UPLOAD
     78 上传内容大小的说明
     79 CURLINFO_CONTENT_TYPE
     80 下载内容的“Content-type”值,NULL表示服务器没有发送有效的“Content-Type: header”
     81 curl_setopt()函数的作用是为一个curl设置会话参数。curl_setopt_array()函数的作用是以数组的形式为一个curl设置会话参数。
     82 <!--?php
     83 $ch = curl_init();
     84 $fp = fopen("example_homepage.txt", "w");
     85 curl_setopt($ch, CURLOPT_FILE, $fp);
     86 $options = array(
     87  CURLOPT_URL =--> 'http://www.baidu.com/',
     88  CURLOPT_HEADER => false
     89  );
     90 curl_setopt_array($ch, $options);
     91 curl_exec($ch);
     92 curl_close($ch);
     93 fclose($fp);
     94 ?>
     95 可设置的参数有:
     96 CURLOPT_AUTOREFERER
     97 自动设置header中的referer信息
     98 CURLOPT_BINARYTRANSFER
     99 在启用CURLOPT_RETURNTRANSFER时候将获取数据返回
    100 CURLOPT_COOKIESESSION
    101 启用时curl会仅仅传递一个session cookie,忽略其他的cookie,默认状况下curl会将所有的cookie返回给服务端。session cookie是指那些用来判断服务器端的session是否有效而存在的cookie。
    102 CURLOPT_CRLF
    103 启用时将Unix的换行符转换成回车换行符。
    104 CURLOPT_DNS_USE_GLOBAL_CACHE
    105 启用时会启用一个全局的DNS缓存,此项为线程安全的,并且默认为true。
    106 CURLOPT_FAILONERROR
    107 显示HTTP状态码,默认行为是忽略编号小于等于400的HTTP信息
    108 CURLOPT_FILETIME
    109 启用时会尝试修改远程文档中的信息。结果信息会通过curl_getinfo()函数的CURLINFO_FILETIME选项返回。
    110 CURLOPT_FOLLOWLOCATION
    111 启用时会将服务器服务器返回的“Location:”放在header中递归的返回给服务器,使用CURLOPT_MAXREDIRS可以限定递归返回的数量。
    112 CURLOPT_FORBID_REUSE
    113 在完成交互以后强迫断开连接,不能重用。
    114 CURLOPT_FRESH_CONNECT
    115 强制获取一个新的连接,替代缓存中的连接。
    116 CURLOPT_FTP_USE_EPRT
    117 TRUE to use EPRT (and LPRT) when doing active FTP downloads. Use FALSE to disable EPRT and LPRT and use PORT only.
    118 Added in PHP 5.0.0.
    119 CURLOPT_FTP_USE_EPSV
    120 TRUE to first try an EPSV command for FTP transfers before reverting back to PASV. Set to FALSE to disable EPSV.
    121 CURLOPT_FTPAPPEND
    122 TRUE to append to the remote file instead of overwriting it.
    123 CURLOPT_FTPASCII
    124 An alias of CURLOPT_TRANSFERTEXT. Use that instead.
    125 CURLOPT_FTPLISTONLY
    126 TRUE to only list the names of an FTP directory.
    127 CURLOPT_HEADER
    128 启用时会将头文件的信息作为数据流输出。
    129 CURLOPT_HTTPGET
    130 启用时会设置HTTP的method为GET,因为GET是默认是,所以只在被修改的情况下使用。
    131 CURLOPT_HTTPPROXYTUNNEL
    132 启用时会通过HTTP代理来传输。
    133 CURLOPT_MUTE
    134 讲curl函数中所有修改过的参数恢复默认值。
    135 CURLOPT_NETRC
    136 在连接建立以后,访问~/.netrc文件获取用户名和密码信息连接远程站点。
    137 CURLOPT_NOBODY
    138 启用时将不对HTML中的body部分进行输出。
    139 CURLOPT_NOPROGRESS
    140 启用时关闭curl传输的进度条,此项的默认设置为true
    141 CURLOPT_NOSIGNAL
    142 启用时忽略所有的curl传递给php进行的信号。在SAPI多线程传输时此项被默认打开。
    143 CURLOPT_POST
    144 启用时会发送一个常规的POST请求,类型为:application/x-www-form-urlencoded,就像表单提交的一样。
    145 CURLOPT_PUT
    146 启用时允许HTTP发送文件,必须同时设置CURLOPT_INFILE和CURLOPT_INFILESIZE
    147 CURLOPT_RETURNTRANSFER
    148 讲curl_exec()获取的信息以文件流的形式返回,而不是直接输出。
    149 CURLOPT_SSL_VERIFYPEER
    150 FALSE to stop cURL from verifying the peer's certificate. Alternate certificates to verify against can be specified with the CURLOPT_CAINFO option or a certificate directory can be specified with the CURLOPT_CAPATH option. CURLOPT_SSL_VERIFYHOST may also need to be TRUE or FALSE if CURLOPT_SSL_VERIFYPEER is disabled (it defaults to 2). TRUE by default as of cURL 7.10. Default bundle installed as of cURL 7.10.
    151 CURLOPT_TRANSFERTEXT
    152 TRUE to use ASCII mode for FTP transfers. For LDAP, it retrieves data in plain text instead of HTML. On Windows systems, it will not set STDOUT to binary mode.
    153 CURLOPT_UNRESTRICTED_AUTH
    154 在使用CURLOPT_FOLLOWLOCATION产生的header中的多个locations中持续追加用户名和密码信息,即使域名已发生改变。
    155 CURLOPT_UPLOAD
    156 启用时允许文件传输
    157 CURLOPT_VERBOSE
    158 启用时会汇报所有的信息,存放在STDERR或指定的CURLOPT_STDERR中
    159 CURLOPT_BUFFERSIZE
    160 每次获取的数据中读入缓存的大小,这个值每次都会被填满。
    161 CURLOPT_CLOSEPOLICY
    162 不是CURLCLOSEPOLICY_LEAST_RECENTLY_USED就是CURLCLOSEPOLICY_OLDEST,还存在另外三个,但是curl暂时还不支持。.
    163 CURLOPT_CONNECTTIMEOUT
    164 在发起连接前等待的时间,如果设置为0,则不等待。
    165 CURLOPT_DNS_CACHE_TIMEOUT
    166 设置在内存中保存DNS信息的时间,默认为120秒。
    167 CURLOPT_FTPSSLAUTH
    168 The FTP authentication method (when is activated): CURLFTPAUTH_SSL (try SSL first), CURLFTPAUTH_TLS (try TLS first), or CURLFTPAUTH_DEFAULT (let cURL decide).
    169 CURLOPT_HTTP_VERSION
    170 设置curl使用的HTTP协议,CURL_HTTP_VERSION_NONE(让curl自己判断),CURL_HTTP_VERSION_1_0(HTTP/1.0),CURL_HTTP_VERSION_1_1(HTTP/1.1)
    171 CURLOPT_HTTPAUTH
    172 使用的HTTP验证方法,可选的值有:CURLAUTH_BASIC,CURLAUTH_DIGEST,CURLAUTH_GSSNEGOTIATE,CURLAUTH_NTLM,CURLAUTH_ANY,CURLAUTH_ANYSAFE,可以使用“|”操作符分隔多个值,curl让服务器选择一个支持最好的值,CURLAUTH_ANY等价于CURLAUTH_BASIC | CURLAUTH_DIGEST | CURLAUTH_GSSNEGOTIATE | CURLAUTH_NTLM,CURLAUTH_ANYSAFE等价于CURLAUTH_DIGEST | CURLAUTH_GSSNEGOTIATE | CURLAUTH_NTLM
    173 CURLOPT_INFILESIZE
    174 设定上传文件的大小
    175 CURLOPT_LOW_SPEED_LIMIT
    176 当传输速度小于CURLOPT_LOW_SPEED_LIMIT时,PHP会根据CURLOPT_LOW_SPEED_TIME来判断是否因太慢而取消传输。
    177 CURLOPT_LOW_SPEED_TIME
    178 The number of seconds the transfer should be below CURLOPT_LOW_SPEED_LIMIT for PHP to consider the transfer too slow and abort.
    179 当传输速度小于CURLOPT_LOW_SPEED_LIMIT时,PHP会根据CURLOPT_LOW_SPEED_TIME来判断是否因太慢而取消传输。
    180 CURLOPT_MAXCONNECTS
    181 允许的最大连接数量,超过是会通过CURLOPT_CLOSEPOLICY决定应该停止哪些连接
    182 CURLOPT_MAXREDIRS
    183 指定最多的HTTP重定向的数量,这个选项是和CURLOPT_FOLLOWLOCATION一起使用的。
    184 CURLOPT_PORT
    185 一个可选的用来指定连接端口的量
    186 CURLOPT_PROXYAUTH
    187 The HTTP authentication method(s) to use for the proxy connection. Use the same bitmasks as described in CURLOPT_HTTPAUTH. For proxy authentication, only CURLAUTH_BASIC and CURLAUTH_NTLM are currently supported.
    188 CURLOPT_PROXYPORT
    189 The port number of the proxy to connect to. This port number can also be set in CURLOPT_PROXY.
    190 CURLOPT_PROXYTYPE
    191 Either CURLPROXY_HTTP (default) or CURLPROXY_SOCKS5.
    192 CURLOPT_RESUME_FROM
    193 在恢复传输时传递一个字节偏移量(用来断点续传)
    194 CURLOPT_SSL_VERIFYHOST
    195 1 to check the existence of a common name in the SSL peer certificate.
    196 2 to check the existence of a common name and also verify that it matches the hostname provided.
    197 CURLOPT_SSLVERSION
    198 The SSL version (2 or 3) to use. By default PHP will try to determine this itself, although in some cases this must be set manually.
    199 CURLOPT_TIMECONDITION
    200 如果在CURLOPT_TIMEVALUE指定的某个时间以后被编辑过,则使用CURL_TIMECOND_IFMODSINCE返回页面,如果没有被修改过,并且CURLOPT_HEADER为true,则返回一个"304 Not Modified"的header,CURLOPT_HEADER为false,则使用CURL_TIMECOND_ISUNMODSINCE,默认值为CURL_TIMECOND_IFMODSINCE
    201 CURLOPT_TIMEOUT
    202 设置curl允许执行的最长秒数
    203 CURLOPT_TIMEVALUE
    204 设置一个CURLOPT_TIMECONDITION使用的时间戳,在默认状态下使用的是CURL_TIMECOND_IFMODSINCE
    205 CURLOPT_CAINFO
    206 The name of a file holding one or more certificates to verify the peer with. This only makes sense when used in combination with CURLOPT_SSL_VERIFYPEER.
    207 CURLOPT_CAPATH
    208 A directory that holds multiple CA certificates. Use this option alongside CURLOPT_SSL_VERIFYPEER.
    209 CURLOPT_COOKIE
    210 设定HTTP请求中“Set-Cookie:”部分的内容。
    211 CURLOPT_COOKIEFILE
    212 包含cookie信息的文件名称,这个cookie文件可以是Netscape格式或者HTTP风格的header信息。
    213 CURLOPT_COOKIEJAR
    214 连接关闭以后,存放cookie信息的文件名称
    215 CURLOPT_CUSTOMREQUEST
    216 A custom request method to use instead of "GET" or "HEAD" when doing a HTTP request. This is useful for doing "DELETE" or other, more obscure HTTP requests. Valid values are things like "GET", "POST", "CONNECT" and so on; i.e. Do not enter a whole HTTP request line here. For instance, entering "GET /index.html HTTP/1.0
    
    " would be incorrect.
    217 Note: Don't do this without making sure the server supports the custom request method first.
    218 CURLOPT_EGBSOCKET
    219 Like CURLOPT_RANDOM_FILE, except a filename to an Entropy Gathering Daemon socket.
    220 CURLOPT_ENCODING
    221 header中“Accept-Encoding: ”部分的内容,支持的编码格式为:"identity","deflate","gzip"。如果设置为空字符串,则表示支持所有的编码格式
    222 CURLOPT_FTPPORT
    223 The value which will be used to get the IP address to use for the FTP "POST" instruction. The "POST" instruction tells the remote server to connect to our specified IP address. The string may be a plain IP address, a hostname, a network interface name (under Unix), or just a plain '-' to use the systems default IP address.
    224 CURLOPT_INTERFACE
    225 在外部网络接口中使用的名称,可以是一个接口名,IP或者主机名。
    226 CURLOPT_KRB4LEVEL
    227 KRB4(Kerberos 4)安全级别的设置,可以是一下几个值之一:"clear","safe","confidential","private"。默认的值为"private",设置为null的时候表示禁用KRB4,现在KRB4安全仅能在FTP传输中使用。
    228 CURLOPT_POSTFIELDS
    229 在HTTP中的“POST”操作。如果要传送一个文件,需要一个@开头的文件名
    230 CURLOPT_PROXY
    231 设置通过的HTTP代理服务器
    232 CURLOPT_PROXYUSERPWD
    233 连接到代理服务器的,格式为“[username]:[password]”的用户名和密码。
    234 CURLOPT_RANDOM_FILE
    235 设定存放SSL用到的随机数种子的文件名称
    236 CURLOPT_RANGE
    237 设置HTTP传输范围,可以用“X-Y”的形式设置一个传输区间,如果有多个HTTP传输,则使用逗号分隔多个值,形如:"X-Y,N-M"。
    238 CURLOPT_REFERER
    239 设置header中"Referer: " 部分的值。
    240 CURLOPT_SSL_CIPHER_LIST
    241 A list of ciphers to use for SSL. For example, RC4-SHA and TLSv1 are valid cipher lists.
    242 CURLOPT_SSLCERT
    243 传递一个包含PEM格式证书的字符串。
    244 CURLOPT_SSLCERTPASSWD
    245 传递一个包含使用CURLOPT_SSLCERT证书必需的密码。
    246 CURLOPT_SSLCERTTYPE
    247 The format of the certificate. Supported formats are "PEM" (default), "DER", and "ENG".
    248 CURLOPT_SSLENGINE
    249 The identifier for the crypto engine of the private SSL key specified in CURLOPT_SSLKEY.
    250 CURLOPT_SSLENGINE_DEFAULT
    251 The identifier for the crypto engine used for asymmetric crypto operations.
    252 CURLOPT_SSLKEY
    253 The name of a file containing a private SSL key.
    254 CURLOPT_SSLKEYPASSWD
    255 The secret password needed to use the private SSL key specified in CURLOPT_SSLKEY.
    256 Note: Since this option contains a sensitive password, remember to keep the PHP script it is contained within safe.
    257 CURLOPT_SSLKEYTYPE
    258 The key type of the private SSL key specified in CURLOPT_SSLKEY. Supported key types are "PEM" (default), "DER", and "ENG".
    259 CURLOPT_URL
    260 需要获取的URL地址,也可以在PHP的curl_init()函数中设置。
    261 CURLOPT_USERAGENT
    262 在HTTP请求中包含一个”user-agent”头的字符串。
    263 CURLOPT_USERPWD
    264 传递一个连接中需要的用户名和密码,格式为:“[username]:[password]”。
    265 CURLOPT_HTTP200ALIASES
    266 设置不再以error的形式来处理HTTP 200的响应,格式为一个数组。
    267 CURLOPT_HTTPHEADER
    268 设置一个header中传输内容的数组。
    269 CURLOPT_POSTQUOTE
    270 An array of FTP commands to execute on the server after the FTP request has been performed.
    271 CURLOPT_QUOTE
    272 An array of FTP commands to execute on the server prior to the FTP request.
    273 CURLOPT_FILE
    274 设置输出文件的位置,值是一个资源类型,默认为STDOUT (浏览器)。
    275 CURLOPT_INFILE
    276 在上传文件的时候需要读取的文件地址,值是一个资源类型。
    277 CURLOPT_STDERR
    278 设置一个错误输出地址,值是一个资源类型,取代默认的STDERR。
    279 CURLOPT_WRITEHEADER
    280 设置header部分内容的写入的文件地址,值是一个资源类型。
    281 CURLOPT_HEADERFUNCTION
    282 设置一个回调函数,这个函数有两个参数,第一个是curl的资源句柄,第二个是输出的header数据。header数据的输出必须依赖这个函数,返回已写入的数据大小。
    283 CURLOPT_PASSWDFUNCTION
    284 设置一个回调函数,有三个参数,第一个是curl的资源句柄,第二个是一个密码提示符,第三个参数是密码长度允许的最大值。返回密码的值。
    285 CURLOPT_READFUNCTION
    286 设置一个回调函数,有两个参数,第一个是curl的资源句柄,第二个是读取到的数据。数据读取必须依赖这个函数。返回读取数据的大小,比如0或者EOF。
    287 CURLOPT_WRITEFUNCTION
    288 设置一个回调函数,有两个参数,第一个是curl的资源句柄,第二个是写入的数据。数据写入必须依赖这个函数。返回精确的已写入数据的大小
    289 curl_copy_handle()函数的作用是拷贝一个curl连接资源的所有内容和参数
    290 <!--?php
    291 $ch = curl_init("http://www.baidu.com/");
    292 $another = curl_copy_handle($ch);
    293 curl_exec($another);
    294 curl_close($another);
    295 ?-->
    296 curl_error()函数的作用是返回一个包含当前会话错误信息的字符串。
    297 curl_errno()函数的作用是返回一个包含当前会话错误信息的数字编号。
    298 curl_multi_init()函数的作用是初始化一个curl批处理句柄资源。
    299 curl_multi_add_handle()函数的作用是向curl批处理会话中添加单独的curl句柄资源。curl_multi_add_handle()函数有两个参数,第一个参数表示一个curl批处理句柄资源,第二个参数表示一个单独的curl句柄资源。
    300 curl_multi_exec()函数的作用是解析一个curl批处理句柄,curl_multi_exec()函数有两个参数,第一个参数表示一个批处理句柄资源,第二个参数是一个引用值的参数,表示剩余需要处理的单个的curl句柄资源数量。
    301 curl_multi_remove_handle()函数表示移除curl批处理句柄资源中的某个句柄资源,curl_multi_remove_handle()函数有两个参数,第一个参数表示一个curl批处理句柄资源,第二个参数表示一个单独的curl句柄资源。
    302 curl_multi_close()函数的作用是关闭一个批处理句柄资源。
    303 <!--?php
    304 $ch1 = curl_init();
    305 $ch2 = curl_init();
    306 curl_setopt($ch1, CURLOPT_URL, "http://www.baidu.com/");
    307 curl_setopt($ch1, CURLOPT_HEADER, 0);
    308 curl_setopt($ch2, CURLOPT_URL, "http://www.google.com/");
    309 curl_setopt($ch2, CURLOPT_HEADER, 0);
    310 $mh = curl_multi_init();
    311 curl_multi_add_handle($mh,$ch1);
    312 curl_multi_add_handle($mh,$ch2);
    313 do {
    314  curl_multi_exec($mh,$flag);
    315 } while ($flag --> 0);
    316 curl_multi_remove_handle($mh,$ch1);
    317 curl_multi_remove_handle($mh,$ch2);
    318 curl_multi_close($mh);
    319 ?>
    320 curl_multi_getcontent()函数的作用是在设置了CURLOPT_RETURNTRANSFER的情况下,返回获取的输出的文本流。
    321 curl_multi_info_read()函数的作用是获取当前解析的curl的相关传输信息。
    322 curl_multi_select()
    323 Get all the sockets associated with the cURL extension, which can then be "selected"
     
    

      

  • 相关阅读:
    第二章 信息的表示和处理(下)
    第二章 信息的表示和处理
    IDEA中新建子模块
    手动实现一个可重入锁
    Lock接口的认识和使用
    JDK提供的原子类原理与使用
    深入理解volatile原理与使用
    模拟死锁
    模拟自旋锁
    grep 如何自动标注颜色
  • 原文地址:https://www.cnblogs.com/xishaonian/p/6550613.html
Copyright © 2011-2022 走看看