实例:抓取页面
使用curl抓取页面相对来说比较简单,但是这里有一点需要注意的是,curl默认会将抓取的页面直接输出到浏览器。然而,我们经常遇到的情况是获取抓取的内容,对内容做一定的处理之后再进行操作。因此,这里写出两种不同的情况。
直接输出到浏览器
<?php $url="www.baidu.com"; $ch=curl_init(); curl_setopt($ch,CURLOPT_URL,$url); curl_exec($ch); curl_close($ch); ?>
运行上面这段代码,我们会直接看到百度首页。
不直接输出到浏览器
如果我们不想让curl抓取的内容直接输出到浏览器,那么就需要设置curl的“CURLOPT_RETURNTRANSFER”为true,这样curl抓取的内容会作为curl_exec()函数的返回值出现。
<?php $url="www.baidu.com"; $content=''; $ch=curl_init(); curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch, CURLOPT_RETURNTRANSFER,TRUE); /* *根据手册来看,好像PHP5.1.3以前的版本还需要配合CURLOPT_BINARYTRANSFER一起使用, *但是5.1.3以后的版本中,该配置项已经被废弃了。 */ //curl_setopt($ch, CURLOPT_BINARYTRANSFER,TRUE); $content=curl_exec($ch); var_dump($content); curl_close($ch); ?>