zoukankan      html  css  js  c++  java
  • curl ——爬取网页数据

    使用CURL的PHP扩展完成一个HTTP请求的发送一般有以下几个步骤:

           1、初始化连接句柄;

           2、 配置参数;

           3、执行并获取结果;

           4、释放CURL连接句柄。

    下面是curl模拟get请求 ,抓取网页内容:

         

    $url="http://book.zongheng.com/chapter/672340/36898237.html";  

    //1.初始化curl
    $ch=curl_init($url);//第一步,我们通过函数curl_init()创建一个新的curl会话
    //2.设置传输选项(向服务器端发送请求)
    
    //curl_setopt($ch,CURLOPT_URL,$url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    
    //3.执行curl请求(接收服务器端发送的数据)
    $output=curl_exec($ch);
    
    //4.关闭curl
    curl_close($ch);
    //匹配标题            <div class="title_txtbox">第一章 惊蛰</div>
    preg_match_all("/<div class="title_txtbox">(.*?)</div>/", $output, $title);    
    //匹配p标签段落内容    <p>二月二,龙抬头。</p>
    preg_match_all("/<p>(.*?)</p>/", $output, $match);
    
    //.  是任意字符 可以匹配任何单个字符,
    //.*?  表示匹配任意字符到下一个符合条件的字符
    $a=$match[0];
    echo implode( ' ',$a);  

     
  • 相关阅读:
    软工1816 · 第四次作业
    Alpha 冲刺 (3/10)
    Alpha 冲刺 (2/10)
    Alpha 冲刺 (1/10)
    软工 第七次作业
    软工实践第八次作业
    软工实践第六次作业——团队选题报告
    软工实践第二次结对作业(作业五)
    软工第四次作业
    软工实践第三次作业
  • 原文地址:https://www.cnblogs.com/lc2817/p/11327988.html
Copyright © 2011-2022 走看看