zoukankan      html  css  js  c++  java
  • PHP学习笔记:通过curl实现采集网站内容

      关于curl,请各位同学自行百度,我直接上案例。

      首先开启你的curl拓展,在php.ini文件把curl拓展开启,即取消extension=php_curl.dll的分号。

    eg:利用curl采集网站内容,并输出到txt文档:

      目标:抓取本博客首页,并输出到文档

    <?php
    $ch = curl_init("http://www.cnblogs.com/jianqingwang/");
    $fp = fopen("example_jianqingwang.txt", "w");
    
    curl_setopt($ch, CURLOPT_FILE, $fp);
    curl_setopt($ch, CURLOPT_HEADER, 0);
    
    curl_exec($ch);
    curl_close($ch);
    fclose($fp);
    ?>

    效果:

    eg:抓取网站内容,并直接输出

          目标:抓取http://www.cnblogs.com/jianqingwang/,并直接输出

    
    

    <?
    // 1. 初始化
    $ch = curl_init();
    // 2. 设置选项,包括URL
    curl_setopt($ch, CURLOPT_URL, "http://www.cnblogs.com/jianqingwang/");
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0);//改为0就不输出
    curl_setopt($ch, CURLOPT_HEADER, 0);
    // 3. 执行并获取HTML文档内容
    $output = curl_exec($ch);
    // 4. 释放curl句柄
    curl_close($ch);
    ?>

     

    效果:

        说明:这里界面有点不一样,是因为css和图片地址都是相对路径,所以图片、css都失效了。

     

    eg:

  • 相关阅读:
    Access导入MSSQL SERVER
    Centos8停用、启用、查看当前启用的端口
    CentOS下使用VI
    CentOS关机与重启命令
    华为云CentOS8安装FTP
    华为云CentOS8安装JDK
    华为云CentOS8安装Nginx
    华为云CentOS8安装Redis
    华为云CentOS8安装MYSQL
    oracle 本地导入imp bat的写法
  • 原文地址:https://www.cnblogs.com/jianqingwang/p/5955511.html
Copyright © 2011-2022 走看看