zoukankan      html  css  js  c++  java
  • php抓取网页特定div区块及图片,从简单入手

    1. 取得指定网页內的所有图片:
    <?php
    //取得指定位址的內容,並储存至text
    $text=file_get_contents('http://yourweb/');
     
    //取得第一個img标签,並储存至阵列match(regex语法与上述同义)
    preg_match('/<img[^>]*>/Ui', $text, $match);
     
    //打印match
    print_r($match);
     
     
    -----------------
    2. 取得指定网页內的第一张图片:
    <?php
    //取得指定位址的內容,並储存至text
    $text=file_get_contents('http://yourweb/');
     
    //取得第一個img标签,並储存至阵列match(regex语法与上述同义)
    preg_match('/<img[^>]*>/Ui', $text, $match);
     
    //打印match
    print_r($match);
     
     
    ------------------------------------
     
     
    3. 取得指定网页內的特定div区块(藉由id判断):
    <?php
    //取得指定位址的內容,並储存至text
    $text=file_get_contents('http://yourweb/');
     
    //去除換行及空白字元(序列化內容才需使用)
    $text=str_replace(array(" "," "," ","s"), '', $text); 
     
    //取出div标签且id為PostContent的內容,並储存至阵列match
    preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) </div>/si',$text,$match);
     
    //打印match[0]
    print($match[0]);
     
     
    -------------------------------------------
    4. 上述2及3的结合:
    <?php
    //取得指定位址的內容,並储存至text
    $text=file_get_contents('http://yourweb/'); 
     
    //取出div标签且id為PostContent的內容,並储存至阵列match
    preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) </div>/si',$text,$match); 
     
    //取得第一個img标签,並储存至阵列match2
    preg_match('/<img[^>]*>/Ui', $match[0], $match2);
     
    //打印match2[0]
    print_r($match2[0]);
     
    转载请声明来源!
     
  • 相关阅读:
    WCF之Binding
    Coding获取站点中被任何用户标记为I like it的项
    CSS兼容性
    CSS Hacker
    putty配置
    css中fontfamily的中文字体
    Linux下 zip 和 unzip的用法
    搭建WebService服务 【转】
    【基于spark IM 的二次开发笔记】第一天 各种配置
    在DirectX环境下读入3DS模型并显示
  • 原文地址:https://www.cnblogs.com/ppeenngg/p/7198371.html
Copyright © 2011-2022 走看看