zoukankan      html  css  js  c++  java
  • php抓取网页特定div区块及图片,从简单入手

    1. 取得指定网页內的所有图片:
    <?php
    //取得指定位址的內容,並储存至text
    $text=file_get_contents('http://yourweb/');
     
    //取得第一個img标签,並储存至阵列match(regex语法与上述同义)
    preg_match('/<img[^>]*>/Ui', $text, $match);
     
    //打印match
    print_r($match);
     
     
    -----------------
    2. 取得指定网页內的第一张图片:
    <?php
    //取得指定位址的內容,並储存至text
    $text=file_get_contents('http://yourweb/');
     
    //取得第一個img标签,並储存至阵列match(regex语法与上述同义)
    preg_match('/<img[^>]*>/Ui', $text, $match);
     
    //打印match
    print_r($match);
     
     
    ------------------------------------
     
     
    3. 取得指定网页內的特定div区块(藉由id判断):
    <?php
    //取得指定位址的內容,並储存至text
    $text=file_get_contents('http://yourweb/');
     
    //去除換行及空白字元(序列化內容才需使用)
    $text=str_replace(array(" "," "," ","s"), '', $text); 
     
    //取出div标签且id為PostContent的內容,並储存至阵列match
    preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) </div>/si',$text,$match);
     
    //打印match[0]
    print($match[0]);
     
     
    -------------------------------------------
    4. 上述2及3的结合:
    <?php
    //取得指定位址的內容,並储存至text
    $text=file_get_contents('http://yourweb/'); 
     
    //取出div标签且id為PostContent的內容,並储存至阵列match
    preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) </div>/si',$text,$match); 
     
    //取得第一個img标签,並储存至阵列match2
    preg_match('/<img[^>]*>/Ui', $match[0], $match2);
     
    //打印match2[0]
    print_r($match2[0]);
     
    转载请声明来源!
     
  • 相关阅读:
    由当前acitivty直接退到桌面
    Android中SharedPreference多进程数据共享出错
    java回调机制
    Android 监听apk安装替换卸载广播
    jquery中如何退出each循环
    旋转六面体源码
    用CSS3制作的旋转六面体动画
    CSS中常用的字体单位:px、em、rem和%的区别
    css属性简写集合
    小游戏--别踩白块
  • 原文地址:https://www.cnblogs.com/ppeenngg/p/7198371.html
Copyright © 2011-2022 走看看