zoukankan      html  css  js  c++  java
  • 匹配网页HTML元素的正则表达式

    $regex1="/.*?<a .*?href="(.*?)" .*? style=".*?">.*?/";//匹配<a>的链接地址

    $regex2="/.*?<img src="(.*?)" />.*?/";//匹配<img>的链接地址

    $regex3="/.*?<a.*?target="_blank">s*(.*?)s*</a>.*?/";//匹配<a>标签包住的内容

    $regex4="/.*?<span class="content">(.*?)</span>.*?/";//匹配<span>标签包住的内容

     

    preg_match("/.*?<p.*?class="pageLink">s*(.*?)s*</p>.*?/", $htmlcontent, $ptext);

    preg_match_all("/.*?<a href="(.*?)">d/", $ptext[1], $atext);

    $pageaddr = $atext[1];mm/

  • 相关阅读:
    Linux常用操作命令总结
    Centos7安装FastDFS教程
    Permutation Sequence
    Next Permutation
    Remove Element
    4Sum
    3Sum Closest
    3Sum
    Longest Consecutive Sequence
    Median of Two Sorted Arrays
  • 原文地址:https://www.cnblogs.com/bigclould/p/9454706.html
Copyright © 2011-2022 走看看