zoukankan      html  css  js  c++  java
  • preg_match_all结合str_replace替换内容中所有img

    最近做站的时候,采集了大量的数据,但采回来的数据基本上都要经过过滤原站保留的数据,其中IMG就是一个地方。网站上好多这些应用例子似乎没有必要“秀”出来,但站已几天没写日志,那就来一个吧

    采集回来的图片img标签中,有好多javascript脚本和无用的信息,必需过替换自己想要的,比如alt。先看看要过滤的内容,我随便复制出来:

    sdfsdfsdf<img alt=”3568df.com靓图” src=”http://www.aaa.com/upimg /080330/120D1232295023X0.gif” mce_src=”http://www.eee.com/upimg/080330 /120D1232295023X0.gif” width=1 onclick=”javascript:; ” onload=”javascript:if(this.width>500){this.resized=true; this.style.width=500;}”>sfsdfsdfasdfsadf<img alt=”3568df.com靓图 ” src=”http://www.3568.com/upimg/080330 /120D1232295023X0.gif” mce_src=”http://www.ddd.com/upimg/080330 /120D1232295023X0.gif” width=1 onclick=”javascript:; ” onload=”javascript:if(this.width>500){this.resized=true; this.style.width=500;}”>sdfsadf<img alt=”3568df.com靓图 ” src=”http://www.xxx.com/upimg/080330/120D1232295023X0.gif” mce_src=”http://www.sss.com/upimg/080330/120D1232295023X0.gif” width=1 onclick=”javascript:;” onload=”javascript:if(this.width>500){this.resized=true;this.style.width=500;}”>sdfsdf


    要把上面替换成形如:
    <img alt=”我的信息” src=”http://www.xxx.com/upimg /080330/120D1232295023X0.gif” mce_src=”http://www.xxx.com/upimg/080330 /120D1232295023X0.gif” /> 其中src=”http://www.xxx.com/upimg/080330 /120D1232295023X0.gif” mce_src=”http://www.xxx.com/upimg/080330 /120D1232295023X0.gif”这个地址要保留,因为图片用的都是源地址


    方法大致是:先读取内容里的所以IMG标签,然后把每个IMG标签的SRC抽取出来,并且组合成自己的内容,最后进行替换。

    preg_match_all就是我想要的函数,它能够把正则表达式匹配到的内容建立一个三维数组,你可以对它们进行遍历查找替换,不太了解的请查查手册,这里不作具体介绍。函数代码:

    function replace($str)
    {
    preg_match_all(”/<img(.*)(src=/”[^/"]+/”)[^>]+>/isU”, $str, $arr);
    for($i=0,$j=count($arr[0]);$i<$j;$i++){
    $str = str_replace($arr[0][$i],”<img alt=/”我的信息” “.$arr[2][$i].” />”,$str);
    }
    return $str;
    }

  • 相关阅读:
    Python面试进阶问题,__init__和__new__的区别是什么?
    LeetCode 76,一题教会你面试算法时的思考套路
    LeetCode 75,90%的人想不出最佳解的简单题
    手把手带你入门numpy,从此数据处理不再慌【四】
    一次找出范围内的所有素数,埃式筛法是什么神仙算法?
    机器学习——十大数据挖掘之一的决策树CART算法
    TypeScript环境搭建
    ASP.NET 开源导入导出库Magicodes.IE 完成Excel图片导入导出
    【翻译】.NET 5 Preview 1 发布
    SuperBenchmarker一个用.NET编写的压测工具
  • 原文地址:https://www.cnblogs.com/zerogo/p/2209211.html
Copyright © 2011-2022 走看看