zoukankan      html  css  js  c++  java
  • php正则过滤html标签、空格、换行符的代码,提取图片

    $descclear = str_replace("r","",$descclear);//过滤换行 $descclear = str_replace("n","",$descclear);//过滤换行 $descclear = str_replace("t","",$descclear);//过滤换行 $descclear = str_replace("rn","",$descclear);//过滤换行 $descclear=preg_replace("/s+/", " ", $descclear);//过滤多余回车 $str=preg_replace("/<[ ]+/si","<",$str); //过滤<__("<"号后面带空格) $str=preg_replace("/<!--.*?-->/si","",$str); //注释 $str=preg_replace("/<(!.*?)>/si","",$str); //过滤DOCTYPE $str=preg_replace("/<(/?html.*?)>/si","",$str); //过滤html标签 $str=preg_replace("/<(/?head.*?)>/si","",$str); //过滤head标签 $str=preg_replace("/<(/?meta.*?)>/si","",$str); //过滤meta标签 $str=preg_replace("/<(/?body.*?)>/si","",$str); //过滤body标签 $str=preg_replace("/<(/?link.*?)>/si","",$str); //过滤link标签 $str=preg_replace("/<(/?form.*?)>/si","",$str); //过滤form标签 $str=preg_replace("/cookie/si","COOKIE",$str); //过滤COOKIE标签 $str=preg_replace("/<(applet.*?)>(.*?)<(/applet.*?)>/si","",$str); //过滤applet标签 $str=preg_replace("/<(/?applet.*?)>/si","",$str); //过滤applet标签 $str=preg_replace("/<(style.*?)>(.*?)<(/style.*?)>/si","",$str); //过滤style标签 $str=preg_replace("/<(/?style.*?)>/si","",$str); //过滤style标签 $str=preg_replace("/<(title.*?)>(.*?)<(/title.*?)>/si","",$str); //过滤title标签 $str=preg_replace("/<(/?title.*?)>/si","",$str); //过滤title标签 $str=preg_replace("/<(object.*?)>(.*?)<(/object.*?)>/si","",$str); //过滤object标签 $str=preg_replace("/<(/?objec.*?)>/si","",$str); //过滤object标签 $str=preg_replace("/<(noframes.*?)>(.*?)<(/noframes.*?)>/si","",$str); //过滤noframes标签 $str=preg_replace("/<(/?noframes.*?)>/si","",$str); //过滤noframes标签 $str=preg_replace("/<(i?frame.*?)>(.*?)<(/i?frame.*?)>/si","",$str); //过滤frame标签 $str=preg_replace("/<(/?i?frame.*?)>/si","",$str); //过滤frame标签 $str=preg_replace("/<(script.*?)>(.*?)<(/script.*?)>/si","",$str); //过滤script标签 $str=preg_replace("/<(/?script.*?)>/si","",$str); //过滤script标签 $str=preg_replace("/javascript/si","Javascript",$str); //过滤script标签 $str=preg_replace("/vbscript/si","Vbscript",$str); //过滤script标签 $str=preg_replace("/on([a-z]+)s*=/si","On1=",$str); //过滤script标签 $str=preg_replace("/&#/si","&#",$str); //过滤script标签,如javAsCript:alert( -------------------------------------------------------------------- $pat = "/<(/?)(script|i?frame|style|html|body|li|i|map|title|img|link|span|u|font|table|tr|b|marquee|td|strong|div|a|meta|?|%)([^>]*?)>/isU"; $descclear = preg_replace($pat,"",$desc); -------------------------------------------------------------------- 正则提取$str中的所有图片地址: preg_match_all('/<img.*?src=['"](http.*?)['"]/i', $str, $results); $imgUrl = implode('===', $results[1]);
  • 相关阅读:
    广州数控系统数据采集进行中,广数
    heidainhen 海德汉 数据采集
    新代 SYNTEC 数据采集实战
    马扎克MAZAK免授权数据采集
    西门子数控,已授权的机器,可用OPC UA的方式来采集,数据很丰富。
    打破局限,西门子数控免授权数据采集实战
    三合一 DNC系统,(fanuc 三菱 兄弟),(上传,下发,删除)NC程序.
    批量删除多个相同格式内容的Excel表格的列
    批量将多个相同Excel表格内容合并到一个Excel表格的sheet工作簿当中。
    Excel2010表格内容被加密,无法编辑内容。
  • 原文地址:https://www.cnblogs.com/doseoer/p/4007747.html
Copyright © 2011-2022 走看看