zoukankan      html  css  js  c++  java
  • 网页内容的html标签补全和过滤的两种方法

    网页内容的html标签补全和过滤的两种方法:

    假设你的网页内容的html标签显示不全,有些表格标签不完整而导致页面混乱,或者把你的内容之外的局部html页面给包括进去了,我们能够写个函数方法来补全html标签以及过滤掉没用的html标签. 

    php使HTML标签自己主动补全,闭合,过滤函数方法一: 

    代码:

    function closetags($html) {
      preg_match_all('#<(?!meta|img|br|hr|input)([a-z]+)(?: .*)?

    (?

    <![/|/ ])>#iU', $html, $result); $openedtags = $result[1]; preg_match_all('#</([a-z]+)>#iU', $html, $result); $closedtags = $result[1]; $len_opened = count($openedtags); if (count($closedtags) == $len_opened) { return $html; } $openedtags = array_reverse($openedtags); for ($i=0; $i < $len_opened; $i++) { if (!in_array($openedtags[$i], $closedtags)) { $html .= '</'.$openedtags[$i].'>'; }else { unset($closedtags[array_search($openedtags[$i], $closedtags)]); } } return $html; }

    closetags()解析: 
    array_reverse() : 此函数将原数组中的元素顺序翻转。创建新的数组并返回。假设第二个參数指定为 true。则元素的键名保持不变,否则键名将丢失。 
    array_search() : array_search(value,array,strict),此函数与in_array()一样在数组中查找一个键值。假设找到了该值,匹配元素的键名会被返回。假设没找到,则返回 false。 假设第三个參数strict被指定为 true,则仅仅有在数据类型和值都一致时才返回对应元素的键名。

    php使HTML标签自己主动补全,闭合,过滤函数方法二: 

    function checkhtml($html) {
    	$html = stripslashes($html);
    		preg_match_all("/<([^<]+)>/is", $html, $ms);
    		$searchs[] = '<';
    		$replaces[] = '<';
    		$searchs[] = '>';
    		$replaces[] = '>';
    		
    		if($ms[1]) {
    			$allowtags = 'img|font|div|table|tbody|tr|td|th|br|p|b|strong|i|u|em|span|ol|ul|li';//同意的标签
    			$ms[1] = array_unique($ms[1]);
    			foreach ($ms[1] as $value) {
    				$searchs[] = "<".$value.">";
    				$value = shtmlspecialchars($value);
    				$value = str_replace(array('\','/*'), array('.','/.'), $value);
    				$value = preg_replace(array("/(javascript|script|eval|behaviour|expression)/i", "/(s+|"|')on/i"), array('.', ' .'), $value);
    				if(!preg_match("/^[/|s]?($allowtags)(s+|$)/is", $value)) {
    					$value = '';
    				}
    				$replaces[] = empty($value)?'':"<".str_replace('"', '"', $value).">";
    			}
    		}
    		$html = str_replace($searchs, $replaces, $html);
    	
    	return $html;
    }
    //取消HTML代码
    function shtmlspecialchars($string) {
    	if(is_array($string)) {
    		foreach($string as $key => $val) {
    			$string[$key] = shtmlspecialchars($val);
    		}
    	} else {
    		$string = preg_replace('/&((#(d{3,5}|x[a-fA-F0-9]{4})|[a-zA-Z][a-z0-9]{2,5});)/', '&\1',
    			str_replace(array('&', '"', '<', '>'), array('&', '"', '<', '>'), $string));
    	}
    	return $string;
    }
    checkhtml($html)解析:

    stripslashes():函数删除由addslashes()函数加入的反斜杠。

    该函数用于清理从数据库或HTML表单中取回的数据。


    谢谢关注websites博客!

  • 相关阅读:
    vue单页面
    禁止系统默认右键并执行自己的程序
    jquery-ui拖动
    jquery鼠标右键功能 备忘
    日历插件 备忘
    兼容于苹果手机的点击方法
    js判断设备访问入口
    微信小程序点击显示某个view
    微信小程序数量减
    点外层div关闭,点里层不关闭
  • 原文地址:https://www.cnblogs.com/lcchuguo/p/5155711.html
Copyright © 2011-2022 走看看