1、匹配文本中的汉字
p{InCJK Unified Ideographs}
2 、常见a连接匹配
<as[^>]*?hrefs*=[^\]s*['""]?([^'""s>]*)[^>]*>[sS]*?(.*?)[</a>].+? window.location.href=['"](.*?)['"];*
3 、常见图片连接匹配
<img[sS]*?src=['"](.*?)['"][sS]*?/{0,}> url((.+?)) 注释常见匹配 (?<![:,-cl])//.*|/*[sS]*?*/|(?s)<!--.*?-->
4 、匹配javacript
<s*scripts.*type="text/javascript"s*src="(.*?)"s*[>].*[</script>].*