在使用整站下载软件Teleport Pro或Teleport Ultra下载的离线文件里会包含大量垃圾代码,下载后就需要清除整站下载文件中的冗余代码:tppabs等。
这些代码本是Teleport自动添加用来说明文件原始地址的,但是这样的垃圾代码会带来负面影响,比如说在CSS文件就会照成背景图片无法加载。手动清除这些代码的话会比较麻烦,下面提供一种比较省力的正则表达式批量清除的方法。
首先使用一个带正则表达式替换的软件,比如说DreamWeaver。具体方法如下(替换的时候应该勾选 “使用正则表达式”)
匹配tppabs标签: \btppabs="h[^"]*" 替换为 (空)
匹配javascript代码:href=" *javascript:if\(confirm\('htt[^"]*" 替换为href="#www.yoursite.com"
css文件中,还有一些图片链接
匹配图片代码:tpa=http://[^\s]*.gif替换为 (空)
css代码
\/\*tpa=h[^"]*\/\)
)
然后剩下的就是/**/ 了,可以不需要正则替换了
还有Falsh代码等等.具体的需要再看。