原文地址:http://www.cnblogs.com/gdsblog/archive/2017/03/25/6616561.html
不得不说,一款伟大的软件,就是用来解放人类双手的,Teleport Pro这款软件,是一款扒站软件,就是可以把别人的网站扒到你的本地,然后,细心的朋友会发现,呵!怎么多了一个莫名其妙的东西!也就是tppabs标签,怎么回事呢?请看下文介绍:
使用Teleport Pro软件的朋友应该知道他是一个离线浏览器,而他更大的作用则是可以用来下载别人的整站,软件的功能虽然好,但是却有一个很头疼的缺点,那就是下载下来 的网页它会在图片标签内插入tppabs标签以记录该图片的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。如图所示:
关键词:取出tppabs标记,去除tppabs标记,批量去除tppabs标记
如果手动清除的话,那将是一个不可想象的任务。其实可以在 DreamWeaver中使用正则表达式批量清除tppabs标签.
具体写法如下:
匹配tppabs标签:
tppabs="h[^"]*"
替换为
(空)
匹配javascript代码:
href="javascript:if(confirm('htt[^"]*"
替换为
href="../"
注意替换的时候.应该勾选 "使用正则表达式"
如图所示:
EditPlus替换方法:
1.使用ep批量删除teleport下载页面中的多于标签
在使用teleport下载页面后,链接后面基本上都会添加tppabs="..."的标记,有些站外链接,还会加上javascript:if(confirm(...))window.location=...的语句,使用下面的方法,可以迅速清除这类标签:
用ep打开所有需要修改的文件,按下ctrl+h,勾选'正则表达式',查找内容输入
tppabs="[^"]+"
(注意最前面有空格),替换内容为空,范围选择所有打开的文件,全部替换
查找内容输入
javascript:ifconfirm([)]+)window.location='([^']+)'
替换内容输入1,全部替换,ok,上面的信息都被清除
总结一下,在notepad++或者editplus中的替换规则:
[空格]tppabs="[^"]+" ==》 [空格]
/*tpa=[^*]+*/ ==》 [空格]
javascript:ifconfirm([)]+)window.location='([^']+)' ==》1