zoukankan      html  css  js  c++  java
  • [转]tppabs是什么?如何去除tppabs?

    原文地址:http://www.cnblogs.com/gdsblog/archive/2017/03/25/6616561.html

    不得不说,一款伟大的软件,就是用来解放人类双手的,Teleport Pro这款软件,是一款扒站软件,就是可以把别人的网站扒到你的本地,然后,细心的朋友会发现,呵!怎么多了一个莫名其妙的东西!也就是tppabs标签,怎么回事呢?请看下文介绍:

     

    使用Teleport Pro软件的朋友应该知道他是一个离线浏览器,而他更大的作用则是可以用来下载别人的整站,软件的功能虽然好,但是却有一个很头疼的缺点,那就是下载下来 的网页它会在图片标签内插入tppabs标签以记录该图片的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。如图所示:


     


    关键词:取出tppabs标记,去除tppabs标记,批量去除tppabs标记

     

    如果手动清除的话,那将是一个不可想象的任务。其实可以在 DreamWeaver中使用正则表达式批量清除tppabs标签.

      具体写法如下:

      匹配tppabs标签:

      tppabs="h[^"]*"

      替换为
      (空)

      匹配javascript代码:
      href="javascript:if(confirm('htt[^"]*"
      替换为
      href="../"
      注意替换的时候.应该勾选 "使用正则表达式"

           如图所示:

    EditPlus替换方法:


      1.使用ep批量删除teleport下载页面中的多于标签


      在使用teleport下载页面后,链接后面基本上都会添加tppabs="..."的标记,有些站外链接,还会加上javascript:if(confirm(...))window.location=...的语句,使用下面的方法,可以迅速清除这类标签:


      用ep打开所有需要修改的文件,按下ctrl+h,勾选'正则表达式',查找内容输入


       tppabs="[^"]+"


      (注意最前面有空格),替换内容为空,范围选择所有打开的文件,全部替换


      查找内容输入


      javascript:ifconfirm([)]+)window.location='([^']+)'


      替换内容输入1,全部替换,ok,上面的信息都被清除

    总结一下,在notepad++或者editplus中的替换规则:

     [空格]tppabs="[^"]+" ==》  [空格]

    /*tpa=[^*]+*/  ==》  [空格]

    javascript:ifconfirm([)]+)window.location='([^']+)' ==》1

  • 相关阅读:
    [ solr入门 ] 在schema.xml中加入自己的分词工具
    SQLServer2005获取大数据集时内存不足的解决办法[转]
    java位操作基本教程[转]
    log4j的最佳实践(转)
    [ lucene扩展 ] "Did you mean" feature with Apache Lucene SpellChecker
    java image filters[02]过滤器初探
    PHP serialize 和 JSON 解析与区别
    js 实现 静态缓存页面中访问动态IP下载地址
    smarty section foreach遍历多维数组
    【转】window.open 参数
  • 原文地址:https://www.cnblogs.com/dirgo/p/7379720.html
Copyright © 2011-2022 走看看