zoukankan      html  css  js  c++  java
  • js删除html标记 去掉所有html标记 百度文库内容copy

    js删除html标记 去掉所有html标记

    function delHtml(str){
        return str.replace(/<[^>]+>/g,"");  //正则去掉所有的html标记
    }
    //调用测试
    delHtml("<div>aaa</div>")
    返回结果:aaa

    加上去script与style里的内容

    function delHtml(str){
        str = str.replace("<script[^>]*>[\d\D]*?</script>","");//去script
        str = str.replace("<style[^>]*>[\d\D]*?</style>",""); //去style
        return str.replace(/<[^>]+>/g,""); //正则去掉所有的html标记 
    }

    document.getElementById("dd").innerHTML.replace(/</?.+?>/g, "")

    得到百度文库某一页所有文字,先要滚动条移动到该页:

    然后按F12,在Console下用以下代码:

    document.getElementById("pageNo-8").innerHTML.replace(/</?.+?>/g, "")

    //上面代码将得到第8页内容

  • 相关阅读:
    SDUT3926 kmp
    SDUT 3930 线段树
    HDU 3277 最大流+二分
    HDU 3081 最大流+二分
    HDU 3605 最大流+状态压缩
    HDU 3572 最大流
    HDU 4576 DP
    POJ 2289 最大流
    POJ 1698 最大流
    poj 3498 最大流
  • 原文地址:https://www.cnblogs.com/q149072205/p/12073730.html
Copyright © 2011-2022 走看看