zoukankan      html  css  js  c++  java
  • XMLHttpRequest读取中文网页时返回乱码的解决办法

    今天在改程序的时候遇到了 ajax 返回值的过程中乱码的问题

    虽然总结了 不少东西,但是在自己的硬盘里找来找去 实在不方便,看了下面文章 解决了 这个问题

    所以 放在这里 以备后用~

    MLHttpRequest 默认是用UTF-8 传递数据。当服务端的返回数据是UTF-8编码的时候,它工作得很好(开发web应用,当服务端和客户 端以及数据库统一使用UTF-8编码可以有效的避免乱码问题)。如果服务端设置了正确的Content-Type Response Header以及编 码信息,那么XmlHttpRequest也可以正确工作。 
    可是当使用XMLHttpRequest读取中文网页内容时, 如果服务端的程序没有设置Content- Type Response Header,或者Header没有设置编码类型,那么我们访问responseText属性的时候就可能遭遇乱码。如以下 代码用XMLHttpRequest获取雅虎中国网站的星座站首页:  

    xmlhttp = getXMLHttpRequest(); 
    var url = "http://cn.astrology.yahoo.com/";; 
    xmlhttp.open("GET", url, true); 
    xmlhttp.onreadystatechange = function(){ 
    if (xmlhttp.readyState == 4) 
        if (xmlhttp.status == 200) 
            alert(xmlhttp.responseText); 
    }; 
    xmlhttp.send(null); 
    纵使yahoo中国这样专业的网站,对web标准的支持还很不彻底,弹出的html源码中充斥不符合web标准的html标签,当然还有已预见的乱码。 

    同样遗憾的是,FireFox 和 IE 的解决方法也是南辕北辙 

    FireFox 


    FireFox 的XMLHttpRequest对象支持overrideMimeType方法,可以指定返回数据的编码类型,利用该方法可以解决中文乱码,前面的代码修改如下:  

    xmlhttp = getXMLHttpRequest(); 
    var url = "http://cn.astrology.yahoo.com/";; 
    xmlhttp.open("GET", url, true); 
    xmlhttp.overrideMimeType("text/html;charset=gb2312");//设定以gb2312编码识别数据 
    xmlhttp.onreadystatechange = function(){ 
    if (xmlhttp.readyState == 4) 
        if (xmlhttp.status == 200) 
            alert(xmlhttp.responseText); 
    }; 
    xmlhttp.send(null); 
    Internet Explorer 


    IE不支持overrideMimeType方法,并且只能用一种很蹩脚的方法来解决,此时需要引入一个杂交的函数:  

    function gb2utf8(data){ 
        var glbEncode = []; 
        gb2utf8_data = data; 
        execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript"); 
        var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2"); 
        t=t.split("@"); 
        var i=0,j=t.length,k; 
        while(++i<j) { 
            k=t[i].substring(0,4); 
            if(!glbEncode[k]) { 
                gb2utf8_char = eval("0x"+k); 
                execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript"); 
                glbEncode[k]=escape(gb2utf8_char).substring(1,6); 
            } 
            t[i]=glbEncode[k]+t[i].substring(4); 
        } 
        gb2utf8_data = gb2utf8_char = null; 
        return unescape(t.join("%")); 
    }xmlhttp = getXMLHttpRequest(); 
    var url = "http://cn.astrology.yahoo.com/";; 
    xmlhttp.open("GET", url, true); 
    xmlhttp.onreadystatechange = function(){ 
    if (xmlhttp.readyState == 4) 
        if (xmlhttp.status == 200) 
            alert(gb2utf8(xmlhttp.responseBody)); //注意这里要用responseBody 
    }; 
    xmlhttp.send(null); 
    gb2utf8函数直接解析XMLHttpRequest返回的二进制数据,其中要利用execScript方法来执行VBScript的函数。所以说是一个杂交的函数。感谢blueidea论坛 提供的算法。 

    虽然有了解决的办法,但形式丑陋,而且不符合web标准。所以应该在编程中尽量避免,如果是开发web应用,应尽量使用UTF-8编码,或者在服务端设置正确的编码信息。至于以上范例,有盗取其他网站内容的嫌疑,更是不为提倡。  
     

  • 相关阅读:
    C# 中的本地函数
    C# 9.0 正式发布了(C# 9.0 on the record)
    如何禁用控制台窗口的关闭按钮?
    在 WSL Ubuntu 上使用 .NET 进行跨平台开发新手入门
    C# 中 ConcurrentDictionary 一定线程安全吗?
    Docker 与 Podman 容器管理的比较
    C# 中的数字分隔符 _
    C# 8: 可变结构体中的只读实例成员
    C# 中的只读结构体(readonly struct)
    C# 8: 默认接口方法
  • 原文地址:https://www.cnblogs.com/kaixinmenghuan/p/2057295.html
Copyright © 2011-2022 走看看