zoukankan      html  css  js  c++  java
  • node爬虫爬取中文时乱码问题 | nodejs gb2312、GBK中文乱码解决方法

    iconv需要依赖native库,这样一来,在一些不支持native模块安装的虚拟主机和windows平台上,我们还是无法安心处理GBK编码。

    老外写了一个通过纯Javascript转换编码的模块 iconv-lite

    可以实现window下的转换 ,通过npm可以安装此模块,bufferhelper是一个操作buffer的加强类

    首先安装

    npm install iconv-lite
    npm install bufferhelper
    var http = require('http'), 
    var url = require('url').parse('http://www.9958.pw/');
    var iconv = require('iconv-lite'); 
    var BufferHelper = require('bufferhelper');
    
    http.get(url,function(res){
      var bufferHelper = new BufferHelper();
      res.on('data', function (chunk) {
        bufferHelper.concat(chunk);
      });
      res.on('end',function(){ 
        console.log(iconv.decode(bufferHelper.toBuffer(),'GBK'));
      });
    })
  • 相关阅读:
    sss
    sss
    maven tomcat jstl 异常
    第1章 预备知识
    第2章 存储管理
    第8章 虚拟机字节码执行引擎
    第23章 Spring MVC初体验
    第1章 预备知识
    第5章 Java中的锁
    第13章 线程安全与锁优化
  • 原文地址:https://www.cnblogs.com/liujinyu/p/7199419.html
Copyright © 2011-2022 走看看