zoukankan      html  css  js  c++  java
  • CP936 转换成 UTF-8

    最近写了一个抓取脚本,抓取的大部分内容正常,但少部分乱码

    检测字符编码,得出的结果是CP936

    mb_detect_encoding($str, 'GBK, gb2312, GB18030, ISO-8859-1, ASCII, UTF-8', true)

    尝试转换此编码,但得出的结果还是乱码

    mb_convert_encoding($str, 'UTF-8', 'CP936');
    氓聧掳氓潞娄盲赂聙70氓虏聛猫聙聛氓陇麓莽聦楼盲潞碌7氓虏聛氓楼鲁氓颅漏猫聙聦猫垄芦忙聧聲
    

    最后发现,这样可以转码

    iconv('utf-8', 'latin1', $str);
    
    iconv('utf-8','latin1//IGNORE', $str);
    

      

  • 相关阅读:
    软硬链接
    查看文件内容
    cp+mv
    cd+rm+pwd
    ls+tree
    绝对路径和相对路径
    Linux目录结构
    修改hostname
    java. util. concurrent. atomic
    git
  • 原文地址:https://www.cnblogs.com/dongkang/p/5957057.html
Copyright © 2011-2022 走看看