zoukankan      html  css  js  c++  java
  • unicode、encode、decode

    1.encode与decode:
    unicode经过encode -> utf-8,反过来为decode。

    爬虫读取网页内容和pandas读取csv时,会把读取到的文字内容转成unicode,当我们需要把这些文字内容写入到新的文件时,需要设置该文件的编码(该编码应该与网页或原来的编码相同,以便带来编码的问题),即做一个encode的过程。

    2.读取时文件的编码要与写入文件时编码相同。
    即读取csv文件时,文件的编码为utf-8,读取到的内容写入到新的csv时,应该把新csv的编码也设置为utf-8,而不能设为gbk.

  • 相关阅读:
    01分数规划基本类型
    hdu3976
    hdu1430 康托展开+bfs预处理
    模板
    模板
    redis初始
    mybatis12
    mybatis13
    mybatis10
    springmvc10
  • 原文地址:https://www.cnblogs.com/aaronhoo/p/9301489.html
Copyright © 2011-2022 走看看