zoukankan      html  css  js  c++  java
  • 第二模块 3.2 字符编码的转换

    1 编码与解码

    s.encode("utf-8")  编码以utf-8 编码成2进制

    s.decode("utf-8)   以2进制解码成unicode

    >>> s_utf8 = s.encode("utf-8")
    >>> s_utf8
    b'xe4xbdxa0xe5xa5xbdxe6x9cxaaxe6x9dxa5'
    >>> s_utf8.decode("utf-8")
    '你好未来'

     2 编码的转换   

        把文字从一种编码转换成另外一种, 从gbk 转成utf-8

        为什么要进行编码的转换

        windows   gbk

               文件: gbk 文件

        linux/mac   utf-8

               文件: utf-8

        gbk ---> unicode-----> utf-8 

        unicode  : 万国码

                       跟所有的编码之间, 有映射关系

        

    f = open("byte.txt", "rb")
    s = f.read()
    f.close()
    s_unicode = s.decode("gbk")  # 转成 unicode
    s_utf8 = s_unicode.encode("utf-8")
    f = open("byte.txt",'wb')
    f.write(s_utf8)
    f.close()
  • 相关阅读:
    Create方法失效而没有提示错误信息
    JS弹出窗口控制
    本周活动
    JavaScript的初步了解
    关于PHP接收文件的资料
    mvc模式改进网站结构
    一周动态
    排序
    Java的内存泄漏
    Android笔记
  • 原文地址:https://www.cnblogs.com/kissfire008/p/11736492.html
Copyright © 2011-2022 走看看