zoukankan      html  css  js  c++  java
  • Python中的字符编码

    Python中的字符编码

    Python解释器执行py文件的原理

    Python解释器启动后,相当于启动了一个文本编辑器,读取文件中的内容到内存中。但与文本编辑器不同的是,Python解释器的目的不是为了显示文件内容,而是一条一条执行文件中的内容

    什么是字符编码

    计算机只认识数字0和1。人类使用的字符信息在计算机中就是以数字0和1进行存储的。所以,人类文字和计算机文字之间需要通过某以规则进行转换,这就是字符编码的作用。

    字符编码就相当于一本密码本一样。没有密码本,人类是无法把计算机的数字0和1转换成其可以读懂的文字。

    各个国家的文字不一样,所以会有不一样的“密码本”。如果用错“密码本”来解码,那么,就会出现“乱码”现象

    unicode和utf-8

    unicode——兼容万国的编码,即“超级密码本”

    UTF-8(Unicode Transformation Format-8)

    简单的说,unicode是一个精通世界各国语言的大师。大师在记录时,用自己的一套专用密码本utf-8,简单、高效。

    utf-8这本密码本兼容世界万国语言,但却各个国家自己的密码本不兼容。和各个国家密码本兼容的是unicode。

    注意:内存中使用的是unicode,历史遗留问题……

    关键

    用什么编码存(encode)就用什么编码解(decode),推荐使用utf-8

  • 相关阅读:
    手机号码正则表达式
    POJ 3233 Matrix Power Series 矩阵快速幂
    UVA 11468
    UVA 1449
    HDU 2896 病毒侵袭 AC自动机
    HDU 3065 病毒侵袭持续中 AC自动机
    HDU 2222 Keywords Search AC自动机
    POJ 3461 Oulipo KMP模板题
    POJ 1226 Substrings KMP
    UVA 1455 Kingdom 线段树+并查集
  • 原文地址:https://www.cnblogs.com/heroknot/p/10932745.html
Copyright © 2011-2022 走看看