zoukankan      html  css  js  c++  java
  • python编码

    1.  ASCII编码:(AmericanStandard Code for Information Interchange,ASCII)

    美国信息交换标准代码,是一种用于信息交换的美国标准代码,它的作用是给英文字母、数字、标点、字符转换成计算机能识别的二进制数

    ord('a') chr(97) 相互转换

    Ascii表:

    数字范围为:48—57

    大写字母范围为:65—90

    小写字母范围为:97—122

    2.GB2312编码:适用于汉字处理、汉字通信等系统之间的信息交换。

    3.GBK编码:是汉字编码标准之一,是在GB2312-80 标准基础上的内码扩展规范,使用了双字节编码。

    4.ANSI编码:是与你使用的windows操作系统的语言有关系的,像windows 7 简体中文版就是GBK(用一个字节表示英文,用两个字节表示一个中文)。

    5.Unicode编码:

    这是一种世界上所有字符的编码,但是它没有规定的存储方式。

    Unicode标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。

    现代操作系统和大多数编程语言都直接支持Unicode。

    print unichr(30000)

    print unichr(30001)

    6.UTF-8编码:(Unicode Transformation Format - 8 bit)

    UTF-8 是 Unicode 的一种实现方式。它是可变长的编码方式,可以使用 1~4 个字节表示一个字符,可根据不同的符号而变化字节长度。

    7.Utf-8和GBK(GB2312)之间都必须通过Unicode才能转换

    GBK、GB2312----Unicode----UTF-8

    UTF-8----Unicode----GBK、GB2312

  • 相关阅读:
    第5.3课.多输入之多线程和fork
    第5.2课多输入之select
    第5.1课,多输入之轮询
    第4课.编写通用的Makefile
    第3课.电子书框架
    2.3freetype矢量字体
    建立u-boot,内核的SI工程
    2.1/2.2字符的编码方式及显示
    1.0数码相框框架分析
    [数据结构]一些有意思题目(一)
  • 原文地址:https://www.cnblogs.com/wxjly/p/7728651.html
Copyright © 2011-2022 走看看