python 的基础学习第三天编码的初始

zoukankan html css js c++ java

python 的基础学习第三天编码的初始

1 编码的初始

计算机在存储数据和传输数据的时候，都是0101的二进制。

ASCII（American Standard Code for Information Interchange，美国标准信息交换代码）是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言，其最多只能用 8 位来表示（一个字节），即：2**8 = 256，所以，ASCII码最多只能表示 256 个符号。

显然ASCII码无法将世界上的各种文字和符号全部表示，所以，就需要新出一种可以代表所有字符和符号的编码，即：Unicode

Unicode（统一码、万国码、单一码）是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，规定虽有的字符和符号最少由 16 位来表示（2个字节），即：2 **16 = 65536，
注：此处说的的是最少2个字节，可能更多

Unicode,在初期为16位，两个字节表示一个字符，很多语言无法包括在内。升级之后为32位，四个字节表示一个字节，占的的内存太多，资源浪费。

UTF-8，是对Unicode编码的压缩和优化，他不再使用最少使用2个字节，而是将所有的字符和符号进行分类：ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存，东亚的字符用3个字节保存...

所以，python解释器在加载 .py 文件中的代码时，会对内容进行编码（默认ascill），如果是如下代码的话：

报错：ascii码无法表示中文。

Utf-8,最少用8位一个字节，表示一个字符。英文用8位表示一个字符：欧洲用16位表示一个字符，在亚洲用24位表示一个字符，即用三个字节表示一个字符。

gbk国标只表示英文和中文，英文用8位一个字节，表示一个字符，中文用16位两个字节，表示一个字符。

8bit =1byte

1024byte= 1kb

1024kb =1mb

1024mb =1G

1024G =1TB

查看全文

相关阅读:
03 java中的基本数据类型和运算符
 02 Eclipse安装
 01 HelloWorld
express不是内部或外部命令
 win10 内存或系统资源不足，无法打开PPT
win 10中解决“此文件在另外一个进程中运行”的问题
 后台查找密码暴力破解
 DVWA--全等级暴力破解（Burte Force）
DVWA简单搭建
 破解版

原文地址：https://www.cnblogs.com/yzxing/p/8604093.html

python 的基础 学习 第三天 编码的初始

python 的基础学习第三天编码的初始