计算机只能处理数字,不能处理文本,所有文本必须先转换成相应的数字,才能被计算机识别,这就涉及到编码的问题了。
编码类型:
1、ASCII:American Standard Code for Information Interchange,美国信息互换标准代码
因为美国使用的语言就是英文,所有这套编码包含:大小写字母、数字和一些符号,总共127个字符。
后来增加了 128到255这一页的字符集被称”扩展字符集”。但是原有的编号方法,已经再也放不下更多的编码。
2、UNICODE:Universal Multiple-Octet Coded Character Set”,简称 UCS
包含所有的语言字符
3、UTF:UCS Transfer Format,可变长编码
UTF8 就是每次8个位传输数据
UTF16 就是每次16个位传输数据
编码与字段的转换:
ord()
函数获取字符的整数表示,chr()
函数把编码转换为对应的字符