字符编码
人识别的语言与机器识别的语言转化的媒介
重点:什么是字符编码
人类能识别的字符是高级标识符,电脑只识别01,要完成人与机器之间的信息交流,一定需要一个媒介,进行两种标识符的转化(两种标识符的对应关系)
对应关系形成的结构称之为:编码表
乱码:存数据与读数据采用的编码表不一致
软件打开文件读取数据的流程:
1、打开软件
2、往计算机发生一个打开文件的指令,来打开文件
3、读取数据渲染给用户(存取编码不一致:乱码)
python解释器打开py文件:
1、打开软件(python解释器)
2、往计算机发送一个打开文件的指令
3、逐行解释打开的文件内容(存取编码不一致,无法正常解释,崩溃)将执行的结果展示给用户
解释的原因:py2,默认按ASCII来解释文件内容,py3默认按utf-8来解释文件内容
Unicode与utf-8的关系:它们采用的是一张unicode的编码表utf-8是unicode编码表的体现方式,变长存储数据
变长优点:大量数据都是以英文存在,索引utf-8空间更小,传输速度快
编码与解码
重点:将u字符串编码成b字符串 u' '.encode()
将b字符串编码成u字符串 b' '.decode()
文件操作
计算机中的文件:硬盘中一块存储空间(虚拟的文件)
文件操作:根据文件名来操作硬盘的那块存储空间
操作方式:读: read 写:write
一、使用文件的三步骤
1.打开文件
变量名=文件空间
文件路径 操作模式(读写)编码
2.操作文件
读()、写()
3、关闭文件*****
f.close
二、模式
基础写:文件不存在,会新建文件,文件存在,则会先清空文件再操作文件