一.什么是字符编码
计算机要想工作必须通电,即用‘电’驱使计算机干活,也就是说‘电’的特性决定了计算机的特性。电的特性即高低电平(人类从逻辑上将二进制数1对应高电平,二进制数0对应低电平),关于磁盘的磁特性也是同样的道理。结论:计算机只认识数字
很明显,我们平时在使用计算机时,用的都是人类能读懂的字符(用高级语言编程的结果也无非是在文件内写了一堆字符),如何能让计算机读懂人类的字符? 必须经过一个过程: #字符--------(翻译过程)------->数字 #这个过程实际就是一个字符如何对应一个特定数字的标准,这个标准称之为字符编码
关于字符编码的操作:
1.编写python文件,首行应该加文件头:#coding:文件存时用的编码
2.用python2写程序,定义字符串应该加上前缀,如. x=u'上'
3.python3中的字符串都是unicode编码的.python3的字符串encode之后可以得到bates类型.
二.文件处理:
1 什么是文件
文件是操作系统提供给用户/应用程序的一种虚拟单位,该虚拟单位直接映射的是硬盘空间
2 为何要处理文件
用户/应用程序直接操作文件(读/写)就被操作系统转换成具体的硬盘操作,从而实现
用户/应用程序将内存中的数据永久保存到硬盘中
3 如何用文件/
文件处理的三个步骤
f=open(r'c.txt',mode='r',encoding='utf-8') # 文件对象(应用程序的内存资源)------》操作系统打开的文件(操作系统的内存资源)
# print(f)
data=f.read()
f.close() # 向操作系统发送信号,让操作系统关闭打开的文件,从而回收操作系统的资源
# 上下文管理
# with open(r'c.txt',mode='r',encoding='utf-8') as f,open(r'b.txt',mode='r',encoding='utf-8') as f1:
# 读写文件的操作
# pass
# 文件的打开模式:r(默认的) w a
# 操作文件内容的模式:
# t(默认的):操作文件内容都是以字符串为单位,会自动帮我们解码,必须指定encoding参数
# b: 操作文件内容都是以Bytes(二进制)为单位,硬盘中存的是什么就取出什么,一定不能指定encoding参数
# 总结:t模式只能用于文件本文件,而b模式可以用于任意文件.
# r模式:只读模式,在文件不存在时则报错,如果文件存在文件指针跳到文件的开头
# with open(r'c.txt',mode='rt',encoding='utf-8') as f:
# print(f.read())
# print(f.readable())
# print(f.writable())
# f.write('hello') # 只能读
# data=f.read()
# print(data,type(data))
# with open(r'c.txt',mode='rb') as f:
# data=f.read()
# # print(data,type(data))
# res=data.decode('utf-8')
# print(res)
# with open(r'c.txt',mode='rt',encoding='utf-8') as f:
# # line=f.readline()
# # print(line,end='')
# # line1=f.readline()
# # print(line1,end='')
# # line2 = f.readline()
# # print(line2,end='')
#
# lines=f.readlines()
# print(lines)
# with open(r'c.txt',mode='rt',encoding='utf-8') as f:
# line=f.readline()
# print(line,end='')
# 循环读文件内容的方法:
# with open(r'c.txt',mode='rt',encoding='utf-8') as f:
# for line in f:
# print(line,end='')