一、文件概述
1.计算机文件是一个存储在存储器上的数据序列,可以包含任何数据内容
2.文件包括文本文件和二进制文件。
3.信息量
1024Byte = 1KB
1024KB = 1MB
1024MB = 1GB
1024GB = 1T
4.字符编码
4.1ASCII编码
4.2gb2312编码
4.3gbk编码
4.4unicode编码
4.5utf-8编码
5.字节类型-编码与解码
字符转换成对应的编码称为编码,根据字符编码转换成字符叫做解码。
二、python文件操作
1.open函数 open(file, mode='r', encoding=None)
file 包含文件名的字符串,可以是相对路径或绝对路径
mode 一个可选字符串,用于指定打开文件的模式,默认值r表示文本读
encoding文本模式下指定文件的编码
mode的取值:
"r" 文本读取(默认)
"w"文本写入,并清空文件,文件不存在则创建
"x"文本写,排它性创建,如果文件存在则失败
"a"文本写,如果文件存在则在尾部追加,不存在则创建
和mode组合的字符:
"b" 二进制的模式。例如"rb"表示二进制读
"t"文本模式(默认)。例如rt一般省略t
"+"读取写入。例如r+表示同时读写
2.读文本文件-基本操作
>>>fb = open('text.txt', 'r', encoding='utf-8')
conten = fb.read()
print(conten)
fb.close()
3.whit 上下文管理
>>>with open('text.txt', 'r', encoding='utf-8') as fb:
cotent = fb.read()
print(cotent)
4.使用python将提供的csv文件中的内容读到内存,并使用列表来表示。(提示,csv文件的编码是gbk)
with open('鸢尾.csv', 'r', encoding='gbk') as fb:
data = []
for line in fb:
line = line.strip()
line = line.split(',')
data.append(line)
print(data)
5.将第4中解析出的列表再组织成csv格式写入一个新的csv文件。
with open('鸢尾1.csv', 'w', encoding='gbk') as fb:
for line in data:
fb.write(','.join(line)+ '
')