zoukankan      html  css  js  c++  java
  • python之IO操作

    文件读写

    在Python中,文件读写是通过open()函数打开的文件对象完成的。使用with语句操作文件IO是个好习惯。

    try:
        f = open('1.txt', 'r')  #rb写二进制
        #f = open('1.txt', 'w')  #wb读二进制
        f.read().decode('utf8')
        #f.write('test').encode('utf8')
    finally:
        if f:
            f.close()
    
    用with写:
    with open('1.txt', 'r') as f:
        print f.read()

    如果文件很小,read()一次性读取最方便;如果不能确定文件大小,反复调用read(size)比较保险;如果是配置文件,调用readlines()最方便

     

    模式

    描述

    r

    以读方式打开文件,可读取文件信息。

    w

    以写方式打开文件,可向文件写入信息。如文件存在,则清空该文件,再写入新内容

    a

    以追加模式打开文件(即一打开文件,文件指针自动移到文件末尾),如果文件不存在则创建

    r+

    以读写方式打开文件,可对文件进行读和写操作。

    w+

    消除文件内容,然后以读写方式打开文件。

    a+

    以读写方式打开文件,并把文件指针移到文件尾。

    b

    以二进制模式打开文件,而不是以文本模式。该模式只对Windows或Dos有效,类Unix的文件是用二进制模式进行操作的。

    read(size) # 读取所有内容至字符串,若设定了size,就最多读取size个字节的内容
    readline(size) # 每次读取一行内容
    readlines() # 读取所有内容并按行返回list

    write() # 将字符串写入到文件
    writelines() # 接受一个字符串列表作为参数,将它们写入文件

    ps:当使用输入方法如 read() 、readline() 、readlines() 从文件中读取行时, Python 并不会删除行结束符. 这个操作被留给了程序员.
    类似地, 输出方法 write() 或 writelines() 也不会自动加入行结束符. 你应该在向文件写入数据前自己完成

    文件迭代

    for eachline in f: # 一行行访问文件

    操作系统差异
    Linux、Mac:换行符( ) 路径分隔符(/)
    windows、dos:换行符( ) 路径分隔符()

    os模块中考虑了上面这些:
    linesep 系统行分隔符
    sep 系统路径分隔符
    pathsep 不同路径分隔条
    curdir 当前工作目录
    pardir 当前工作目录的父目录

    >>> print 'aa' + os.linesep + 'bb'
    aa
    bb
    >>> print 'aa' + os.sep + 'bb'
    aab
    >>> print 'aa' + os.pathsep + 'bb'
    aa;bb
    >>> print os.curdir
    .
    >>> print os.pardir
    ..

    目录操作

    把两个路径合成一个时,不要直接拼字符串,而要通过os.path.join()函数,这样可以正确处理不同操作系统的路径分隔符
    同样的道理,要拆分路径时,也不要直接去拆字符串,而要通过os.path.split()函数,这样可以把一个路径拆分为两部分,后一部分总是最后级别的目录或文件名

    得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()
    返回指定目录下的所有文件和目录名:os.listdir()
    检验给出的路径是否是一个文件:os.path.isfile()
    检验给出的路径是否是一个目录:os.path.isdir()
    判断是否是绝对路径:os.path.isabs()
    检验给出的路径是否真地存:os.path.exists()
    返回一个路径的目录名和文件名:os.path.split()      
    分离扩展名:os.path.splitext()
    获取路径名:os.path.dirname()
    获取文件名:os.path.basename()
    获取文件属性:os.stat(file)
    给出当前平台使用的行终止符:os.linesep    Windows使用'
    ',Linux使用'
    '而Mac使用'
    '  
         
    创建目录
    os.mkdir("file")                   
    
    复制文件
    shutil.copyfile("oldfile","newfile")    #oldfile和newfile都只能是文件
    shutil.copy("oldfile","newfile")        #oldfile只能是文件夹,newfile可以是文件,也可以是目标目录
    
    复制文件夹
    shutil.copytree("olddir","newdir")      #olddir和newdir都只能是目录,且newdir必须不存在
    
    移动文件/目录
    shutil.move("oldpos","newpos")   
    
    重命名文件/目录
    os.rename("oldname","newname")       
    
    删除文件
    os.remove("file")
    
    删除目录
    os.rmdir("dir")    #只能删除空目录
    shutil.rmtree("dir")    #空目录、有内容的目录都可以删
    
    转换目录
    os.chdir("C:\123")   #将当前目录设为 "C:123", 相当于DOC命令的 CD C:123 

     

    file-like Object

    像open()函数返回的这种有个read()方法的对象,在Python中统称为file-like Object。除了file外,还可以是内存的字节流,网络流,自定义流等等。file-like Object不要求从特定类继承,只要写个read()方法就行。

    StringIO就是在内存中创建的file-like Object,常用作临时缓冲。

     

    序列化

    把变量从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。
    反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。

    如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,例如JSON

    JSON和Python内置的数据类型对应如下:

    JSON类型 Python类型
    {} dict
    [] list
    "string" 'str'或u'unicode'
    1234.56 int或float
    true/false True/False
    null None

     

     

     

     

     

           

         

    对于简单数据类型(string、unicode、int、float、list、tuple、dict),可以直接处理。

    序列化
    dumps()方法返回一个str,内容就是标准的JSON。
    dump()方法可以直接把JSON写入一个file-like Object。

    反序列化
    loads()把JSON的字符串反序列化
    load()从file-like Object中读取字符串并反序列化

    >>> import json
    >>> d = dict(name='David', age=20, score=100)
    >>> d_encode = json.dumps(d)
    >>> d_encode
    '{"age": 20, "score": 100, "name": "David"}'
    >>> with open('D:\1.txt', 'wb') as f:
        d_encode_file = json.dump(d, f)
    
    >>> d_decode = json.loads(d_encode)
    >>> d_decode
    {u'age': 20, u'score': 100, u'name': u'David'}
    >>> with open('D:\1.txt', 'rb') as f:
        d_decode_file = json.load(f)
       
    >>> d_decode_file
    {u'age': 20, u'score': 100, u'name': u'David'}

     

    将class的实例对象encode,decode为json

    import json
    
    class Student(object):
        def __init__(self, name, age, score):
            self.name = name
            self.age = age
            self.score = score
    
    def student2dict(std):
        return {
            'name': std.name,
            'age': std.age,
            'score': std.score
        }
    
    def dict2student(d):
        return Student(d['name'], d['age'], d['score'])
    
    
    s = Student('David', 20, 100)
    print(json.dumps(s, default=student2dict))
    #可选参数default就是把任意一个对象变成一个可序列为JSON的对象
    
    json_str = '{"age": 20, "score": 88, "name": "Bob"}'
    print(json.loads(json_str, object_hook=dict2student))
    #loads()方法首先转换出一个dict对象,传入的object_hook函数负责把dict转换为Student实例

     

    2015-05-10

  • 相关阅读:
    python实现布隆过滤器及原理解析
    gin框架源码解析
    阿里云docker操作问题记录
    Qt编写数据可视化大屏界面电子看板系统
    CSS3-3D制作案例分析实战
    前端可视化项目流程,涉及three.js(webGL),3DMax技术,持续更新
    前端可视化项目流程,涉及three.js(webGL),3DMax技术,持续更新
    jquery拖拽排序,针对后台列表table进行拖拽排序(Echart不刷新页面,多语言切换下的地图数据重新加载,api请求数据加载
    Java 设置Excel条件格式(高亮条件值、应用单元格值/公式/数据条等类型)C# 创建Excel气泡图
    Java 如何在PPT中设置形状组合、取消组合、编辑组合形状
  • 原文地址:https://www.cnblogs.com/whuyt/p/4492380.html
Copyright © 2011-2022 走看看