zoukankan      html  css  js  c++  java
  • python文件操作

    在我们日常工作中我们会处理不同类型(Excel、CSV、TXT等)文件,或读或写或读写。掌握文件操作对我们工作来说十分有用。

    文件夹

    对文件的操作离不开对文件夹的操作。

    在Python开发中会定义很多自动以模块,在导入包时,在一些情况下往往会提示No xxxx Moudle之类的错误,磨刀不误砍柴工嘛,好好梳理下Python的工作路径,《参考博客

    Python中对于文件夹的处理有三大模块:

    os.path --- 返回的是字符串
    pathlib --- 返回的是一个Path对象
    shutil  --- 更多的是对文件的复制或移动操作
    xx
    

    os.path

    处理结果返回的是字符串形式

    import os
    import datetime
    
    print("去掉文件名返回工作目录:", os.path.dirname('/home/ubuntu/MySpace/Python/notes/Python文件操作.ipynb'))
    
    去掉文件名返回工作目录: /home/ubuntu/MySpace/Python/notes
    
    print("返回上一层的工作目录全路径:", os.path.dirname(os.path.dirname('/home/ubuntu/MySpace/Python/notes/Python文件操作.ipynb')))
    
    返回上一层的工作目录全路径: /home/ubuntu/MySpace/Python
    
    print("返回当前工作目录:", os.getcwd())
    
    返回当前工作目录: /home/ubuntu/MySpace/Python/notes
    
    pwd_1 = "/home/ubuntu/MySpace/Python/notes/"
    pwd_2 = "/home/ubuntu/MySpace/Python/xxx/"
    
    path_1 = os.path.exists(pwd_1)
    path_2 = os.path.exists(pwd_2)
    
    def judge_path(path):
        if path:
            print("path 存在,值为:", path)
        else:
            print("path 不存在,值为:", path)
            
    if __name__ == "__main__":
        judge_path(path_1)
        judge_path(path_2)
    
    path 存在,值为: True
    path 不存在,值为: False
    
    print("返回绝对路径:", os.path.abspath("/home/ubuntu/MySpace/Python/notes/Python文件操作.ipynb"))
    
    返回绝对路径: /home/ubuntu/MySpace/Python/notes/Python文件操作.ipynb
    
    print("返回路径的最后一部分:", os.path.basename("/home/ubuntu/MySpace/Python/notes/Python文件操作.ipynb"))
    print("返回路径的最后一部分:", os.path.basename("/home/ubuntu/MySpace/Python/notes"))
    
    返回路径的最后一部分: Python文件操作.ipynb
    返回路径的最后一部分: notes
    
    print("返回文件名:", os.path.basename("/home/ubuntu/MySpace/Python/notes/Python文件操作.ipynb"))
    
    返回文件名: Python文件操作.ipynb
    
    print("将路径切割成头和尾的元组:", os.path.split("/home/ubuntu/MySpace/Python/notes/Python文件操作.ipynb"))
    print("将路径切割成头和尾的元组:", os.path.split("/home/ubuntu/MySpace/Python/notes"))
    
    将路径切割成头和尾的元组: ('/home/ubuntu/MySpace/Python/notes', 'Python文件操作.ipynb')
    将路径切割成头和尾的元组: ('/home/ubuntu/MySpace/Python', 'notes')
    
    print("路径拼接:", os.path.join("/home/ubuntu/MySpace/Python/notes/", "拼接路径"))
    
    路径拼接: /home/ubuntu/MySpace/Python/notes/拼接路径
    
    print("返回当前目录下的所有内容:", os.listdir('./'))
    
    print("
    返回当前目录下的所有内容:", os.listdir('./data/'))
    
    返回当前目录下的所有内容: ['校招生面试.ipynb', 'BasicPythonMind.mmd', 'Python文件操作.ipynb', '.~Python文件操作.ipynb', '.ipynb_checkpoints', 'Python文件.ipynb', '测试开发.mmd', '测试开发面试.ipynb', 'Python基础知识.ipynb', '__init__.py', 'data']
    
    返回当前目录下的所有内容: ['read.txt', '.ipynb_checkpoints', 'count.txt', 'dst', 'src', 'write.txt']
    
    # print("修改文件权限:", os.chmod("文件名", 665))
    
    print("返回操作系统名称:", os.name)
    
    返回操作系统名称: posix
    
    print("返回当前操作系统的详细信息:", os.uname())
    
    返回当前操作系统的详细信息: posix.uname_result(sysname='Linux', nodename='VM-0-8-ubuntu', release='4.15.0-54-generic', version='#58-Ubuntu SMP Mon Jun 24 10:55:24 UTC 2019', machine='x86_64')
    

    pathlib

    from pathlib import Path
    import os
    
    p = Path()
    
    print("返回当前目录相对路径:%s" % p)
    
    返回当前目录相对路径:.
    
    print("返回当前目录绝对路径:%s" % p.cwd())
    
    返回当前目录绝对路径:/home/ubuntu/MySpace/Python/notes
    
    print("返回当前家目录:%s" % p.home())
    
    返回当前家目录:/home/ubuntu
    
    print("是否是软链接:%s" % p.is_symlink())
    
    是否是软链接:False
    
    print("是否是块设备:%s" % p.is_block_device())
    
    是否是块设备:False
    
    print("是否是socket文件:%s" % p.is_socket())
    
    是否是socket文件:False
    
    print("是否是绝对路径:%s" % p.is_absolute())
    
    是否是绝对路径:False
    
    print("返回一个新的路径,该路径是当前Path的绝对路径,如果是软连接则被解析:%s" % p.is_absolute())
    
    返回一个新的路径,该路径是当前Path的绝对路径,如果是软连接则被解析:False
    
    print("获取绝对路径:%s" % p.absolute())
    
    获取绝对路径:/home/ubuntu/MySpace/Python/notes
    
    # 获取绝对路径,推荐使用resolve()
    print("获取绝对路径:%s" % p.resolve())
    
    获取绝对路径:/home/ubuntu/MySpace/Python/notes
    
    print("判断目录或者文件是否存在:%s" % p.exists())
    
    判断目录或者文件是否存在:True
    
    # print("删除空目录", p.rmdir())
    
    p_u = Path("../usr/local/sbin")
    # print("将路径解析成url:%s" % p_u.as_uri())
    
    # 返回 p1 下目录的相关信息
    p1 = Path("/usr/local/httpd/httpd.conf")
    print("目录的最后一个部分,没有后缀p1.name:%s" % p1.name)
    print("连接多个字符串到Path对象中-p1.joinpath:%s" % p1.joinpath('test'))
    print("目录的逻辑父目录-p1.parent:%s" % p1.parent)
    print("父目录序列,索引0是直接的父-p1.parents:%s" % p1.parents[0])
    print("父目录序列,索引0是直接的父-p1.parents:%s" % p1.parents[1])
    print("父目录序列,索引0是直接的父-p1.parents:%s" % p1.parents[2])
    print("父目录序列,索引0是直接的父-p1.parents:%s" % p1.parents[3])
    print("目录中的最后一部分-p1.stem:%s" % p1.stem)
    print("目录中的最后一部分的扩展名-p1.suffix:%s" % p1.suffix)
    print("返回多个扩展名列表-p1.suffixes:%s" % p1.suffixes)
    print("返回路径中的每一个部分-p1.parts:(%s, %s, %s, %s, %s)" % p1.parts)
    print("补充扩展名到路径的尾部,返回新的路径,扩展名存在则无效-p1.with_suffix(suffix):%s" % p1.with_suffix('.txt'))
    print("替换目录最后一个部分并返回一个新的路径-p1.with_name(name):%s" % p1.with_name("httpd.txt"))
    
    目录的最后一个部分,没有后缀p1.name:httpd.conf
    连接多个字符串到Path对象中-p1.joinpath:/usr/local/httpd/httpd.conf/test
    目录的逻辑父目录-p1.parent:/usr/local/httpd
    父目录序列,索引0是直接的父-p1.parents:/usr/local/httpd
    父目录序列,索引0是直接的父-p1.parents:/usr/local
    父目录序列,索引0是直接的父-p1.parents:/usr
    父目录序列,索引0是直接的父-p1.parents:/
    目录中的最后一部分-p1.stem:httpd
    目录中的最后一部分的扩展名-p1.suffix:.conf
    返回多个扩展名列表-p1.suffixes:['.conf']
    返回路径中的每一个部分-p1.parts:(/, usr, local, httpd, httpd.conf)
    补充扩展名到路径的尾部,返回新的路径,扩展名存在则无效-p1.with_suffix(suffix):/usr/local/httpd/httpd.txt
    替换目录最后一个部分并返回一个新的路径-p1.with_name(name):/usr/local/httpd/httpd.txt
    

    shutil

    shutil --- 更多的是对文件的复制或移动操作

    文件操作

    Excel文件

    # !pip3 install xlrd
    # !pip3 install xlutils
    
    Collecting xlrd
      Downloading http://mirrors.tencentyun.com/pypi/packages/b0/16/63576a1a001752e34bf8ea62e367997530dc553b689356b9879339cf45a4/xlrd-1.2.0-py2.py3-none-any.whl (103kB)
        100% |████████████████████████████████| 112kB 577kB/s ta 0:00:01
    [?25hInstalling collected packages: xlrd
    Successfully installed xlrd-1.2.0
    Collecting xlutils
      Downloading http://mirrors.tencentyun.com/pypi/packages/c7/55/e22ac73dbb316cabb5db28bef6c87044a95914f713a6e81b593f8a0d2f79/xlutils-2.0.0-py2.py3-none-any.whl (55kB)
        100% |████████████████████████████████| 61kB 589kB/s ta 0:00:011
    [?25hCollecting xlrd>=0.7.2 (from xlutils)
      Downloading http://mirrors.tencentyun.com/pypi/packages/b0/16/63576a1a001752e34bf8ea62e367997530dc553b689356b9879339cf45a4/xlrd-1.2.0-py2.py3-none-any.whl (103kB)
        100% |████████████████████████████████| 112kB 982kB/s ta 0:00:01
    [?25hCollecting xlwt>=0.7.4 (from xlutils)
      Downloading http://mirrors.tencentyun.com/pypi/packages/44/48/def306413b25c3d01753603b1a222a011b8621aed27cd7f89cbc27e6b0f4/xlwt-1.3.0-py2.py3-none-any.whl (99kB)
        100% |████████████████████████████████| 102kB 1.5MB/s a 0:00:011
    [?25hInstalling collected packages: xlrd, xlwt, xlutils
    Successfully installed xlrd-1.2.0 xlutils-2.0.0 xlwt-1.3.0
    
    import xlrd
    from xlutils.copy import copy
    import os
    import sys
    
    BASE_DIR = os.path.dirname(os.path.dirname("./data/excel.xls"))
    sys.path.append(BASE_DIR)
    print("BASE_DIR: %s" % BASE_DIR)
    
    class OperateExcel(object):
    
        def __init__(self, file_name=None, sheet_id=None):
            """
            获取要读取的excel文件
            :param file_name: 文件名称
            :param sheet_id: 文件的sheet页
            """
            if file_name:
                self.file_name = file_name
            else:
                self.file_name = "./data/excel.xls"
    
            if sheet_id:
                self.sheet_id = sheet_id
            else:
                self.sheet_id = 0
    
            self.sheet_table = self.get_sheet()
    
        # 获取 sheet 页的操作对象
        def get_sheet(self):
            data = xlrd.open_workbook(self.file_name)
            sheet_table = data.sheets()[self.sheet_id]
            return sheet_table
    
        # 获取 sheet 页的行数和列数,返回的是一个元祖
        def get_sheet_nrows_ncols(self):
            return self.sheet_table.nrows, self.sheet_table.ncols
    
        # 获取 sheet 页的行数(Excel中常用到)
        def get_sheet_nrows(self):
            return self.sheet_table.nrows
    
        # 获取 sheet 页的列数
        def get_sheet_ncols(self):
            return self.sheet_table.ncols
    
        # 获取单元格中的数据
        def get_sheet_cell(self, row, col):
            """
            :param row: 单元格的第几行
            :param col: 单元格的第几列
            :return: 单元格的值
            """
            cell_data = self.sheet_table.cell_value(row, col)
            return cell_data
    
        # 写数据到 Excel 文件中
        def write_to_excel(self, row, col, value):
            # 获取操作Excel的操作句柄
            data = xlrd.open_workbook(self.file_name)
            # 拷贝数据
            copy_data = copy(data)
            # 选择要写入的Excel sheet页
            copy_data_sheet = copy_data.get_sheet(self.sheet_id)
            # 写入数据
            copy_data_sheet.write(row, col, value)
            # 保存数据到excel
            copy_data.save(self.file_name)
    
    
    if __name__ == "__main__":
        oe = OperateExcel()
        print("获取Excel对象:%s" % oe.get_sheet())
        print("Excel有:(%s, %s)" % oe.get_sheet_nrows_ncols())
        print("Excel有:%s 行" % oe.get_sheet_nrows())
        print("Excel有:%s 列" % oe.get_sheet_ncols())
        print("Excel的第 %s 行 %s 列的值为: %s" % (2, 2, oe.get_sheet_cell(2, 2)))
        oe.write_to_excel(11, 5, "Values")
    
    BASE_DIR: .
    获取Excel对象:<xlrd.sheet.Sheet object at 0x7f1f9c19a588>
    Excel有:(12, 6)
    Excel有:12 行
    Excel有:6 列
    Excel的第 2 行 2 列的值为: B 
    

    CSV文件

    CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据。会用到 pandas 模块来处理 csv 文件,Pandas 是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。

    # !pip3 install numpy
    # !pip3 install pandas
    
    Collecting numpy
      Downloading http://mirrors.tencentyun.com/pypi/packages/07/08/a549ba8b061005bb629b76adc000f3caaaf881028b963c2e18f811c6edc1/numpy-1.18.2-cp36-cp36m-manylinux1_x86_64.whl (20.2MB)
        100% |████████████████████████████████| 20.2MB 6.6MB/s ta 0:00:011   12% |████                            | 2.5MB 3.9MB/s eta 0:00:05    23% |███████▋                        | 4.8MB 7.6MB/s eta 0:00:03    41% |█████████████▎                  | 8.4MB 26.8MB/s eta 0:00:01    95% |██████████████████████████████▋ | 19.3MB 11.3MB/s eta 0:00:01
    [?25hInstalling collected packages: numpy
    Successfully installed numpy-1.18.2
    Collecting pandas
      Downloading http://mirrors.tencentyun.com/pypi/packages/bb/71/8f53bdbcbc67c912b888b40def255767e475402e9df64050019149b1a943/pandas-1.0.3-cp36-cp36m-manylinux1_x86_64.whl (10.0MB)
        100% |████████████████████████████████| 10.0MB 4.1MB/s ta 0:00:011
    [?25hCollecting python-dateutil>=2.6.1 (from pandas)
      Downloading http://mirrors.tencentyun.com/pypi/packages/d4/70/d60450c3dd48ef87586924207ae8907090de0b306af2bce5d134d78615cb/python_dateutil-2.8.1-py2.py3-none-any.whl (227kB)
        100% |████████████████████████████████| 235kB 32.6MB/s ta 0:00:01
    [?25hCollecting numpy>=1.13.3 (from pandas)
      Downloading http://mirrors.tencentyun.com/pypi/packages/07/08/a549ba8b061005bb629b76adc000f3caaaf881028b963c2e18f811c6edc1/numpy-1.18.2-cp36-cp36m-manylinux1_x86_64.whl (20.2MB)
        100% |████████████████████████████████| 20.2MB 3.1MB/s ta 0:00:01    12% |████▏                           | 2.6MB 3.7MB/s eta 0:00:05    46% |███████████████                 | 9.4MB 2.9MB/s eta 0:00:04    47% |███████████████▏                | 9.6MB 3.2MB/s eta 0:00:04    77% |█████████████████████████       | 15.7MB 3.3MB/s eta 0:00:02
    [?25hCollecting pytz>=2017.2 (from pandas)
      Downloading http://mirrors.tencentyun.com/pypi/packages/e7/f9/f0b53f88060247251bf481fa6ea62cd0d25bf1b11a87888e53ce5b7c8ad2/pytz-2019.3-py2.py3-none-any.whl (509kB)
        100% |████████████████████████████████| 512kB 2.9MB/s ta 0:00:01
    [?25hCollecting six>=1.5 (from python-dateutil>=2.6.1->pandas)
      Downloading http://mirrors.tencentyun.com/pypi/packages/65/eb/1f97cb97bfc2390a276969c6fae16075da282f5058082d4cb10c6c5c1dba/six-1.14.0-py2.py3-none-any.whl
    Installing collected packages: six, python-dateutil, numpy, pytz, pandas
    Successfully installed numpy-1.18.2 pandas-1.0.3 python-dateutil-2.8.1 pytz-2019.3 six-1.14.0
    
    import os
    import sys
    import numpy as np
    import pandas as pd
    
    BASE_DIR = os.path.dirname(os.path.dirname("./data/csv.csv"))
    print("BASE_DIR: %s" % BASE_DIR)
    sys.path.append(BASE_DIR)
    
    
    class OperateCsv(object):
        
        def __init__(self, file_name=None):
            if file_name:
                self.file_name = file_name
            else:
                self.file_name = "./data/csv.csv"      
            self.df = self.read_csv()
            
        def read_csv(self):
            """
            filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,
            header=None表示头部为空,
            sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,’即可
            @return: 返回CSV中的所有数据
            """
            df = pd.read_csv(
                self.file_name,
                header=None
            )
            return df
            
        def read_front_rows(self, n):
            """
            会包含表头的返回前n行的CSV数据
            @param n: 要返回的行数
            @return: 返回的 n 行数据
            """
            return self.df.head(n)
        
        def read_tail_rows(self, n):
            """
            返回CSV文件的最后 n 行数据
            @param n: 要返回的行数
            @return: 返回的后 n 行数据
            """
            return self.df.tail(n)
        
        def read_skiprows(self, *args):
            return pd.read_table(self.file_name, header=None, skiprows=args)
        
        def read_rows_cols(self, *args):
            drc = pd.read_csv(
                self.file_name,
                header=None,
                names=args
            )
            return drc
        
        def drop_col(self, *args):
            return self.df.drop(args)
    
    
    if __name__ == "__main__":
        oc = OperateCsv()
        print("获取csv的所有数据:%s" % oc.read_csv())
        # print("获取前 %s 的数据: %s" % (4, oc.read_front_rows(4)))
        # print("获取后 %s 的数据: %s" % (3, oc.read_tail_rows(3)))
        # print("获取数据跳过某些行: %s" % (oc.read_skiprows(0, 1, 2)))
        # print("获取指定列" % oc.read_rows_cols('start_time', 'id'))
        # print("删除指定列", oc.drop_col(['id']))
    
    
    BASE_DIR: .
    获取csv的所有数据:     0       1     2                  3                  4
    0   id  is_run  name         start_time           end_time
    1    1    TRUE    A   2020/4/12 0:00:00  2020/5/12 0:00:00
    2    2    TRUE    B   2020/4/12 0:00:00  2020/5/12 0:00:00
    3    3    TRUE     C  2020/4/12 0:00:00  2020/5/12 0:00:00
    4    4    TRUE    D   2020/4/12 0:00:00  2020/5/12 0:00:00
    5    5    TRUE     E  2020/4/12 0:00:00  2020/5/12 0:00:00
    6    6    TRUE     F  2020/4/12 0:00:00  2020/5/12 0:00:00
    7    7    TRUE     G  2020/4/12 0:00:00  2020/5/12 0:00:00
    8    8    TRUE     H  2020/4/12 0:00:00  2020/5/12 0:00:00
    9    9    TRUE     I  2020/4/12 0:00:00  2020/5/12 0:00:00
    10  10    TRUE     J  2020/4/12 0:00:00  2020/5/12 0:00:00
    

    json文件

    JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式。它基于 ECMAScript 的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。

    """
        json.loads针对内存对象,即将Python内置数据序列化为字串
        json.load针对文件句柄,主要是针对读取文件
    
    """
    
    import os
    import sys
    import json
    
    file_name = "./data/json.json"
    
    json_list = '["foo", {"bar":["baz", null, 1.0, 2]}]'
    json_dict = '{"a": 0, "b": 0, "c": 0}'
    
    def loads_json(args):
        """
        :param args: 要解析的的数据,可以是
        :return:
        """
        result = json.loads(args)
        return result
        
    
    def load_json(file_path=None):
        """
        :param file_path: 要加载解析的文件
        :return: 解析后的数据
        """
        my_json = open(file_path, 'r', encoding="utf-8")
        result = json.load(my_json)
        return result
    
    def dumps_file_json(file_path=None):
        """
        现将文件中的数据读取到内存中,再从内存中读取,输出到控制台显示
        :param file_path: 要加载解析的文件
        :return: 解析后的格式化数据
        """
        my_json = open(file_path, 'r', encoding="utf-8")
        result = json.load(my_json)
        format_result = json.dumps(result, indent=4, ensure_ascii=False)
        return format_result
    
    def dumps_args_json(args=None):
        """
        将内存中的数据转换为json格式,并排序
        :param args: 内存中的数据,数据类型可以是字符串、列表、字典
        :return: json数据
        """
        format_result = json.dumps(args, indent=4, ensure_ascii=False, sort_keys=True)
        return format_result
    
    def dump_json(args_info=None, file_path=None):
        """
        将内存中的数据解析成json输出到文件中去
        :param args_info: 内存的数据,可以是字符串、列表、字典
        :param file_path: json要输出到的文件名称
        :return: 输出json数据文件
        """
        my_file = open(file_path, 'w')
        json.dump(args_info, my_file, indent=4)
     
     
        
    if __name__ == "__main__":
        
        # 从内存中读取将json解析
        # print("将json解析成列表:%s" % loads_json(json_list))
        # print("数据类型为:%s" % type(loads_json(json_list)))
        # print("将json解析成字典:%s" % loads_json(json_dict))
        # print("数据类型为:%s" % type(loads_json(json_dict)))
        #
        # 从文件中读取解析json
        # print("读取文件中的json数据:%s" % load_json(file_path=file_name))
        # print("读取文件中的json数据的数据类型为:%s" % type(load_json(file_path=file_name)))
    
        # 将数据格式化成json数据格式
        # print("读取文件中的json数据:%s" % dumps_file_json(file_path=file_name))
        # print("数据类型为:%s" % type(dumps_file_json(file_path=file_name)))
        data_str = ""fooar"
        data_list = ['foo', {'bar': ('baz', None, 1.0, 2)}]
        data_dict = {"c": 0, "b": 0, "a": 0}
        print("将字符串转换为json:%s" % dumps_args_json(data_str))
        print("数据类型为:%s" % type(dumps_args_json(data_str)))
        print("将列表转换为json:%s" % dumps_args_json(data_list))
        print("数据类型为:%s" % type(dumps_args_json(data_list)))
        print("将字段转换为json:%s" % dumps_args_json(data_list))
        print("数据类型为:%s" % type(dumps_args_json(data_list)))
        
        
        # args = [1, 2, 3, {'4': 5, '6': 7}]
        # file_name = "../OperateFile/data/dump_json.json"
        # dump_json(args, file_name)
    
    将字符串转换为json:""fooar"
    数据类型为:<class 'str'>
    将列表转换为json:[
        "foo",
        {
            "bar": [
                "baz",
                null,
                1.0,
                2
            ]
        }
    ]
    数据类型为:<class 'str'>
    将字段转换为json:[
        "foo",
        {
            "bar": [
                "baz",
                null,
                1.0,
                2
            ]
        }
    ]
    数据类型为:<class 'str'>
    

    log文件

    日志(Log)是指系统所指定对象的某些操作和其操作结果按时间有序的集合。log文件就是日志文件,log文件记录了系统和系统的用户之间交互的信息,是自动捕获人与系统终端之间交互的类型、内容或时间的数据收集方法;对网络搜索而言,日志是利用网络搜索引擎搜索信息的用户在搜索信息期间与该网络搜索引擎发生互动的电子记录。

    import os
    import sys
    import logging
    import datetime
    
    BASE_DIR = os.path.dirname(os.path.dirname("./data/"))
    sys.path.append(BASE_DIR)
    LOG_FORMAT = "%(asctime)s=====%(levelname)s+++++%(message)s"
    
    class OperateLog():
        def __int__(self, file_name=None):
            if file_name:
                self.file_name = file_name
            else:
                self.file_name = "./data/"
                
        def write_log1(self, file_name=None, message=None):
            logging.basicConfig(
                filename=file_name,
                level=logging.DEBUG,
                format=LOG_FORMAT
            )
            logging.debug(message)
            logging.info(message)
            logging.warning(message)
            logging.error(message)
            logging.critical(message)
            
        def write_log2(self, file_name=None, message=None):
            """
            :param file_name: 日志路径
            :param message: 要写入的日志信息
            :return:
            """
            logging.basicConfig(
                filename=file_name,
                level=logging.DEBUG,
                format=LOG_FORMAT
            )
            logging.log(logging.DEBUG, message)
            logging.log(logging.INFO, message)
            logging.log(logging.WARNING, message)
            logging.log(logging.ERROR, message)
            logging.log(logging.CRITICAL, message)
            
            
    if __name__ == "__main__":
        ol = OperateLog()
        log_times = datetime.datetime.now().strftime("%Y-%m-%d_%H-%M-%S")
        
        file_name_1 = "./data/%s_log.log" % log_times
        # ol.write_log1(file_name_1)
        
        file_name_2 = "./data/%s_log.log" % log_times
        # ol.write_log2(file_name_2, message="[test......]")
    
    

    ini文件

    *.ini文件是Initialization file的缩写,即为初始化文件,是Windows系统配置文件所采用的存储格式,统管Windows的各项配置, ini配置文件由节、键、值组成。

    import os
    import sys
    import configparser
    
    BASE_DIR = os.path.dirname(os.path.dirname("./data/ini.ini"))
    sys.path.append(BASE_DIR)
    
    
    class OperateIni(object):
        
        def __init__(self, file_name=None, node=None):
            if file_name:
                self.file_name = file_name
            else:
                self.file_name = "./data/ini.ini"
            
            if node:
                self.node = node
            else:
                self.node = "First"
                
            self.cf = self.read_ini()
            
        def read_ini(self):
            cf = configparser.ConfigParser()
            cf.read(self.file_name)
            return cf
        
        def get_value(self, node, key):
            value = self.cf.get(node, key)
            return value
        
    
    if __name__ == "__main__":
        oi = OperateIni()
        data = oi.get_value(node="Second", key='second_id')
        key = data.split(">")[0]
        value = data.split(">")[1]
        print(key, value)
        print("获取节点 %s 的 %s 参数的值为:%s" % ("Second", "second_id", oi.get_value(node="Second", key='second_id')))
    
    
    id 2
    获取节点 Second 的 second_id 参数的值为:id>2
    

    xml文件

    可扩展标记语言,标准通用标记语言的子集,简称XML。是一种用于标记电子文件使其具有结构性的标记语言。

    #!/usr/bin/env python
    # -*- encoding: utf-8 -*-
    """
    @File    :   32_text_xml.py
    @Time    :   2019/12/2214:07
    @Author  :   Crisimple
    @Github :    https://crisimple.github.io/
    @Contact :   Crisimple@foxmail.com
    @License :   (C)Copyright 2017-2019, Micro-Circle
    @Desc    :   None
    """
    
    import os
    import sys
    from xml.etree.ElementTree import ElementTree, Element
    from xml.dom.minidom import parse
    
    BASE_DIR = os.path.dirname(os.path.dirname("./data/xml.xml"))
    sys.path.append(BASE_DIR)
    
    
    class OperateXml(object):
        
        def __init__(self, file_name=None):
            if file_name:
                self.file_name = file_name
            else:
                self.file_name = "./data/xml.xml"
                
            self.dom = self.read_xml()
            
        def read_xml(self):
            """
            :return: 获取xml文件对象
            """
            dom = parse(self.file_name)
            return dom
        
        def get_document_element(self):
            """
            :return: rootNode---获取跟元素对象
            :return: 获取文档根元素
            """
            rootNode = self.dom.documentElement
            return rootNode.nodeName
        
        def get_root_next_info(self):
            """
            :return:
            """
            rootNode = self.dom.documentElement
            persons = rootNode.getElementsByTagName("person")
            for person in persons:
                if person.hasAttribute("ID"):
                    print("ID: %s" % person.getAttribute("ID"))
                    # id 参数
                    id = person.getElementsByTagName("id")[0]
                    print(id.nodeName, ":", id.childNodes[0].data)
                    # name 参数
                    name = person.getElementsByTagName("name")[0]
                    print(name.nodeName, ":", name.childNodes[0].data)
                    # sex 参数
                    sex = person.getElementsByTagName("sex")[0]
                    print(sex.nodeName, ":", sex.childNodes[0].data)
                    # comments 参数---xml不解析
                    comments = person.getElementsByTagName("comments")[0]
                    print(comments.nodeName, ":", comments.childNodes[0].data)
                else:
                    print("......")
        
        def write_xml(self):
            # 获取文档根元素
            rootNode = self.dom.documentElement
            
            # 新建一个person节点
            person_node = self.dom.createElement("person")
            person_node.setAttribute("ID", "p004")
            
            # 创建id节点,并设置textValue
            id_node = self.dom.createElement("id")
            id_text_value = self.dom.createTextNode("4")
            # 把文本节点挂到id_node节点上,即赋予值
            id_node.appendChild(id_text_value)
            # 把id_node挂在到person节点上,认亲
            person_node.appendChild(id_node)
    
            # 创建name节点,并设置textValue
            name_node = self.dom.createElement("name")
            name_text_value = self.dom.createTextNode("D")
            # 把文本节点挂到name_node节点上,即赋予值
            name_node.appendChild(name_text_value)
            # 把name_node挂在到person节点上,认亲
            person_node.appendChild(name_node)
    
            # 创建age节点,并设置textValue
            age_node = self.dom.createElement("age")
            age_text_value = self.dom.createTextNode("23")
            # 把文本节点挂到age_node节点上,即赋予值
            age_node.appendChild(age_text_value)
            # 把age_node挂在到person节点上,认亲
            person_node.appendChild(age_node)
    
            # 创建sex节点,并设置textValue
            sex_node = self.dom.createElement("sex")
            sex_text_value = self.dom.createTextNode("male")
            # 把文本节点挂到sex_node节点上,即赋予值
            sex_node.appendChild(sex_text_value)
            # 把sex_node挂在到person节点上,认亲
            person_node.appendChild(sex_node)
    
            # 创建comments节点,并设置textValue
            comments_node = self.dom.createElement("comments")
            comments_text_value = self.dom.createCDATASection("create success")
            # 把文本节点挂到comments_node节点上,即赋予值
            comments_node.appendChild(comments_text_value)
            # 把comments_node挂在到person节点上,认亲
            person_node.appendChild(comments_node)
            
            # 将上面创建的子节点挂在到根节点
            rootNode.appendChild(person_node)
            
            # 调整格式
            with open(self.file_name, 'w') as f:
                self.dom.writexml(f, addindent="", encoding="utf-8")
                
        def update_xml(self):
            # 文档根元素
            rootNode = self.dom.documentElement
            
            # 找到自己要更新的节点
            persons = rootNode.getElementsByTagName("person")
            for person in persons:
                name = person.getElementsByTagName("name")[0]
                # print(name.childNodes[0].data)
                if name.childNodes[0].data == "A1":
                    # 获取到name节点的父节点
                    pn = name.parentNode
                    print("pn: %s" % pn)
                    # 父节点的age节点,就是name的兄弟节点
                    age = pn.getElementsByTagName("age")[0]
                    print("age: %s" % age)
                    # 更新想要更新节点的值
                    name.childNodes[0].data = "A11"
                    age.childNodes[0].data = "9999"
                else:
                    print("请检查你的节点是否存在")
    
            with open(self.file_name, 'w') as f:
                self.dom.writexml(f, addindent='', encoding="utf-8")
            
    
    if __name__ == "__main__":
        ox = OperateXml()
        print("获取xml文件对象:%s" % ox.read_xml())
        print("获取文档根元素: %s" % ox.get_document_element())
        # 获取xml各个节点信息
        # ox.get_root_next_info()
        # 向xml文件中写数据
        # ox.write_xml()
        # 更新xml文件数据
        ox.update_xml()
    
    获取xml文件对象:<xml.dom.minidom.Document object at 0x7f1f84ab9b88>
    获取文档根元素: Poeple
    请检查你的节点是否存在
    请检查你的节点是否存在
    请检查你的节点是否存在
    请检查你的节点是否存在
    请检查你的节点是否存在
    

    txt文件

    import os
    import sys
    
    BASE_DIR = os.path.dirname(os.path.dirname("./data/txt.txt"))
    sys.path.append(BASE_DIR)
    
    file_name = "./data/txt.txt"
    fr = open(file_name, 'r', encoding="utf-8")
    fw = open(file_name, 'w', encoding="utf-8")
    fa = open(file_name, 'a', encoding="utf-8")
    
    
    def load_txt():
        print(fr.read())
    
    
    def read_txt_byte(n):
        print(fr.read(n))
    
    
    def read_line():
        print(fr.readline())
    
    def read_lines():
        print(fr.readlines())
        
    def write_txt(message):
        """
        :param message: 写入的数据
        :return: 返回写入的字符的长度
        """
        print(fw.write(message))
        
    def write_lines(*args):
        print(fa.writelines(args))
    
    
    def close_txt(self):
        fr.close()
        print("关闭读取文件句柄")
    
    if __name__ == "__main__":
        file_name_1 = './data/txt.txt'
        # write_txt("sjkjk")
        text_lists = "[1, 2, 3]"
        write_lines(text_lists)
        # print(ot.close_txt())
    
    
    None
    

    实用模板

    创建动态日志目录

    # 如果想要动态创建一个时间戳目录,来动态存放程序日志
    # 1.为了避免程序找不到目录尴尬, 首先确定当前程序的工作空间
    CURRENT_DIR = os.path.dirname(os.path.dirname("./data/text.txt"))
    print("当前程序的工作目录:%s" % CURRENT_DIR)
    # 2.生成时间戳
    nowTime = datetime.datetime.now().strftime("%Y-%m-%d_%H-%M-%S")
    print("程序执行的当前时间戳:%s" % nowTime)
    # 3.拼接存放日志的目录
    LOG_PATH = CURRENT_DIR + "./data/" + nowTime + "/"
    print(LOG_PATH)
    # 4.判断存放日志的目录LOG_PATH是否存在,不存在的话就就创建该目录
    isExists = os.path.exists(LOG_PATH)
    if not isExists:
        os.mkdir(LOG_PATH)
    
    当前程序的工作目录:.
    程序执行的当前时间戳:2020-04-12_14-17-41
    ../data/2020-04-12_14-17-41/
    
    
    
    ---------------------------------------------------------------------------
    
    FileNotFoundError                         Traceback (most recent call last)
    
    <ipython-input-36-3bbe55d41cd3> in <module>
         12 isExists = os.path.exists(LOG_PATH)
         13 if not isExists:
    ---> 14     os.mkdir(LOG_PATH)
    
    
    FileNotFoundError: [Errno 2] No such file or directory: '../data/2020-04-12_14-17-41/'
  • 相关阅读:
    [JSOI2007][BZOJ1031] 字符加密Cipher|后缀数组
    leetcode Flatten Binary Tree to Linked List
    leetcode Pascal's Triangle
    leetcode Triangle
    leetcode Valid Palindrome
    leetcode Word Ladder
    leetcode Longest Consecutive Sequence
    leetcode Sum Root to Leaf Numbers
    leetcode Clone Graph
    leetcode Evaluate Reverse Polish Notation
  • 原文地址:https://www.cnblogs.com/secoder/p/12906423.html
Copyright © 2011-2022 走看看