zoukankan      html  css  js  c++  java
  • Python文件读取和数据处理

    一.python文件读取

    1.基本操作

    读取文件信息时要注意文件编码,文件编码有UFT-8、ASCII或UTF-16等。

    不过在python中最为常用的是UTF-8,所以如果不特别说明就默认UTF-8编码。

    读取文件可以使用 rt 模式下的 open()函数,示例如下:

    #以字符串的形式读取一个文件
    with open('somefile.txt', 'rt') as f:
        data = f.read()
        
    
    with open('somefile.txt', 'rt') as f:
        for line in file:                           #逐行处理数据     
            #prossce line

    2.文件与路径

    文件有两个关键属性:“文件名”(通常写成一个单词)和“路径”。路径指明了文件在计算机上的位置。

    例如,我的 Windows 10笔记本上有一个文件名为projects.docx,它的路径在C:\Users\Documents。文件名中,最后一个句点之后的部分称为文件的“扩展名”,它指出了文件的类型。project.docx 是一个Word 文档,Users和Documents 都是指“文件夹”(也成为目录)。

    有两种方法指定一个文件路径。
    • “绝对路径”,总是从根文件夹开始。
    • “相对路径”,它相对于程序的当前工作目录。(少用)

    #-*-encoding:uft-8-*-
    import os
    
    os.path.abs('C:\\user\\soft\\python')       #绝对路径
    
    os.ispath('C:..\\python')       #相对路径

    只有用绝对路径操作

    #交互模式下
    >>> import os
    >>> path = '/Users/beazley/Data/data.csv'
    >>> # Get the last component of the path
    >>> os.path.basename(path)
    'data.csv'
    >>> # Get the directory name
    >>> os.path.dirname(path)
    '/Users/beazley/Data'
    >>> # Join path components together
    >>> os.path.join('tmp', 'data', os.path.basename(path))
    'tmp/data/data.csv'
    >>> # Expand the user's home directory
    >>> path = '~/Data/data.csv'
    >>> os.path.expanduser(path)
    '/Users/beazley/Data/data.csv'
    >>> # Split the file extension
    >>> os.path.splitext(path)
    ('~/Data/data', '.csv')
    >>>

     

  • 相关阅读:
    分享
    分享
    分享
    分享
    基于加权相似度的相关性排序算法的研究 中国学术期刊网络出版总库
    分享
    基于用户点击行为的数字图书搜索系统研究与实现 中国优秀硕士学位论文全文数据库
    分享
    垂直搜索引擎分类索引系统的设计与实现 中国优秀硕士学位论文全文数据库
    基于相关反馈技术的检索结果排序模型研究 中国优秀硕士学位论文全文数据库
  • 原文地址:https://www.cnblogs.com/justlikecode/p/10783704.html
Copyright © 2011-2022 走看看