zoukankan html css js c++ java

Python os.walk文件遍历用法【转】

python中os.walk是一个简单易用的文件、目录遍历器，可以帮助我们高效的处理文件、目录方面的事情。

1.载入
要使用os.walk,首先要载入该函数

可以使用以下两种方法

import os
from os import walk

2.使用

os.walk的函数声明为:

walk(top, topdown=True, onerror=None, followlinks=False)

参数

top 是你所要便利的目录的地址
topdown 为真，则优先遍历top目录，否则优先遍历top的子目录(默认为开启)
onerror 需要一个 callable 对象，当walk需要异常时，会调用
followlinks 如果为真，则会遍历目录下的快捷方式(linux 下是 symbolic link)实际所指的目录(默认关闭)

os.walk 的返回值是一个生成器(generator),也就是说我们需要不断的遍历它，来获得所有的内容。

每次遍历的对象都是返回的是一个三元组(root,dirs,files)

root 所指的是当前正在遍历的这个文件夹的本身的地址
dirs 是一个 list ，内容是该文件夹中所有的目录的名字(不包括子目录)
files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)

如果topdown 参数为真，walk 会遍历top文件夹，与top文件夹中每一个子目录。

举个例子

如果我们有如下的文件结构:

      a ->   b   ->   1.txt,  2.txt
             c   ->   3.txt
             d   ->   
           4.txt
           5.txt

for (root, dirs, files) in os.walk('a'):
    #第一次运行时，当前遍历目录为 a
    所以 root == 'a'
         dirs == [ 'b', 'c', 'd']
         files == [ '4.txt', '5.txt']
    
    。。。

    # 接着遍历 dirs 中的每一个目录
    b:  root  = 'a\b'
        dirs  = []
        files = [ '1.txt', '2.txt']
    
    # dirs为空，返回
    # 遍历c
    c:  root  = 'a\c'
        dirs  = []
        files = [ '3.txt' ]
    
    PS : 如果想获取文件的全路径，只需要 
    for f in files:
        path = os.path.join(root,f)
    
    # 遍历d
    d:  root  = 'a\b'
        dirs  = []
        files = []

    遍历完毕，退出循环

3.简单的例子

保持目录 a 的目录结构，在 b 中创建对应的文件夹,并把a中所有的文件加上后缀 _bak

import os

Root = 'a'
Dest = 'b'

for (root, dirs, files) in os.walk(Root):
    new_root = root.replace(Root, Dest, 1)
    if not os.path.exists(new_root):
        os.mkdir(new_root)
    
    for d in dirs:
        d = os.path.join(new_root, d)
        if not os.path.exists(d):
            os.mkdir(d)
    
    for f in files:
        # 把文件名分解为 文件名.扩展名
        # 在这里可以添加一个 filter，过滤掉不想复制的文件类型，或者文件名
        (shotname, extension) = os.path.splitext(f)
        # 原文件的路径
        old_path = os.path.join(root, f)
        new_name = shotname + '_bak' + extension
        # 新文件的路径
        new_path = os.path.join(new_root, new_name)
        try:
            # 复制文件
            open(new_path, 'wb').write(open(old_path, 'rb').read())
        except IOError as e:
            print(e)

转自
作者：MikuLovely
链接：https://www.jianshu.com/p/bbad16822eab
來源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

#!/usr/bin/python
#coding=utf-8
import os
def dirlist(path):
    for root,dirs,files in os.walk(path):  #将os.walk在元素中提取的值，分别放到root（根目录），dirs（目录名），files（文件名）中。
        for file in files:
            print os.path.join(root,file)  #根目录与文件名组合，形成绝对路径。
if __name__=='__main__':
    path = '/test'
    dirlist(path)

执行结果：

知识点：

代码中的root为str类型，dirs为list类型，files为list类型

当root为/test时，dirs列表中是/test下的目录，files列表是/test下的文件

当root为/test/aa时，dirs列表则为/test/aa下的目录，fiels列表是/test/aa下的文件

心得：

#!/usr/bin/python
import os,os.path
def visit(arg,dirname,names):
    for filespath in names:
        print os.path.join(dirname,filespath)
if __name__=='__main__':
    path = '/test'
    os.path.walk(path,visit,())

关于os.path.walk不清楚，暂且标记。

转自

自学python之——os.walk 查找目录下的文件 - CSDN博客 https://blog.csdn.net/happylife_haha/article/details/44566975

#!/usr/bin/python
# -*- coding: gbk -*-
  
# os.walk()的使用  
import os  
  
# 枚举dirPath目录下的所有文件  
  
def main():  
#begin  
    fileDir = "F:" + os.sep + "kams"     # 查找F:aaa 目录下    
    for root, dirs, files in os.walk(fileDir):  
    #begin  
        for dir in dirs:  
        #begin  
            print(os.path.join(root, dir))  
        #end  
        for file in files:  
        #begin  
            print(os.path.join(root, file))  
        #end  
    #end  
    os.system("pause")  
#end  
  
if __name__ == '__main__':  
#begin  
    main()  
#end

执行结果

目录：
F:kams.svn
F:kamswar119
F:kamswar120
文件：
F:kams.svnpristine
F:kams.svn	mp
F:kams.svnentries
F:kams.svnformat
F:kams.svnwc.db
F:kams.svnwc.db-journal
F:kams.svnpristine12
F:kams.svnpristine96
F:kams.svnpristine9a
F:kams.svnpristine1212b99bf8ef5342805dab3cb5da02650ea50d7994.svn-base
F:kams.svnpristine9696c5938bf3f1c89e3da195fc7839744a8b01822a.svn-base
F:kams.svnpristine9a9a71415db2b420aa1d6eae9166b5128aaab4c402.svn-base
F:kamswar119czx.py
F:kamswar119zabbix_server_modify.sh
F:kamswar120czx.py
F:kamswar120	est.py
F:kamswar120zabbix_server_modify.sh

转自

Python os.walk文件遍历 - 星星故乡 - 博客园 https://www.cnblogs.com/lincj/p/5617605.html

python 简单示例说明os.walk和os.path.walk的不同

import os,os.path
def func(arg,dirname,names):
    for filespath in names:
        print os.path.join(dirname,filespath)
 
if __name__=="__main__":
    print "==========os.walk================"
    index = 1
    for root,subdirs,files in os.walk("c:\test"):
        print "第",index,"层"
        index += 1
        for filepath in files:
            print os.path.join(root,filepath)
        for sub in subdirs:
            print os.path.join(root,sub)
    print "==========os.path.walk================"
    os.path.walk("c:\test",func,())

结果如下：

总结：

（1）两者都能实现达到同一个效果

（2）在python3中，os.path.walk要被os.walk取代了，大家尽量用os.walk

（3）os.walk明显比os.path.walk要简洁一些，起码它不需要回调函数，遍历的时候一目了然：root，subdirs，files

（4）可能你在烦恼，os.path.walk的第三个参数arg有什么用，好吧，当你os.path.walk()赋值给arg的时候，你就可以在第二个参数对应的func中用arg了

转自

python 简单示例说明os.walk和os.path.walk的不同 - CSDN博客 https://blog.csdn.net/emaste_r/article/details/12442675

查看全文

相关阅读:
[转] JavaScript中的字符串操作
 关于多线程学习的笔记
 [转] jquery 使用方法
 ubuntu下安装tomcat和配置mysql
[转] 使用CodeViz生成C/C++函数调用关系图
 [转] java中的匿名内部类总结
 [转] Java中继承thread类与实现Runnable接口的区别
 字符串指针、调试---师傅传授栈中指针地址与堆中数据地址标准写法
 maven 阿里云节点，速度快
 解决IntelliJ IDEA 创建Maven项目速度慢问题 DarchetypeCatalog

原文地址：https://www.cnblogs.com/paul8339/p/9667250.html