zoukankan      html  css  js  c++  java
  • #小练习 从多个文件中提取* 分类: python 小练习 正则表达式 20130528 15:40 442人阅读 评论(0) 收藏

    import sys,glob,re,fileinput

    pattern = r'(\d{3})\D*(\d{3})\D*(\d{4})\D*(\d*)$'

    '''
    测试数据:
    800-555-1212
    800 555 1212
    800.555.1212
    (800) 555-1212
    1-800-555-1212
    800-555-1212-1234
    800-555-1212x1234
    800-555-1212 ext. 1234
    work 1-(800) 555.1212 #1234
    '''
    for line in fileinput.input(glob.glob(r'D:\test\*.txt')):#使用glob模块遍历txt文件,返回多个files
        line=line.strip()
        tag = re.search(pattern,line)

        if fileinput.isfirstline():#如果是文件第一行,输出文件名
            sys.stdout.write('--reading %s \n' % fileinput.filename())
        if tag:
            print fileinput.filelineno(),line,tag.groups()#找到匹配的内容,则输出行号、行数据、组


    fileinput.close() #关闭这个内部对象



    版权声明:本文为博主原创文章,未经博主允许不得转载。

  • 相关阅读:
    shell去重
    JDBC源码解析
    try catch finally
    URL
    域名与IP地址的联系与区别
    C++stack
    C++vector
    单链表常见面试题(C语言实现)
    数据库limit子句
    strcpy和memcpy的区别
  • 原文地址:https://www.cnblogs.com/think1988/p/4628179.html
Copyright © 2011-2022 走看看