zoukankan      html  css  js  c++  java
  • 去除文件中的重复元素后写入文件 分类: python 小练习 open()文件读写 2013-12-03 11:21 356人阅读 评论(0) 收藏

    去除文件中的重复元素后写入文件


    #coding:utf-8
    import fileinput
    import re
    
    #只包含单行的数据文件
    f=open(r'D:snowDocumentexcludes.txt','w')
    
    #匹配行内容中包含 '-'的字符
    p2=re.compile('-')
    
    def main():
        l=[]
        for line in fileinput.input(r'D:snowDocumentoriginal.txt'):
            if re.search(p2,line) :
                line = line.split()[0].split('-')[1]
    
                line = line.replace('(','')
                line =line.replace(')','')
                print line.decode('utf-8')
                l.append(line)
    ##            line.replace('|')
    ##    print len(l)
    
        #使用集合去除列表中的重复元素后写入文件
        l=set(l)
    
        f.write('|'.join(l))
    
        f.close()
    
    
    if __name__ == '__main__':
        main()
    


    版权声明:本文为博主原创文章,未经博主允许不得转载。

  • 相关阅读:
    hbase
    pig
    flume
    sqoop
    eclipse 提交作业到JobTracker Hadoop的数据类型要求必须实现Writable接口
    hadoop 8步走
    ssh原理
    MapReduce基础
    Arduino数字贴片磁感应传感器(收藏篇)
    去掉input回车自动提交
  • 原文地址:https://www.cnblogs.com/think1988/p/4628003.html
Copyright © 2011-2022 走看看