zoukankan      html  css  js  c++  java
  • 遍历两个pandas列 iterate through two pandas columns

    使用for filePath,content in corpos.itertuples(index=False)遍历两行数据

    问题:在遍历pandas进行分词时,并将修改后的文本写入源文件

    一开始使用for content in corpos['content'],

    虽然content有遍历,但是filePath在for循环中,始终停留在corpos的最后一行filepath,并未能遍历成功。

    经修改后:

    #-------------------------------------------------建立corpos
    
    corpos = pandas.DataFrame(columns=['filePath','content']
    
    #-------------中间corpos存入数据的过程省略
    
    #-------------分词并修改文本
    
    t='/'
    for filePath,content in corpos.itertuples(index=False):
      f = codecs.open(filePath,'r','utf-8')
      cont=f.read()
      f.close()
      gai=''
      segs=jieba.cut(content)
      for seg in segs:
        if seg ==' ' or seg =="
    " or seg==' ' or seg=='':
        gai=gai+seg
      else:
        gai=gai+seg+t
      cont=gai[2:]
      f = codecs.open(filePath,'w','utf-8')
      f.write(cont)
      f.flush()
      f.close()

    参考链接:http://stackoverflow.com/questions/15125343/how-to-iterate-through-two-pandas-columns

    生活不易,本人有意向做数据分析兼职或python在线辅导,如有需要请联系qq号1334832194。

  • 相关阅读:
    Linux学习总结(18)——Linux使用init命令关机、重启、切换模式
    iOS autorelease使用详解
    iOS xib的使用详解
    iOS ASI--缓存
    iOS ASI--其他用法
    iOS ASI--管理多个请求
    iOS ASI--文件上传
    iOS ASI--文件下载
    iOS ASI--POST请求
    iOS ASI--GET请求
  • 原文地址:https://www.cnblogs.com/chenyaling/p/5511773.html
Copyright © 2011-2022 走看看