zoukankan      html  css  js  c++  java
  • 遍历两个pandas列 iterate through two pandas columns

    使用for filePath,content in corpos.itertuples(index=False)遍历两行数据

    问题:在遍历pandas进行分词时,并将修改后的文本写入源文件

    一开始使用for content in corpos['content'],

    虽然content有遍历,但是filePath在for循环中,始终停留在corpos的最后一行filepath,并未能遍历成功。

    经修改后:

    #-------------------------------------------------建立corpos
    
    corpos = pandas.DataFrame(columns=['filePath','content']
    
    #-------------中间corpos存入数据的过程省略
    
    #-------------分词并修改文本
    
    t='/'
    for filePath,content in corpos.itertuples(index=False):
      f = codecs.open(filePath,'r','utf-8')
      cont=f.read()
      f.close()
      gai=''
      segs=jieba.cut(content)
      for seg in segs:
        if seg ==' ' or seg =="
    " or seg==' ' or seg=='':
        gai=gai+seg
      else:
        gai=gai+seg+t
      cont=gai[2:]
      f = codecs.open(filePath,'w','utf-8')
      f.write(cont)
      f.flush()
      f.close()

    参考链接:http://stackoverflow.com/questions/15125343/how-to-iterate-through-two-pandas-columns

    生活不易,本人有意向做数据分析兼职或python在线辅导,如有需要请联系qq号1334832194。

  • 相关阅读:
    学期总结
    Sprint 2(第一天)
    学期总结
    实验四、主存空间的分配和回收
    阅读《构建之法》与链接有感.
    《构建之法》八、九、十章读后感
    Scrum领取任务
    实验三、进程调度模拟程序实验
    《构建之法》6-7章读后感
    实验二 作业调度模拟程序
  • 原文地址:https://www.cnblogs.com/chenyaling/p/5511773.html
Copyright © 2011-2022 走看看