zoukankan      html  css  js  c++  java
  • 遍历两个pandas列 iterate through two pandas columns

    使用for filePath,content in corpos.itertuples(index=False)遍历两行数据

    问题:在遍历pandas进行分词时,并将修改后的文本写入源文件

    一开始使用for content in corpos['content'],

    虽然content有遍历,但是filePath在for循环中,始终停留在corpos的最后一行filepath,并未能遍历成功。

    经修改后:

    #-------------------------------------------------建立corpos
    
    corpos = pandas.DataFrame(columns=['filePath','content']
    
    #-------------中间corpos存入数据的过程省略
    
    #-------------分词并修改文本
    
    t='/'
    for filePath,content in corpos.itertuples(index=False):
      f = codecs.open(filePath,'r','utf-8')
      cont=f.read()
      f.close()
      gai=''
      segs=jieba.cut(content)
      for seg in segs:
        if seg ==' ' or seg =="
    " or seg==' ' or seg=='':
        gai=gai+seg
      else:
        gai=gai+seg+t
      cont=gai[2:]
      f = codecs.open(filePath,'w','utf-8')
      f.write(cont)
      f.flush()
      f.close()

    参考链接:http://stackoverflow.com/questions/15125343/how-to-iterate-through-two-pandas-columns

    生活不易,本人有意向做数据分析兼职或python在线辅导,如有需要请联系qq号1334832194。

  • 相关阅读:
    LoggingApplicationListener
    Repeated meta-data items
    善待Redis里的数据--Unable to validate object
    mysql启动的四种方式
    mybatis操作动态表+动态字段+存储过程
    VMware 11安装Mac OS X 10.10
    JMS开源比较
    VMware 11安装Mac OS X 10.10
    网页设计的标准尺寸
    FullPage.js
  • 原文地址:https://www.cnblogs.com/chenyaling/p/5511773.html
Copyright © 2011-2022 走看看