zoukankan      html  css  js  c++  java
  • 遍历两个pandas列 iterate through two pandas columns

    使用for filePath,content in corpos.itertuples(index=False)遍历两行数据

    问题:在遍历pandas进行分词时,并将修改后的文本写入源文件

    一开始使用for content in corpos['content'],

    虽然content有遍历,但是filePath在for循环中,始终停留在corpos的最后一行filepath,并未能遍历成功。

    经修改后:

    #-------------------------------------------------建立corpos
    
    corpos = pandas.DataFrame(columns=['filePath','content']
    
    #-------------中间corpos存入数据的过程省略
    
    #-------------分词并修改文本
    
    t='/'
    for filePath,content in corpos.itertuples(index=False):
      f = codecs.open(filePath,'r','utf-8')
      cont=f.read()
      f.close()
      gai=''
      segs=jieba.cut(content)
      for seg in segs:
        if seg ==' ' or seg =="
    " or seg==' ' or seg=='':
        gai=gai+seg
      else:
        gai=gai+seg+t
      cont=gai[2:]
      f = codecs.open(filePath,'w','utf-8')
      f.write(cont)
      f.flush()
      f.close()

    参考链接:http://stackoverflow.com/questions/15125343/how-to-iterate-through-two-pandas-columns

    生活不易,本人有意向做数据分析兼职或python在线辅导,如有需要请联系qq号1334832194。

  • 相关阅读:
    .Net需要掌握的知识
    图片轮播
    vector
    2016ACM青岛区域赛题解
    总是有一个程序的bug没找到
    poj1001_Exponentiation_java高精度
    poj2236_并查集_Wireless Network
    poj1703_Find them, Catch them_并查集
    poj2492_A Bug's Life_并查集
    poj1182食物链_并查集_挑战程序设计竞赛例题
  • 原文地址:https://www.cnblogs.com/chenyaling/p/5511773.html
Copyright © 2011-2022 走看看