zoukankan      html  css  js  c++  java
  • 遍历两个pandas列 iterate through two pandas columns

    使用for filePath,content in corpos.itertuples(index=False)遍历两行数据

    问题:在遍历pandas进行分词时,并将修改后的文本写入源文件

    一开始使用for content in corpos['content'],

    虽然content有遍历,但是filePath在for循环中,始终停留在corpos的最后一行filepath,并未能遍历成功。

    经修改后:

    #-------------------------------------------------建立corpos
    
    corpos = pandas.DataFrame(columns=['filePath','content']
    
    #-------------中间corpos存入数据的过程省略
    
    #-------------分词并修改文本
    
    t='/'
    for filePath,content in corpos.itertuples(index=False):
      f = codecs.open(filePath,'r','utf-8')
      cont=f.read()
      f.close()
      gai=''
      segs=jieba.cut(content)
      for seg in segs:
        if seg ==' ' or seg =="
    " or seg==' ' or seg=='':
        gai=gai+seg
      else:
        gai=gai+seg+t
      cont=gai[2:]
      f = codecs.open(filePath,'w','utf-8')
      f.write(cont)
      f.flush()
      f.close()

    参考链接:http://stackoverflow.com/questions/15125343/how-to-iterate-through-two-pandas-columns

    生活不易,本人有意向做数据分析兼职或python在线辅导,如有需要请联系qq号1334832194。

  • 相关阅读:
    加签验签
    .net core三个生命周期
    List,IList,IEnumerable的区别
    IHttpClientFactory 模拟http请求
    TDengine在Linux下的安装
    Linux环境下安装jdk
    在 React 中使用 JSX 的好处
    React介绍(讲人话)
    React是什么,为什么要使用它?
    mac系统下给文件夹加密方法
  • 原文地址:https://www.cnblogs.com/chenyaling/p/5511773.html
Copyright © 2011-2022 走看看