zoukankan      html  css  js  c++  java
  • 通过pandas机器翻译数据集中提取英文数据(读取--切取--去重--保存)

    en    cn
    Hi.    嗨。
    Hi.    你好。
    Run.    你用跑的。
    Wait!    等等!
    Hello!    你好。
    I try.    让我来。
    I won!    我赢了。
    Oh no!    不会吧。
    Cheers!    乾杯!
    Got it?    你懂了吗?
    He ran.    他跑了。
    Hop in.    跳进来。
    I lost.    我迷失了。
    I quit.    我退出。
    I'm OK.    我沒事。
    Listen.    听着。
    No way!    不可能!
    No way!    没门!
    Really?    你确定?
    Try it.    试试吧。
    We try.    我们来试试。
    Why me?    为什么是我?
    Ask Tom.    去问汤姆。
    Be calm.    冷静点。
    Be fair.    公平点。
    Be kind.    友善点。
    Be nice.    和气点。
    Call me.    联系我。
    Call us.    联系我们。
    。。。。。。。。。。
     
    import pandas as pd
    print("-----------------------读取所有列行(前五行)--------------------------")
    data = pd.read_csv("./data/zh_en.csv", encoding="utf-8", sep="	")  # 每列	符号分隔
    print(data.head())
    print("---------------------------切取英文列--------------------------------")
    data_en = data.iloc[:20, 0:1].drop_duplicates()   # 第一列,前20行,并去重
    print(data_en)
    print("-------------------------切取的部分保存到新的文件--------------------------")
    data_en.to_csv("./data/en.csv",encoding="utf-8", index=False)       # 不保存索引值
     

    运行结果:

    -----------------------读取所有列行(前五行)--------------------------
           en     cn
    0     Hi.     嗨。
    1     Hi.    你好。
    2    Run.  你用跑的。
    3   Wait!    等等!
    4  Hello!    你好。
    ---------------------------切取英文列--------------------------------
             en
    0       Hi.
    2      Run.
    3     Wait!
    4    Hello!
    5    I try.
    6    I won!
    7    Oh no!
    8   Cheers!
    9   Got it?
    10  He ran.
    11  Hop in.
    12  I lost.
    13  I quit.
    14  I'm OK.
    15  Listen.
    16  No way!
    18  Really?
    19  Try it.
    -------------------------切取的部分保存到新的文件--------------------------
     
  • 相关阅读:
    u-boot 2011.09 调用kernel 的流程
    Delphi repeat Until 运用
    clientdataset的使用
    类型TTreeView.items.add 与 TTreeView.items.addchild有何区别?(10分)
    delphi中nil、null、UnAssigned区别
    操作TreeView(咏南工作室)
    delphi7 treeview + 数据库 实现动态节点维护
    Delphi Try Except 实例
    Delphi 中自定义异常及异常处理的一般方法
    Delphi中的异常处理(10种异常来源、处理、精确处理)
  • 原文地址:https://www.cnblogs.com/jumpkin1122/p/11509776.html
Copyright © 2011-2022 走看看