zoukankan      html  css  js  c++  java
  • python数据集处理

    一、如何删除数据里中的某一列

    1)打开文件open()

    2)for循环读取文件的每一行

    strip()--去除首尾的空格,split()--以空格分割数据.返回list数据

    /**

    这一部分对数据集进行操作

    **/

    3)用join()函数将列表数据转化成字符串

    4)将数据写入文件write()

    例:删除文件的第列数据。python实现代码如下# -*- coding: utf-8 -*"""

    Created on Mon Jun 15 09:44:49 2015
    
    @author: Chaofn
    """
    def loadDataSet(fileName):
        fr=open(fileName)
        fp=open('D:/01.test','w')
        """
        curLine的类型为list
        去除数据集中的第一列
        添加换行符
        将列表类型转化成字符串类型
        """
        for line in fr.readlines():
            curLine=line.strip().split(',')
            del curLine[0]
            curLine.append('
    ')
            strLine=' '.join(curLine)
    fp.write(strLine) fp.close()

    高亮代码还可以修改为:

    strLine=','.join(curLine).rstrip(',')
    strLine+=' '

    实例2:从文件中提出指定的列。文件部分截图如下:

    代码如下:

    # -*- coding: utf-8 -*-
    """
    Created on Sun Jun 21 13:03:19 2015
    
    @author: chaofan
    """
    fr=open('G:/1aba.txt')
    fw=open('G:/1aba_new.txt','w')
    for line in fr.readlines():    
        lineList=[]
        lineList.extend([line[7:10],line[11],line[13],line[35:38],'
    '])
        fw.write(' '.join(lineList))
    fw.close()
        

    提取的数据文件部分截图如下:

  • 相关阅读:
    BZOJ 1057 悬线法求最大01矩阵
    POJ 2248
    SPOJ
    51NOD
    2017-2018 ACM-ICPC, NEERC, Moscow Subregional Contest J. Judging the Trick
    POJ 1379 模拟退火
    POJ 2420 模拟退火
    Frontend 事后诸葛亮
    【Frontend】Alpha Review 展示博客
    ASE19 团队项目 alpha 阶段 Frontend 组 scrum5 记录
  • 原文地址:https://www.cnblogs.com/chaofn/p/4576764.html
Copyright © 2011-2022 走看看