zoukankan      html  css  js  c++  java
  • python数据集处理

    一、如何删除数据里中的某一列

    1)打开文件open()

    2)for循环读取文件的每一行

    strip()--去除首尾的空格,split()--以空格分割数据.返回list数据

    /**

    这一部分对数据集进行操作

    **/

    3)用join()函数将列表数据转化成字符串

    4)将数据写入文件write()

    例:删除文件的第列数据。python实现代码如下# -*- coding: utf-8 -*"""

    Created on Mon Jun 15 09:44:49 2015
    
    @author: Chaofn
    """
    def loadDataSet(fileName):
        fr=open(fileName)
        fp=open('D:/01.test','w')
        """
        curLine的类型为list
        去除数据集中的第一列
        添加换行符
        将列表类型转化成字符串类型
        """
        for line in fr.readlines():
            curLine=line.strip().split(',')
            del curLine[0]
            curLine.append('
    ')
            strLine=' '.join(curLine)
    fp.write(strLine) fp.close()

    高亮代码还可以修改为:

    strLine=','.join(curLine).rstrip(',')
    strLine+=' '

    实例2:从文件中提出指定的列。文件部分截图如下:

    代码如下:

    # -*- coding: utf-8 -*-
    """
    Created on Sun Jun 21 13:03:19 2015
    
    @author: chaofan
    """
    fr=open('G:/1aba.txt')
    fw=open('G:/1aba_new.txt','w')
    for line in fr.readlines():    
        lineList=[]
        lineList.extend([line[7:10],line[11],line[13],line[35:38],'
    '])
        fw.write(' '.join(lineList))
    fw.close()
        

    提取的数据文件部分截图如下:

  • 相关阅读:
    Redis学习笔记
    Springboot + Tomcat跑项目出现端口被占用的问题
    按层打印二叉树
    打印二叉树的镜像——剑指offer
    判断树的子结构——剑指offer
    实习半个月的感想
    使用KMP算法判断是否为旋转词
    微信双开
    win10 右键添加cmd当前目录打开
    勒索邮件
  • 原文地址:https://www.cnblogs.com/chaofn/p/4576764.html
Copyright © 2011-2022 走看看