zoukankan      html  css  js  c++  java
  • python数据集处理

    一、如何删除数据里中的某一列

    1)打开文件open()

    2)for循环读取文件的每一行

    strip()--去除首尾的空格,split()--以空格分割数据.返回list数据

    /**

    这一部分对数据集进行操作

    **/

    3)用join()函数将列表数据转化成字符串

    4)将数据写入文件write()

    例:删除文件的第列数据。python实现代码如下# -*- coding: utf-8 -*"""

    Created on Mon Jun 15 09:44:49 2015
    
    @author: Chaofn
    """
    def loadDataSet(fileName):
        fr=open(fileName)
        fp=open('D:/01.test','w')
        """
        curLine的类型为list
        去除数据集中的第一列
        添加换行符
        将列表类型转化成字符串类型
        """
        for line in fr.readlines():
            curLine=line.strip().split(',')
            del curLine[0]
            curLine.append('
    ')
            strLine=' '.join(curLine)
    fp.write(strLine) fp.close()

    高亮代码还可以修改为:

    strLine=','.join(curLine).rstrip(',')
    strLine+=' '

    实例2:从文件中提出指定的列。文件部分截图如下:

    代码如下:

    # -*- coding: utf-8 -*-
    """
    Created on Sun Jun 21 13:03:19 2015
    
    @author: chaofan
    """
    fr=open('G:/1aba.txt')
    fw=open('G:/1aba_new.txt','w')
    for line in fr.readlines():    
        lineList=[]
        lineList.extend([line[7:10],line[11],line[13],line[35:38],'
    '])
        fw.write(' '.join(lineList))
    fw.close()
        

    提取的数据文件部分截图如下:

  • 相关阅读:
    docker创建tomcat容器
    【转载】张一鸣:为什么 BAT 挖不走我们的人才?
    Elastic认证考试,请先看这一篇
    vs code 初始化vue项目框架
    Idea集成git常用命令
    pxc搭建mysql集群
    mysql无限级分类
    Java面试题大全
    SpringMVC和Spring
    Redis高级特性
  • 原文地址:https://www.cnblogs.com/chaofn/p/4576764.html
Copyright © 2011-2022 走看看