zoukankan      html  css  js  c++  java
  • Numpy存字符串

    # -*- coding: utf-8 -*-
    import numpy as np
    
    student = np.dtype({'names':['name', 'age', 'weight'], 'formats': ['S32', 'i', 'f']}, align = True)
    a = np.array([("Zhang", 32, 65.5), ("Wang", 24, 55.2)], dtype = student)
    a
    Out[48]: 
    array([(b'Zhang', 32,  65.5       ), (b'Wang', 24,  55.20000076)],
          dtype={'names':['name','age','weight'], 'formats':['S32','<i4','<f4'], 'offsets':[0,32,36], 'itemsize':40, 'aligned':True})

    DataFrame

    一个Datarame表示一个表格,类似电子表格的数据结构,包含一个经过排序的列表集,它们没一个都可以有不同的类型值(数字,字符串,布尔等等)。Datarame有行和列的索引;它可以被看作是一个Series的字典(每个Series共享一个索引)。与其它你以前使用过的(如Rdata.frame )类似Datarame的结构相比,在DataFrame里的面向行和面向列的操作大致是对称的。在底层,数据是作为一个或多个二维数组存储的,而不是列表,字典,或其它一维的数组集合。

    因为DataFrame在内部把数据存储为一个二维数组的格式,因此你可以采用分层索引以表格格式来表示高维的数据。分层索引是pandas中许多更先进的数据处理功能的关键因素。

    构建DataFrame

    image

    字典或NumPy数组

    最常用的一个是用一个相等长度列表的字典或NumPy数组:

    import pandas as pd

    data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
            'year': [2000, 2001, 2002, 2001, 2002],
            'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
    frame = DataFrame(data)
    frame[‘next'] = 0 # 增加一列next,默认值为0

    frame.to_csv("C:\mytest.csv")


     

    参考:http://blog.csdn.net/pipisorry/article/details/18010307

  • 相关阅读:
    设计模式的原则
    命令模式
    访问者模式
    策略模式
    外观模式
    组合模式
    原型模式
    合并有序数组
    判断二叉树是否对称
    中序遍历二叉树
  • 原文地址:https://www.cnblogs.com/luhouxiang/p/7081653.html
Copyright © 2011-2022 走看看