在c语言中,我们可以使用关键字struct定义结构类型。和c语言一样,numpy也可以创建结构定义,这样可以很方便的读取二进制的C语言结构数组,将其转换为numpy数组对象,假设我们定义的结构数组如下(C语言描述):
struct Person{ char name[30]; int age; float weight; };
我们在python中可以自定义类型如下:
>>> persontype = np.dtype({ 'names':['name','age','weight'], 'formats':['S30','i','f']},align = True)
>>> a = np.array([('Liming',24,63.9),('Mike',15,67.),('Jan',34,45.8)],dtype = persontype)
>>> a
array([('Liming', 24, 63.900001525878906), ('Mike', 15, 67.0),
('Jan', 34, 45.79999923706055)],
dtype={'names':['name','age','weight'], 'formats':['S30','<i4','<f4'], 'offsets':[0,32,36], 'itemsize':40, 'aligned':True})
首先创建了dtype对象persontype,它的结构类型是一个藐视各字段的字典,该字典有两个键:‘names’和'format'.每个键对应的值是一个列表,‘names’定义结构体中每个字段的名称,'formats’定义每个字段的数据类型。我们使用的类型如下:
‘S30’:表示长度为30的字符串类型,由于结构体中每个元素的大小固定,所以需要指定长度。
‘i’:32位的整数类型,相当于np.int32
'f':32位单精度浮点数,相当于np.float32
然后通过np.array()创建数组,通过dtype指定元素类型为persontype
还可以使用包含该多个元组的列表来描述数据类型,刑如:(字段名,数据类型)
>> persontype = np.dtype([('name','|S30'),('age','<i8'),('weight','<f8')]) >>> a = np.array([('Liming',24,63.9),('Mike',15,67.),('Jan',34,45.8)],dtype = persontype) >>> a array([('Liming', 24L, 63.9), ('Mike', 15L, 67.0), ('Jan', 34L, 45.8)], dtype=[('name', 'S30'), ('age', '<i8'), ('weight', '<f8')])
|:忽略字节顺序
<:低位字节在前
>:高位字节在前
结构体数组的取值方式和一般数组差不多,可以通过下标取得元素:
>>> a[0] ('Liming', 24L, 63.9) >>> a[0:-1] array([('Liming', 24L, 63.9), ('Mike', 15L, 67.0)], dtype=[('name', 'S30'), ('age', '<i8'), ('weight', '<f8')])
我们可以使用字段名作为下标获取对于的值
>>> a['name'] array(['Liming', 'Mike', 'Jan'], dtype='|S30') >>> a['age'] array([24, 15, 34], dtype=int64) >>> a['weight'] array([ 63.9, 67. , 45.8])
可以通过 a.tostring()或者a.tofile()方法可以将数组a以二进制方式写成字符串或者写入文件