# 生成numpy数组的方法array() array()生成的是二维数组,非常方便统计
1 import csv
2
3 import numpy
4
5 # arr1 = numpy.zeros(5)
6 #
7 # arr2 = numpy.zeros([5,3],dtype=int)
8 #
9 # print(arr1)
10 # print(arr1)
11
12 # 生成numpy数组的方法array() array()生成的是二维数组,非常方便统计
13 import pandas as pandas
14
15 arr6 = numpy.array([['zhang',22,172],['li','23',175],['xi',25,173]]) #输出一个三行三列的数组
16
17 print(arr6)
1 [['zhang' '22' '172']
2 ['li' '23' '175']
3 ['xi' '25' '173']]
# 生成numpy数组的方法arange() 参数为开始位置,结束位置,步长
1 # 生成numpy数组的方法arange() 参数为开始位置,结束位置,步长
2
3 arr3 = numpy.arange(6)
4
5 arr4 = numpy.arange(2,8.1,0.5) #arange的操作对象不包括结束位置
6
7 print(arr3)
8
9 print(arr4)
1 [0 1 2 3 4 5]
2 [2. 2.5 3. 3.5 4. 4.5 5. 5.5 6. 6.5 7. 7.5 8. ]
# 生成numpy数组的方法linspace() 参数为开始位置,结束位置,输出元素个数 endpoint=False表示不包括结束值本身
1 # 生成numpy数组的方法linspace() 参数为开始位置,结束位置,输出元素个数 endpoint=False表示不包括结束值本身
2 arr5= numpy.linspace(0,10,11,endpoint=False)
3
4 print(arr5)
1 [0. 0.90909091 1.81818182 2.72727273 3.63636364 4.54545455
2 5.45454545 6.36363636 7.27272727 8.18181818 9.09090909]
# pandas使用,根据二维数组,DataFrame()输出dataframe
1 arr6 = numpy.array([['zhang',22,172],['li','23',175],['xi',25,173]]) #输出一个三行三列的数组
2 df = pandas.DataFrame(arr6,index=[1,2,3],columns=['name','old','height']) #参数分别为输入二维数组,index设置行编号,默认为1,2,3.。。column设置列名
1 arr7 = {'name':['zhang','li','xi'],'old':[22,23,25],'height':[172,174,173]} #也能根据字典类型数据创建dataframe
2 df2 = pandas.DataFrame(arr7,index=[1,2,3],columns=['name','old','height']) #参数分别为输入二维数组,index设置行编号,默认为1,2,3.。。column设置列名
# 第三种方法是直接从CSV文件创建
1 # 第三种方法是直接从CSV文件创建
2 with open('test_dataframe.csv','w',encoding="utf-8",newline='') as wd:
3 wcsv = csv.writer(wd)
4
5 wcsv.writerow(['name','old','height'])
6 i = 3
7 for x in range(i):
8 wcsv.writerow(["zhang",'22','172'])
9 wd.close()
10
11
12 df3 = pandas.read_csv('test_dataframe.csv') #直接从CSV文件scdataframe
按指定格式输出dataframe
1 df3.index = [1,2,3] #指定index输出
2
3 df3['address'] = ['shengzhen','nanjing','shanghai'] #添加一列输出
4
5 print(df3.loc[1]) #read_csv对象可以只输出某一行的值
6
7 print(df3.name) #单独输出某一列的值