参考链接:https://blog.csdn.net/qq_16234613/article/details/64217337
1、describe():该函数主要对数据进行一个基本的统计,输出数据的总数量(count)、平均值(mean)、标准差(std)、最小值和最大值(min、max)、分位数(四分位)
2、sort_values(by="列名/行名"):对该列或该行进行值排序
对numpy中数组的操作:
1、numpy.tile(a,(1,2)) :该函数将a扩展成1行2列,如
2、numpy.argsort(a) 或者 a.argsort():对数组进行升序排序,返回索引值。降序的话可以给a加负号。
3、a.sum(axis=1) :a为数组,sum(axis=1)表示每行的数相加,平时不加axis则默认为0,为0表示每列的数相加。
字典的操作
1、sorted对字典或者列表的后面一个值排序,
sorted(dic.items() , key=lambda x:x[1] , reverse=True )
sorted (dic.items(),key=operator.itemgetter(1) ,reverse=True)
2、字典的get函数:
dic.get(key,0)相当于if ……else ,若key在字典dic中则返回dic[key]的值,若不在则返回0。
读取文件的函数:
1、os.listdir() 方法:用于返回指定的文件夹包含的文件或文件夹的名字的列表。这个列表以字母顺序。 它不包括 '.' 和'..' 即使它在文件夹中。