第一章 python3玩转机器学习
第二章 机器学习基础
安装:1.anaconda 2.pycharm
第三章 Jupyter Notebook,numpy,Matplotlib
1.jupyter notebook 魔法命令: %run %timeit %time
2.numpy基础: numpy.array numpy.dtype
3.numpy数组和矩阵:numpy.zeros() numpy.ones() numpy.full() numpy.arange() numpy.linspace() numpy.random.randint() numpy.random.random() numpy.random.normal()
查命令 numpy.random?
4.numpy数组基本操作:x为数组,求基本属性: x.ndim x.shape x.size
numpy.array数据访问: x[头:尾:步长, 头:尾:步长] subx=x[:2, :3].copy() A=x.reshape(2,5)
5.numpy数组的合并与分割:numpy.concatenate([ , ], axis = ) numpy.vstack() numpy.hstack() numpy.split( , [ ], axis= ) numpy.vsplit() numpy.hsplit()
6.numpy中的矩阵运算:X为矩阵 X*2 X/2 X%2 X+2 X-2 X**2 2/X numpy.abs(X) numpy.sin(X) numpy.cos(X) numpy.tan(X) numpy.exp(X) numpy.power(3,X) numpy.log(X) numpy.log2(X)
矩阵间的运算 A,B为两个2X2矩阵 矩阵乘法 A.dot(B) 转置 A.T
矩阵和向量的运算 V 为向量 A 为矩阵 V+A 向量和矩阵做加法 向量和矩阵中每一行相应的向量做加法 numpy.tile() 乘法 v.dot(A)
矩阵的逆 numpy.linalg.inv(A) 逆矩阵和原矩阵相乘得单位矩阵,方阵才有逆矩阵 伪逆矩阵 numpy.linalg.pinv(A) 伪逆矩阵和原矩阵相乘得到的也是一个方阵
7.numpy中的聚合运算:X为一维数组, numpy.sum(X) numpy.min(X) numpy.max(X) numpy.sum(X, axis= ) numpy.prod(X+1) numpy.mean(X) numpy.median(X) numpy.percentile(X, q = 50)
numpy.var(X) numpy.std(X) axis=0 沿着行的方向 axis=1 沿着列的方向
8.numpy中的arg运算:X为矩阵或向量, numpy.argmin(X) numpy.argmax(X) numpy.sort(X, axis = ) numpy.argsort(X, axis = ) numpy.partition(X, 3) 快排 numpy.argpartition(X, 3, axis = )
9.numpy中Fancy Indexing:row = numpy.array([0,1,2]) col = numpy.array([1,2,3]) X[row, col] numpy.sum(X <= 3) numpy.count_nonzero(X <= 3)
numpy.any(X == 0) numpy.all(X > 0) 返回值为True/Fasle numpy.sum(X % 2 == 0, axis = )
numpy.sum((X > 3) & (X < 10)) 这是位运算符! 条件运算符连接两个条件(布尔值),结果也是一个布尔值。而这里连接的是两个数组,将这两个数组按照相应的索引分别进行与或运算, 得到结果也是一个数组。
10.更加高级的表格处理用pandas库,因为有datafree数据结构,通常先用pandas对数据进行预处理,然后将pandas数据转成numpy矩阵,再送给机器学习算法
11.matplotlib基础(可视化):import matplotlib as mpl import matplotlib.pyplot as plt
plt.plot(x, y, color=" " , linestyle=" " , label=" " ) plt.show() plt.xlim( , ) plt.ylim( , ) plt.axis([ , , , ]) plt.xlabel(" ") plt.ylabel(" ") plt.title(" ")
散点图 plt.scatter(x, y, color=" ", marker=" ", alpha= )
12.数据加载:from sklearn import datasets