1.SVM(Support Vector Method)
通过在属于两个不同类别的两组数据点之间找到良好决策边界来解决分类问题。决策边界可以看作是一条直线或一个平面,将训练数据划分为两块空间,分别对应于两个类别。
2.决策树(Decision tree)
类似于流程图,可以对输入数据点进行分类或根据给定输入来预测输出值。
3.随机森林(Random Forest)
首先构建许多决策树,然后将它们的输出集成在一起。
4.梯度提升机(Gradient Boosting Machine)
使用梯度提升方法,通过迭代地训练新模型来专门解决之前模型的弱点,从而改进任何机器学习模型的效果。
梯度提升机用于浅层学习问题;深度学习,用于感知问题。用术语来说,你需要熟悉XGBoost和Keras。
5.过拟合(overfit)
机器学习模型在新数据上的性能往往比在训练数据上要差。
6.张量(tensor)
数据容器,数据存储在Numpy数组中,张量的维度通常叫作轴(axis)
7.标量(0D张量)
仅包含一个数字的张量叫作标量(scalar,也叫标量张量、零维张量、0D 张量),可以使用ndim属性来查看一个Numpy张量的轴的个数。标量张量有0个轴(ndim ==0)。张量轴的个数也叫作阶(rank)
8.向量(1D张量)
数字组成的数组叫作向量(vector)或一维张量(1D张量),一维张量只有一个轴。
9.矩阵(2D张量)
向量组成的数组叫作矩阵(matrix)或者二维张量(2D张量)。矩阵有两个轴(通常叫作行和列)。
10 3D张量与更高维张量
将多个矩阵组合成一个新的数组,可以得到一个3D张量,可以直接理解为数字组成的立方体。
将多张3D张量组合成一个数组,可以创建一个4D张量。
11.现实世界中的数据张量
向量数据:2D 张量,形状为 (samples, features)。
时间序列数据或序列数据:3D 张量,形状为 (samples, timesteps, features)。
图像:4D张量,形状为(samples, height, width, channels)或(samples, channels,height, width)。
视频:5D张量,形状为(samples, frames, height, width, channels)或(samples,frames, channels, height, width)。