机器学习概念性含义:
机器学习是人工智能的一个分支,我们使用计算机设计一个系统,使他能够根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可以在性能上不断学习和改进;通过参数优化的学习模型,能够用于预测相关问题的输出.
符号代表的含义:
向量x: 1.2 2.1 3.2 3.3 2.3 3.2 #有几个特征就说有多少维,注意上下标的含义
xi : x向量的第i维度的值
x(i) : 表示第i个样本的x向量 (针对矩阵说的)
矩阵X:(特征矩阵)
标量:(目标属性,目标值)
拟合:构建的算法符合给定数据的特征
鲁棒性:(对新数据进行预测)也就是健壮性.稳健性.强壮性,是系统的健壮性;当存在异常数据的时候,算法也会拟合数据
过拟合:算法太符合样本数据的特征,但对于实际生产中的数据特征无法拟合
欠拟合:算法不太符合样本的数据特征
机器学习常见的应用框架:
1.scikit-learn(python) #纯机器学习的--发展方向:从小批量的数据中提取大量的隐含的特征进行构建
http://scikit-learn.org/stable/
2.Mahout(Hadoop生态圈基于MapReduce) #基于大数据的机器学习 #从大批量的数据中挖掘特征 (几乎与无脑堆数据--找特征规律)
https://mahout.apache.org/
3.Spark.MLlib #基于大数据的机器学习
https://spark.apache.org/