机器学习算法分类:
监督学习:
定义:输入数据是由特征值和目标值组成,函数的输出可以是一个连续的值(称为回归),或是输出连续个离散值(称为分类)。
目标值:类别——分类问题
算法:K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归...
目标值:连续型的数据——回归问题
算法:线性回归、岭回归
无监督学习:
定义:输入数据是由特征值组成。
目标值:无——聚类
算法:聚类K-means
机器学习开发流程:
①:获取数据
②:处理数据
③:特征工程
特征抽取/特征提取:(sklearn库中:sklearn.feature_extraction包含字典特征提取、文本特征提取)
文本数据等——>数值数据
④:机器学习算法训练——模型
⑤:模型评估
⑥:应用