仅供学习使用
- 机器学习的核心,从数据中自动学出规律。
- 深度学习是一个框架,受到了人工神经网络的启发。
深度学习模型:
更加强大的表达能力、具备层次表示能力、全局的泛化能力、迁移学习能力
机器学习领域的两个大类:
- 有监督学习
D=(X,y)
学习X->y的学习关系
数据既有特征,又有标签。
学习映射关系。
线性映射关系、非线性映射关系。
svm - 无监督学习
D=(X)
寻找X中的特征或者规律
营销领域,给用户分类。个性化营销
聚类k-means - 强化学习
AlphaGo
常见的机器学习算法
- 监督学习
线性回归、逻辑回归(分类问题)、朴素贝叶斯、决策树、随机森林、SVM、神经网络 - 无监督学习
PCA、K-means、GMM、LDA
矩阵分解、xgboost
- 区别:
回归问题:输出数连续数值,例如:股价、温度、身高、气温
分类问题:输出是类别,例如:阴晴、好坏。图像识别、文本分类。类别之间没有大小关系
-
区别概念:
特征、标签、样本
标量、向量、矩阵、张量 -
机器学习建模流程:
- 数据源
- 数据预处理:去噪、填补空白、数据对齐
- 特征工程:Feature Engine
- 建模
- 验证
- 端到端的方法:跳过特征工程,直接用数据预处理到建模
强化学习
一种学习策略,和遗传算法同范畴吧。(个人理解)