一.有监督学习
含义:数据集中的样本带有标签,有明确的目标
目标:找到样本到标签的最佳映射
回归和分类
回归模型:线性回归、岭回归、LASSO和回归样条等
分类模型:逻辑回归、K近邻、决策树、支持向量机等
应用场景:垃圾邮件分类、病理切片分类、客户流失预警、客户风险评估、房价预测等。
二、无监督学习
含义:数据集中的样本没有标签,没有明确目标。根据数据本身的分部特点,挖掘反映数据的内在特征
聚类:将数据集中相似的样本进行分组,使得:同一组对象之间尽可能相似;不同组对象之间尽可能不相似。
应用场景
基因表达水平聚类:根据不同基因表达的时序特征进行聚类,得到基因表达处于信号通路上游还是下游的信息
篮球运动员划分:根据球员相关数据,将其划分到不同类型(或者不同等级)的运动员阵营中
客户分析:把客户细分成不同客户群,每个客户群有相似行为,做到精准营销
三、强化学习
含义:智慧决策的过程,通过过程模拟和观察来不断学习、提高决策能力
例如:AlphaGo