分类 - 走看看

zoukankan html css js c++ java

分类

1.监督学习（分类/预测）

数据集中对象的类标记已知

通过类标记的指导下学习数据中的模式

利用获取的模式或者模型对新数据进行分类预测

2.模型分类

2.1 生成模型

希望从数据中学习/还原出原始的真实数据生成模型。

常见的方法是学习数据的联合概率分布。

E.g 朴素贝叶斯方法、隐马尔科夫模型等

当容量大时，生成模型容易接近真实模型

能处理具有隐含变量的情景

2.2 判别模型

从数据中学习到不同类概念的区别从而进行分类。

如KNN，SVM, ANN, Decision Tree, etc.

速度快、准确率较高

3.对比分类和预测

分类和预测是监督学习中的两种主要类型

分类：

预测分类标号（或离散值）

根据训练数据集和类标号属性，构建模型来分类现有数据，并用来分类新数据

预测：

建立连续函数值模型，预测未来的情况、连续值或趋势，比如预测空缺值

回归分析、数值预测常常作为同义词混用

分类的算法：

1.朴素贝叶斯

在概率论和统计学中，Bayes’ theorem（贝叶斯法则）根据事件的先验知识描述事件的概率。贝叶斯法则表达式如下所示：

P(A|B)=（P(B|A)P(A)）/ p(B)

P(A|B) – 在事件B下事件A发生的条件概率

P(B|A) – 在事件A下事件B发生的条件概率

P(A), P(B) – 独立事件A和独立事件B的边缘概率

2.回归

2.1 线性回归

查看全文

相关阅读:
python enhanced generator － coroutine
python yield generator 详解
 gunicorn syncworker 源码解析
 gunicorn 信号处理（SIGHUP，SIGUSR2）
gunicorn Arbiter 源码解析
 gunicorn 简介
 kafka+zookeeper环境配置（linux环境单机版）
在Linux中安装JDK的步骤
 Kafka安装及部署
 Zookeeper 安装和配置

原文地址：https://www.cnblogs.com/zhangfuxiao/p/9269149.html