什么是机器学习?
1、监督学习
监督学习定义:用已有的数据集包括输入、输出,进行模型函数的训练;然后把新的输入数据带入模型函数,预测数据输出。
监督学习分类:监督学习分为两类,线性回归和逻辑回归(简称:回归和分类)。函数的输出可以是一个连续的值(称为回归分析);或者是预测一个分类标签(如:判断一个学生是否被录取,称作分类)。
2、 无监督学习
在有监督学习中,会对每个数据进行标记。这样算法在进行分析的时候,就会有一个正确的数据来进行参考。
在无监督学习中,只有一个数据集,需要算法自行对数据进行分析,找出其中的特征,能够对数据进行分类。
下面就是无监督学习的一些常见的实际应用。
谷歌的新闻
谷歌爬虫每天会从网络中爬取大量的新闻,通过无监督的学习算法,自动将这些新闻进行分类,这样就不需要人工进行分类了。在这样的例子中,其实算法之前没有经过训练,通过分析新闻,然后自动地进行分类
市场营销
在电商中一般会有大量的用户信息。通过无监督算法,将这些用户进行分类,划分到更小的市场中
社交网络
无监督学习通过分析email中的联系人情况,Facebook或者是Google+中的朋友,就能够判断出你与其他好友之间的亲密关系。
通过我的发现,我发现无监督学习貌似在分类方面应用的较多。
end~