什么是机器学习?
传统的教科书会用一大堆高等数学,线性代数,概率论。统计学等知识把你拒之门外。这里博主俺决定用一个非常easy的样例给不用你不论什么高深的数学知识来理解。
在写机器学习之前,我们来举个样例。如果你是个古代的国王,那里没有现代的科技,你想找个预报天气比較准的人来帮你预报天气。你要怎么办呢?通常。我们会找一个人,让他预报10000天,看它的准确率怎样。然后再找一个人。再预报10000天。看它预报的准确率怎样。
传统的教科书会用一大堆高等数学,线性代数,概率论。统计学等知识把你拒之门外。这里博主俺决定用一个非常easy的样例给不用你不论什么高深的数学知识来理解。
在写机器学习之前,我们来举个样例。如果你是个古代的国王,那里没有现代的科技,你想找个预报天气比較准的人来帮你预报天气。你要怎么办呢?通常。我们会找一个人,让他预报10000天,看它的准确率怎样。然后再找一个人。再预报10000天。看它预报的准确率怎样。
依次类推,你找了100个人,最终找到了一个准确率在90%的人,你就征用它当你的气象局局长了。
把这个故事映射到机器学习上,那么10000天就是样本,100人中每一个人就是你的一个模型。预报准确率的统计就是误差函数。
机器学习的本质就是你用你的数学模型(100个人)在样本(10000天)中尝试,然后你统计出这个模型(人)的预測误差(准确率)。假设误差不达标。你再找下一个模型(人)。
机器学习的挑战是怎样在这100个人里去高速寻找合适的人选。你最后发现一个线索,就是预报比較好的人,它们的亲戚也预报的可能比較好。这个就是梯度下降。你不是在盲目的寻找模型。
这里模型大家认为非常神奇,事实上说简单就是每一个特征的权值而已,说的高大上的。就叫权值向量。
-------------------------------最后华丽的切割线------------------------------------------
本教程的文件夹博文请点击这里。
假设大家想先对机器学习进行入门了解,可參看这里的简介。假设须要简单了解深度学习的内容,可參看这里简单的介绍。学习这些教程之前。能够先热身下,这里是theano的基础教程,学完之后。再看下这个东东,里面有一些主要的概念和一些測试的训练集。