吴恩达老师近日在网易云课堂达成合作,开始新的课程。我也跟着后面学习,顺便再博客园中做个笔记,以加深记忆!
此次老师的课程主要讲解五个部分:
1.Neural Networks and Deep Learning
2.Improve Deep Neural Networks:Hyperparameter tuning,Regularization and Optimization
3.Structuring your Machine Learning project
4.Convolutional Neural Networks
5.Natural Language Processing:Building sequence models
首先,通过两个例子介绍什么叫神经网络
例1:单层的神经网络
当给出一系列关于房子的大小与对应房子的价格的数据,我们需要寻找一个函数来模拟房子的大小与房子的价格之间的关系,在这里,通常我们可以理解成一个线性回归问题,这是因为在这里面只有一个参数。
这时,当我们输入一个房间的大小,我们希望可以预测出这个房间的价格。例如上图中的绿色线即为我们模拟的函数
例二:多层的神经网络
还是例如上例的放假预测。房子的价格有时候不仅仅有房子的大小一个因素影响,也有可能受其它的因素的影响比如房间的数目,邮政编码,财富等等,这个时候我们需要将以上几个因素全部做完输入x,之后通过神经网络得到所需要的输出y,如上图所示,x1,x2,x3,x4是输入层,中间两层是隐藏层,最后得到输出y
监督神经网络模型
在监督学习模型中,通常会有一个数据集,并且已经知道该数据集中每一组输入数据所对应的输出,我们需要找到输入与输出的关系,并以此为根据来预测未来的数据
在监督神经网络模型中,通常可以所研究的问题分为“回归问题”和“分类问题”。在回归模型中,我们试图连续输出预测结果,这也就意味着我们将输入的变量映射到一些连续的函数中去。相反,在分类模型中,我们希望在离散输出中输出结果。换句话说,我们试图将输入变量转变成离散类别。
比如说以下就是一种监督学习:
目前有很多不同的深度网络模型,每个模型也有自己不同的作用。通常,CNN可以用来做图片处理,RNN通常用来处理一维序列数据,比如说英汉文翻译或者有时态数据,比如说文本数据。在自主驾驶方面,它是一种混合神经网络结构。
结构化数据与非结构化数据
结构化数据通常是指一个准确的定义,比如说价格,年龄;非结构化数据通常指的是像像素,原始音频,文本等等。