《python深度学习》笔记---4.5、机器学习的通用工作流程

zoukankan html css js c++ java

《python深度学习》笔记---4.5、机器学习的通用工作流程

《python深度学习》笔记---4.5、机器学习的通用工作流程

一、总结

一句话总结：

开发过拟合的模型。

基于模型在验证数据上的性能来进行模型正则化与调节超参数

1、广泛使用的分类指标ROC AUC 就不能被直接优化？

优化 ROC AUC 的替代指标：因此在分类任务中，常见的做法是优化 ROC AUC 的替代指标，比如交叉熵。一般来说，你可以认为交叉熵越小， ROC AUC 越大。

2、为模型选择正确的最后一层激活和损失函数？

二分类问题：sigmoid：binary_crossentropy

多分类、单标签问题：softmax：categorical_crossentropy

多分类、多标签问题：sigmoid：binary_crossentropy

回归到任意值：无：mse

回归到 0~1 范围内的值：sigmoid：mse 或 binary_crossentropy

3、机器学习中无处不在的对立是优化和泛化的对立？

模型必须先过大或者过小：理想的模型是刚好在欠拟合和过拟合的界线上，在容量不足和容量过大的界线上。为了找到这条界线，你必须穿过它。

4、要搞清楚你需要多大的模型，就必须开发一个过拟合的模型？

(1) 添加更多的层。

(2) 让每一层变得更大。

(3) 训练更多的轮次。

5、模型正则化与调节超参数？

添加 dropout。

尝试不同的架构：增加或减少层数。

添加 L1 和 / 或 L2 正则化。

尝试不同的超参数（比如每层的单元个数或优化器的学习率），以找到最佳配置。

（可选）反复做特征工程：添加新特征或删除没有信息量的特征。

6、每次使用验证过程的反馈来调节模型，都会将有关验证过程的信息泄露到模型中？

验证数据集迭代过多次会导致信息泄露：如果只重复几次，那么无关紧要；但如果系统性地迭代许多次，最终会导致模型对验证过程过拟合（即使模型并没有直接在验证数据上训练）。这会降低验证过程的可靠性。

二、内容在总结中

博客对应课程的视频位置：

我的旨在学过的东西不再忘记（主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法）的偏公益性质的完全免费的编程视频学习网站： fanrenyi.com；有各种前端、后端、算法、大数据、人工智能等课程。

版权申明：欢迎转载，但请注明出处
一些博文中有一些参考内容因时间久远找不到来源了没有注明，如果侵权请联系我删除。

博主25岁，前端后端算法大数据人工智能都有兴趣。

大家有啥都可以加博主联系方式（qq404006308，微信fan404006308）互相交流。工作、生活、心境，可以互相启迪。

聊技术，交朋友，修心境，qq404006308，微信fan404006308

26岁，真心找女朋友，非诚勿扰，微信fan404006308，qq404006308

人工智能群：939687837

作者相关推荐

感悟总结

其它重要感悟总结

感悟总结200813 最近心境200830 最近心境201019 201218-210205

查看全文

相关阅读:
六.Linux其他命令
 五.Linux压缩文件的操作命令(压缩解压)
sigaction
log_note log_error log_warning
SIGHUP
pthread_create
semaphore
getpwuid
close port
pthread

原文地址：https://www.cnblogs.com/Renyi-Fan/p/13781948.html

《python深度学习》笔记---4.5、机器学习的通用工作流程

《python深度学习》笔记---4.5、机器学习的通用工作流程

一、总结

一句话总结：

开发过拟合的模型。

基于模型在验证数据上的性能来进行模型正则化与调节超参数

1、广泛使用的分类指标ROC AUC 就不能被直接优化？

优化 ROC AUC 的替代指标：因此在分类任务 中，常见的做法是优化 ROC AUC 的替代指标，比如交叉熵。一般来说，你可以认为交叉熵越小， ROC AUC 越大。

2、为模型选择正确的最后一层激活和损失函数？

二分类问题：sigmoid：binary_crossentropy

多分类、单标签问题：softmax：categorical_crossentropy

多分类、多标签问题：sigmoid：binary_crossentropy

回归到任意值：无：mse

3、机器学习中无处不在的对立是优化和 泛化的对立？

模型必须先过大或者过小：理想的模型是刚好在欠拟合和过拟合的界线上，在容量不足和容量过大的界线上。 为了找到这条界线，你必须穿过它。

4、要搞清楚你需要多大的模型，就必须开发一个过拟合的模型？

(1) 添加更多的层。

(2) 让每一层变得更大。

(3) 训练更多的轮次。

5、模型正则化与调节超参数？

添加 dropout。

尝试不同的架构：增加或减少层数。

添加 L1 和 / 或 L2 正则化。

尝试不同的超参数（比如每层的单元个数或优化器的学习率），以找到最佳配置。

6、每次使用验证过程的反馈来调节模型，都会将有关验证过程的信息泄露到模型中？

验证数据集迭代过多次会导致信息泄露：如果只重复几次，那么无关紧要；但如果系统性地迭代许多次，最终会导致模型对验证过程过 拟合（即使模型并没有直接在验证数据上训练）。这会降低验证过程的可靠性。

二、内容在总结中

作者相关推荐

优化 ROC AUC 的替代指标：因此在分类任务中，常见的做法是优化 ROC AUC 的替代指标，比如交叉熵。一般来说，你可以认为交叉熵越小， ROC AUC 越大。

3、机器学习中无处不在的对立是优化和泛化的对立？

模型必须先过大或者过小：理想的模型是刚好在欠拟合和过拟合的界线上，在容量不足和容量过大的界线上。为了找到这条界线，你必须穿过它。

验证数据集迭代过多次会导致信息泄露：如果只重复几次，那么无关紧要；但如果系统性地迭代许多次，最终会导致模型对验证过程过拟合（即使模型并没有直接在验证数据上训练）。这会降低验证过程的可靠性。