zoukankan      html  css  js  c++  java
  • 《python深度学习》笔记---4.5、机器学习的通用工作流程

    《python深度学习》笔记---4.5、机器学习的通用工作流程

    一、总结

    一句话总结:

    开发过拟合的模型。
    基于模型在验证数据上的性能来进行模型正则化与调节超参数

    1、广泛使用的分类指标ROC AUC 就不能被直接优化?

    优化 ROC AUC 的替代指标:因此在分类任务 中,常见的做法是优化 ROC AUC 的替代指标,比如交叉熵。一般来说,你可以认为交叉熵越小, ROC AUC 越大。

    2、为模型选择正确的最后一层激活和损失函数?

    二分类问题:sigmoid:binary_crossentropy
    多分类、单标签问题:softmax:categorical_crossentropy
    多分类、多标签问题:sigmoid:binary_crossentropy
    回归到任意值:无:mse

    回归到 0~1 范围内的值:sigmoid:mse 或 binary_crossentropy

    3、机器学习中无处不在的对立是优化和 泛化的对立?

    模型必须先过大或者过小:理想的模型是刚好在欠拟合和过拟合的界线上,在容量不足和容量过大的界线上。 为了找到这条界线,你必须穿过它。

    4、要搞清楚你需要多大的模型,就必须开发一个过拟合的模型?

    (1) 添加更多的层。
    (2) 让每一层变得更大。
    (3) 训练更多的轮次。

    5、模型正则化与调节超参数?

    添加 dropout。
    尝试不同的架构:增加或减少层数。
    添加 L1 和 / 或 L2 正则化。
    尝试不同的超参数(比如每层的单元个数或优化器的学习率),以找到最佳配置。


    (可选)反复做特征工程:添加新特征或删除没有信息量的特征。

    6、每次使用验证过程的反馈来调节模型,都会将有关验证过程的信息泄露到模型中?

    验证数据集迭代过多次会导致信息泄露:如果只重复几次,那么无关紧要;但如果系统性地迭代许多次,最终会导致模型对验证过程过 拟合(即使模型并没有直接在验证数据上训练)。这会降低验证过程的可靠性。

    二、内容在总结中

    博客对应课程的视频位置:

     
    我的旨在学过的东西不再忘记(主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法)的偏公益性质的完全免费的编程视频学习网站: fanrenyi.com;有各种前端、后端、算法、大数据、人工智能等课程。
    博主25岁,前端后端算法大数据人工智能都有兴趣。
    大家有啥都可以加博主联系方式(qq404006308,微信fan404006308)互相交流。工作、生活、心境,可以互相启迪。
    聊技术,交朋友,修心境,qq404006308,微信fan404006308
    26岁,真心找女朋友,非诚勿扰,微信fan404006308,qq404006308
    人工智能群:939687837

    作者相关推荐

  • 相关阅读:
    验证控件没有向服务器发回数据
    立即窗口中体现回车换行
    初试发布功能
    文件内码不同造成的错误
    验证控件网页代码分析3
    VB自动把变量改成小写
    maven + eclipse + tomcat 实战JSP
    Java 多线程初探(一) 创建线程
    WebSocket简单使用(一) 概念
    JDBC的事务操作
  • 原文地址:https://www.cnblogs.com/Renyi-Fan/p/13781948.html
Copyright © 2011-2022 走看看