zoukankan      html  css  js  c++  java
  • 【吴恩达机器学习】第12章 机器学习系统设计

    确定执行的优先级

    列出可能的解决方案,然后权衡选择。而不是一开始只是关注去收集更多的数据。例如对于垃圾邮件可以有以下一些方案:
    在这里插入图片描述

    误差分析

    一般先花一天时间,简单粗暴的实现一个算法,画出学习曲线,然后逐步改进。

    • Start with a simple algorithm that you can implement quickly.
      implement it and test it on your cross-validation data.
    • Plot learning curves to decide if more data, more feature, etc. are likely to help
    • Error analysis: Manually examine the examples(in cross validation set) that your algorithm made erros.
      See if you spot any systematic trend in what type of examples it is making errors on.

    The importance of numerical evaluation
    尝试不同的改进方式,并在交叉验证集上评价。

    不对称性分类的误差评估

    偏斜性问题:在分类问题中,正类与负类样本数量不平衡。

    对于偏斜性问题可以用:Precision与Recall来评价模型

    Precision(查准率):True positive / # predicted positive
    在这里插入图片描述
    Recall(召回率):True positive / # actual positive
    在这里插入图片描述

    精确度和找回率的权衡

    提高精确度:将hθ0.5h_ heta ge0.5调整为hθ0.7h_ heta ge0.7
    在这里插入图片描述
    查准率与召回率
    在这里插入图片描述
    综合
    在这里插入图片描述

    机器学习数据

    不要盲目搜集大量数据。但哪些条件下,大量数据有助于生成更好的模型。

    • 特征数量足够
    • 参数很多
  • 相关阅读:
    nginx 域名跳转一例~~~(rewrite、proxy)
    军哥 LNMP 常见问题
    Zabbix安装
    PHP远程连接mysql
    Zend Studio 下载
    军哥LNMP优化
    网络流量监控分析工具 Ntopng 安装
    Linux VPS禁止某个IP访问
    DDoS deflate
    MySQL数据库的优化
  • 原文地址:https://www.cnblogs.com/bitbitbyte/p/12536585.html
Copyright © 2011-2022 走看看