zoukankan      html  css  js  c++  java
  • pattern recognition and machine learning读书笔记1

    M.jordan的大作,这学期讨论班要用这本书,最近开始拜读。花了两天时间,大体把第一张看完了,虽然都是些数学的基础东西,但是由于差劲的英语和数学,也是看起来比较头大。下面小总结一下,一些没搞明白的东东留着讨论班上讨论下。

    第一章上来介绍了了模式识别的印象性概念,读者读了后会对模式识别与机器学习有一个简单的认识。然后1.1节开始介绍一个用曲线拟合问题,其实这就是个回归问题。主要讲的是用多项式曲线去拟合正弦曲线。最先的方法是最小化损失,尽力的去拟合每个点。在书里的图里可以看到,使用9次的多项式曲线拟合时候,可以是损失为0,但是曲线出现太多的震荡,虽然对这几个点拟合的比较好,但是对曲线整体拟合的很差。这样就引出了过学习(over-fitting)的概念。

    然后的方法是对损失函数引入一个拉姆达来控制多项式曲线的参数大小,这样可以有效的控制过拟合现象,从书中的图中可以看到对于M=9,使用ln拉姆达=-18的时候,有效的避免了过拟合问题。

    1.2节开始介绍概率论知识在prml上的应用,这就引出了经典的贝叶斯理论,简单说来就是通过先验概率与后验概率的关系来进行事件的预测。然后介绍的知识是高斯分布和最大思然方法(ML),然后使用ML方法来解决曲线拟合问题,这节最后的知识是使用贝叶斯理论来解决曲线拟合问题,没太看明白这里,留着讨论讨论。

    1.3节说了下模型选择,主要介绍了下训练模型,提到了交叉验证和BIC AIC。

    1.4节的名字是curse of dimensionality。主要讨论了数据维数的问题,这个问题实在太大,这一节的内容也有限,所以讲的不深入,主要是提了一下(个人理解)

    1.5节介绍了决策论(Decision Theory)

    1.51 分类误差率最下,那个图没整明白,回头补上。

    1.52 最小化期望误差

    这里提到了一个损失矩阵,不同的误差带来不同的损失。例如癌症如果这个人没得,但是识别为得了,那么损失无非就是多做些检查或者治疗。但是如果这个人得了癌症,但是判断为没得,那么这个误差带来的损失就大了,这个人可能会过早的死去。所以对于不同的误差应该带来不同的损失。

    1.5.3 拒绝选择,对于一些概率小于一个阈值的情况,拒绝对该情况进行预测。

    1.5.4 推理和决策 又见贝叶斯。由此可见贝叶斯理论的经典,以及坐着对于该理论的推崇。

    1.5.5 回归问题的损失函数(留着)

    1.6节简单的介绍了信息论的一些知识,这个留着单独做一节吧。好的笔记先做到这,回头补上木有看明白的。

  • 相关阅读:
    推荐一款稳定快速免费的前端开源项目 CDN 加速服务
    MySQL限时解答
    OneProxy的功能与限制
    MySQL浮点计算存在的问题与解决方案
    DAS、SAN、NAS的区别
    气质
    受制于人
    mysqlbinlog flashback 5.6完全使用手册与原理
    Innodb引擎 compact模式下元组的磁盘存储结构
    数据迁移程序
  • 原文地址:https://www.cnblogs.com/macula7/p/1960778.html
Copyright © 2011-2022 走看看