zoukankan      html  css  js  c++  java
  • 机器学习十讲——第十讲

    第十讲——强化学习

      首先介绍了机器学习的方法和强化学习的概念。

      之后介绍了数学模型MDP:

     

       对强化学习进行分类:

       介绍了最常用的方法Q-Learning和计算思路和公式:

      DQN——Q-learning的一种方法,能处理状态多但是行动空间数值不高的行动决策。

      如果状态太多不能用表来表示,可以用函数表示。

     

     

     (状态位参数θ,状态多的函数是复杂函数,最为拟合的就是深度学习的方法)

      实践证明DQN的表现很好:

     

       还有一种算法:

       随后列举了美团的“推荐系统”,系统会观察用户的行为,记录用户点击的店面下单的东西,然后分析数据,下次点开推送类似的东西;还介绍了出租车派单系统、智能交通等等。最后概括了一下机器学习的知识体系:

      知识体系很庞大,眼花缭乱,老师给出了学习意见:

      至此,机器学习十讲内容结束。

  • 相关阅读:
    js 将u003C这一类东西转换为标签
    git使用
    js_03 面向对象
    初级算法 数组
    python 用execjs执行js代码
    js_02 函数
    递归
    01 .linux常用命令
    08. 脱缰的野马 crawlspider
    SPACES:“抽取-生成”式长文本摘要(法研杯总结)
  • 原文地址:https://www.cnblogs.com/zhangxinyue/p/14380388.html
Copyright © 2011-2022 走看看