zoukankan      html  css  js  c++  java
  • 【北美名校CS课程整理系列】6. 强化学习与决策控制

    https://zhuanlan.zhihu.com/p/87647631

    今天我们带来本系列第六篇文章:北美CS名校强化学习与决策控制相关课程的整理。本系列今后将持续保持一周两更的频率,想学习更多请点击关注专栏大学模拟器,点赞支持,也欢迎关注微信公众号Univ模拟器。

    强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。(摘自《机器之心》)

    课程资料

    由于本人平时需要上班,现在的文章将主要列出课号、名称与主页链接。其他资源链接将在有精力的时候补上。非常欢迎志同道合的有为青年加入我们(私信我),帮忙收集资料或者发一些与课程相关的学习心得体会。

    加州大学伯克利分校 UCB

    CS 285: Deep Reinforcement Learning, Decision Making, and Control

    CS285 Home Page

    CS281B: Advanced Topics in Learning and Decision Making

    CS281B Home Page

    斯坦福大学 Stanford

    CS234: Reinforcement Learning

    CS234: Reinforcement Learning Winter 2019

    CS239 Sequential Decision Making

    Sequential Decision Making | AA229/CS239 Winter 2018

    AA228/CS238 Decision Making under Uncertainty

    AA228/CS238 | Decision Making under Uncertainty

    卡耐基梅隆大学 CMU

    16-881: Special Topics: Deep Reinforcement Learning for Robotics

    16-745: Optimal Control and Reinforcement Learning

    16-745: Optimal Control and Reinforcement Learning

    10-403: Deep Reinforcement Learning and Control

    Deep RL and Control

    Econ 3810/Econ 6760/ CS 5846: Decision Theory

    Econ 3810/Econ 6760/ CS 5846 (Spring, 2017)

    ORIE 5751: Learning and Decision Making From Data

    伊利诺伊大学香槟分校 UIUC

    CS 598: Statistical Reinforcement Learning (S19)

    CS 598 Statistical Reinforcement Learning

    华盛顿大学 UW

    CSE 479: Intelligent control through learning and optimization

    Intelligent control through learning and optimization说在后面

    大学模拟器专栏旨在为广大学习爱好者收集公开/非公开资源,降低在校学生与工作人士的学习成本,提供免费可得的课程培养方案。最终达到降低内卷、打击智商税收割者的目的。

    从今天开始,本专栏在之后几个月将陆续发出关于北美名校CS专业的相关课程主页链接,课程主题全面覆盖人工智能(自然语言处理、计算机视觉、增强学习)、机器学习理论与应用、数据结构与算法分析、大数据与并行计算、操作系统与编译原理、网络与信息安全、分布式系统与数据库、机器人、数值分析与计算机基础数学、人机交互、机器人、计算机图形学等方面的内容,目前主要面向Stanford、MIT、UCB、CMU、UIUC、Cornell、Princeton、Caltech、Harvard、UW、Georgia Tech、UT Austin这几所CS强校。

  • 相关阅读:
    面向对象--进阶
    组合补充--类的特殊成员
    面向对象--类,嵌套
    面向对象(初级)
    模块--包
    异常处理
    模块--3
    模块--2
    django环境处理
    Django使用中间件通过CORS方式解决跨域
  • 原文地址:https://www.cnblogs.com/dhcn/p/14951575.html
Copyright © 2011-2022 走看看