zoukankan      html  css  js  c++  java
  • Explainable Reinforcement Learning Through a Causal Lens


    发表时间:2019(AAAI 2020)
    文章要点:这篇文章通过构建一个图结构,来解释为啥agent要做/不做某个动作。具体来说就是先把某个问题给抽象成一个图结构,定义状态动作回报等关键信息的节点和边,然后在训练RL的时候也顺便用数据来训练这个图。训练完了之后,就根据图用深度优先搜索去找,做某个动作或者不做某个动作最后导致的结果是啥,然后就说一定程度上对RL的策略做了解释。
    总结:这个文章也太晦涩了,不知道在说什么,里面太多心理学的词汇,比如Causal Lens,minimally complete,structural equations,task prediction,5-point Likert Explanation Satisfaction Scale,其实方法和RL关系不大。
    疑问:只知道个大概意思,其实不是很懂怎么去构造图的,也不懂怎么去训练的。structural causal model需要人为构造吗,那如果问题太复杂或者我们对问题并不完全了解,该怎么去构造?structural equations具体指的是什么,怎么去学的?DAG是啥?
    5-point Likert Explanation Satisfaction Scale是啥?文章还说如果图太大,找不到complete的解释,所以就去找minimal explanations,不知道这两的定义是啥,也不知道具体咋找的。

  • 相关阅读:
    windows下php扩展存在但无法加载的问题
    mysql5.7主从(Master/Slave)同步配置
    windows使用composer.phar
    git untrack file
    git常见问题
    thinkphp框架中Model对象$origin对象的作用
    thinkphp常见问题
    git合并多个commit
    ajax请求post和get的区别以及get post的选择
    .htaccess跳转https
  • 原文地址:https://www.cnblogs.com/initial-h/p/15465160.html
Copyright © 2011-2022 走看看