[source] ICML
[year] 2004
在本文中直接提出了两个算法:MMP和Projection方法。
Projection方法比较容易,可以找到实现。
找一个下降方向。
困难在于建模,如何找出MDP/R的各构成。其中的S A \phi都不那么明显。