强化学习总结
推荐博客:
http://www.cnblogs.com/steven-yang/tag/%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0/
强化学习是学习一个最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前的状态(state),做出行动(action),从而获得最大回报(G or Return)。