zoukankan
html css js c++ java
Evaluation and Control -评估和控制
评估
估计/预测一个给定策略的奖励期望。
在强化学习中,我们可以脱离策略实现对它的评估。这意味着我们可以使用从其他策略收集到的数据来评估一些反直觉的不同的策略会怎样做。这非常有用,因为我们不需要以测试的方式穷尽所有的策略。
控制
最优化:找到最佳的策略。
查看全文
相关阅读:
python操作MySQL数据库
用python监控您的window服务
关于position定位中的几个注意点
filter 滤镜
git使用心得
:after,:before,content
outline和border
《css揭秘》之背景与边框
css权威指南学习笔记--第6章
浅谈setTimeout和setInterval
原文地址:https://www.cnblogs.com/wanghongze95/p/13842457.html
最新文章
数据规约
数据变换
python3.7安装Celery4.2.0 报错
python 树遍历
mysql和oracle 区别
vue初识
js入门
html标签
python多线程和多进程
ftp
热门文章
网络编程补充
网络编程socket
UTF-8编码下'u7528u6237'转换为中文'用户
TPS和QPS的区别和理解【转】
c++对txt文件的读取与写入
python整数与IP地址转换 [转]
python 查找IP地址归属地
文件的创建,读取,写入,修改,删除---python入门
python使用ftplib做ftp操作
python 读取一个目录下的所有目录和文件
Copyright © 2011-2022 走看看