机器学习十讲——第十讲 - 走看看

zoukankan html css js c++ java

机器学习十讲——第十讲

第十讲——强化学习

　　首先介绍了机器学习的方法和强化学习的概念。

　　之后介绍了数学模型MDP：

　　对强化学习进行分类：

　　介绍了最常用的方法Q-Learning和计算思路和公式：

　　DQN——Q-learning的一种方法，能处理状态多但是行动空间数值不高的行动决策。

　　如果状态太多不能用表来表示，可以用函数表示。

（状态位参数θ，状态多的函数是复杂函数，最为拟合的就是深度学习的方法）

　　实践证明DQN的表现很好：

　　还有一种算法：

　　随后列举了美团的“推荐系统”，系统会观察用户的行为，记录用户点击的店面下单的东西，然后分析数据，下次点开推送类似的东西；还介绍了出租车派单系统、智能交通等等。最后概括了一下机器学习的知识体系：

　　知识体系很庞大，眼花缭乱，老师给出了学习意见：

　　至此，机器学习十讲内容结束。

查看全文

相关阅读:
SDUT2136 数据结构实验之二叉树的建立与遍历
 工作流之任务处理人更改
 【转】工作感悟：为什么我们专业但不职业？
我们为什么要使用工作流——业务流程重组与企业现代化管理<转>
.net生成图片缩略图
 RIA Services Visual Studio 2008 SP1 中文版不能安装解决方法
 SQL Server数据库链接方式
 常用端口号
 XSD是什么
 新版.NET 程序员必备工具下载

原文地址：https://www.cnblogs.com/zhangxinyue/p/14380388.html

Copyright © 2011-2022 走看看