zoukankan      html  css  js  c++  java
  • 人工智能实战2019

    项目 内容
    课程 人工智能实战2019
    作业要求 第7次作业
    课程目标 学习人工智能基础知识
    本次作业对我的帮助 练习玩黄金点游戏
    参考文献 创新的时机 - 黄金点游戏挑战黄金点

    个人见解


    经过认真的分析可知,如果玩家们足够理性、游戏次数足够多,黄金点会趋向于0。但在实际的黄金点游戏中,并不是每个人都是理性的、做了长远思考的(比如我自己,第一次玩时没做出理性思考,每次都是猜着提交了一个数,最终成绩倒数),所以当游戏次数足够多时,黄金点会先较快的下降,然后稳定波动。
    在诸多因素影响下,黄金点的变化类似下图。

    基于学习的策略


    对于此类博弈论的问题,强化学习的算法最受人期望,这样模型就可以自我改进,更好的处理拐点后的预测。但我对于强化学习的理解目前只在概念阶段,没有看懂强化学习的相关算法,无法实现。希望以后能够尝试。

    基于时间序列模型和机器学习算法的策略


    Facebook所开源的Prophet模型,值得一试(mark,没能有时间去尝试。。。)

    基于简单心理的策略


    对于在房间1中进行游戏,取过去10场游戏黄金点的平均值。
    对于在房间2中进行游戏,可以提交2个数,一个作为干扰,一个作为预测。对于玩家数较少的环境,自己产生的干扰对全局的影响可定性为提高黄金点,但无法定量估计。对于玩家数多的环境,自己产生的干扰对于黄金点的影响无法做定性和定量的分析。也可以提交两个预测值,以期此区间内包含黄金点,一定程度上可以提高积分。

    基于控制算法的策略


    学习过自动控制原理,可能会想到卡尔曼滤波等控制算法。但是控制算法主要是作用于期望的运动,噪声应遵循高斯分布。显然不适用于黄金点游戏。

  • 相关阅读:
    Mysql 之导入导出
    Go gin之文件上传
    记录Go gin集成发送邮件接口的坑
    关于mysql某个用户无法登陆的情况
    面向对象程序设计的分析基本步骤
    提示框判断事件
    事件响应的公共方法
    IComparable<T>.CompareTo(T) 方法
    浏览器缓存机制
    PHP中include和require
  • 原文地址:https://www.cnblogs.com/wangshihong/p/10843864.html
Copyright © 2011-2022 走看看