zoukankan      html  css  js  c++  java
  • 【回归】记Paddle强化学习训练营

    回到博客园,上次发博已是5年,不曾想,机缘巧合,以参加一次Paddle训练营心得来回归博客园。

    偶然收到百度Paddle强化学习7日训练营邮件,心想研究生期间也曾学习过一段时间(不过一知半解),颇想进一步学习下并有有所实践,暗合我意。

    心想:虽然大部分时间要上班,这7天时间不长,应该很好坚持下来吧。

    第一堂课,我打开B站,想不到这里真的是学习的,内容比较基础,容易上手,需要对AI Studio平台进行适应学习,但这仅仅是强化学习的开始。

    第二堂课,我的老本在第一堂课基本就用完了。由于晚上8点半太早,没来不及看直播,如果第二天早上我没有看视频做作业的话,我想7天打卡也就会终于第2天吧。

    之后的几天都是早早到公司看昨天的录像、做作业,想想工作2年来,还没有这样赶着快点到公司来的经历,不得不定下当日的list,防止影响工作。这感觉真的很棒。

    最后一个作业,是做四轴飞行器的电压调节,训练了好几小时总是不收敛、收益为负。

    调试方法也是不得章法:不知道这网络层数、超参数(学习率、回报衰减等)到底是不是影响结果的原因,东一榔头西一锤头的乱试,每次还要等好久才能看出趋势,心想炼丹此言不虚啊。

    因为没有实践过深度学习,训练效果不好,很是苦恼,但这也许会给我内心种下一个种子,想要把深度学习也弄明白。

    最好,看到微信群里,同学们讨论说老师有提到,直观上讲:四轴飞行器电压尽量接近才更可能平衡,瞬间恍然大悟,迫不及待想再试一把。

    没想到,收益很快就变成了正数,并且越来越大。心中窃喜,页再次体会到:思路和方法真的更加重要。

    感谢这套课程,课程中,科科老师讲解详略得当,抓住要点,在1h的课程让人迫不及待想去试试,感谢,也感谢芮芮老师的组织和提醒。

    后面附上自己学习笔记,由于是手写的,只能上传照片了。

  • 相关阅读:
    c语言 11
    c语言中atoi、atol、atof函数,字符串转换函数
    c语言中strncmp函数,函数原型,头文件
    c语言中strcmp函数, 函数原型、头文件
    c语言中strncat函数、函数原型、头文件
    c语言中strcat函数,函数原型、头文件
    c语言中strncp函数,函数原型、头文件
    c语言中strcpy函数,函数原型、头文件
    c语言 11-6
    tyvj2059 元芳看电影
  • 原文地址:https://www.cnblogs.com/coolalan/p/13197304.html
Copyright © 2011-2022 走看看