2019年6月4日晚,“智能工程”创客论坛:强化学习讲堂第四期在南京大学仙林校区基础实验楼乙区408顺利举办。本期讲座邀请的是工程管理学院2015级本科生,机器人协会创始人周启新,讲座主题为“‘时间差分(TD)算法’”。
讲座一开始,周启新学长简要的回顾了上次强化学习的内容,对过往方法进行了讲解和点评。接着,周启新学长介绍时间差分方法,讲述了如何经过时间差分强化学习后,优化复杂的路径,以及找到该条件下的最优解。紧接着周启新学长介绍Q-leaning仿真实验,上面展示了一个迷宫,介绍如何经过强化学习处理复杂的迷宫路径,同时介绍了一个强化学习程序公式,接着,周启新学长介绍了强化学习程序的部分代码。然后,周启新学长介绍该实验的强化学习原理,介绍完后,再介绍如何通过强化学习在一个迷宫内自由探索而最短的路径,让同学们了解到强化学习的能力。

最后,周启新学长和感兴趣的学弟们进行了友好的学习交流,整个活动圆满结束。通过这次智能论坛,同学们受益良多。