您当前所在的位置:首页  新闻动态

“智能工程”创客论坛第二十一期:强化学习讲堂第五讲顺利开讲

       为了解决大学生创新创业过程中知识经验的匮乏,在南京大学创新创业与成果转化工作办公室和南京大学工程管理学院联合指导下,“智能工程”创客论坛系列活动应运而生。2019年,“智能工程”创客论坛微课堂聚焦于“强化学习”,讲堂分为十期并且稳步推进。

       1031日晚,“智能工程”创客论坛:强化学习讲堂第五期在南京大学仙林校区基础实验楼乙区408顺利举办。本期讲座邀请的是工程管理学院研究生于海旭,他曾获YAC会议论文提名奖,发表一作论文3篇,拥有五项专利,强化学习,量子控制是他的研究方向。本次讲座主题为“强化学习简介之TD(λ)理论。   


       讲座一开始,主讲人于海旭先是简单回顾了往期讲座内容,加深了同学们对强化学习基本概念和强化学习基本理论的理解,紧接着介绍了DPMCTD的联系和 区别,由此引入了本次讲座的核心内容——TD(λ)理论。为了让同学们对新知识理解得更为透彻,主讲人先是从算法对比分析入手,将理论涉及的公式进行详细的讲解,再通过实验对比分析,让同学们对于理论有了更形象更直观的认识。那么,强化学习算法的价值在何处?优势在何处?强化学习的具体应用:量子控制,使得同学们再一次感叹强化学习算法的强大与神奇!

     讲座最后,主讲人于海旭再一次带领同学们回顾了强化学习领域的总体框架与分类并对同学们提出的问题进行了详细的解答。在这次讲座过程中,同学们不仅收获到新的知识,更是从于海旭学长的切身经历的分享中总结出一些学习的方法,可谓获益良多。