您当前所在位置：首页 > 新雅·记 > 新雅学记

新雅学记

新雅·记

郑智等：基于强化学习的裂脑机器人研究

发布时间：2020-04-26 15:00 点击数：

基于强化学习的裂脑机器人研究

郑智崔琢宜张皓烨

编者按：清华“挑战杯”科展诞生于1983年，每年举办一次，以集中展示学生课外科技创新成果。本届“挑战杯”科展作为清华109周年校庆活动的一部分，首次尝试在线上举办；新雅书院有三件作品入展，分别是陈伟浩同学的“BiTipText双手指尖盲打”，郑智、崔琢宜、张皓烨同学的“基于强化学习的裂脑机器人研究”，曾哲妮同学的“多情境下的交通视频多目标追踪系统”。

摘要

裂脑人(split-brain patients)在医学上指代那些胼胝体受损使得左右脑无法正常交流的人。在这项“研究”中，我们使用LEGO Mindstorm搭建了裂脑机器人，用两台互不通信的EV3主机模拟左右脑，分别控制机器人的一半身体，同时利用强化学习的策略梯度算法使机器人学习如何让左右脑协调工作。经过40个回合的学习，机器人基本能够实现直线行走；而在不同实验条件的设置下，机器人也会有不同的行为特点。最后，我们将裂脑机器人的部分行为解释为左右脑的间接通信，而这与裂脑人的行为有相通之处。