一个离线的Meta-RL框架,使机器人能够利用以前收集的数据快速适应未知和复杂的插入任务! 一个离线的Meta-RL框架,使机器人能够利用以前收集的数据快速适应未 ... 02/03/2022 强化学习
是否可以通过考虑不确定的因素来预防副作用的发生?我们提出了一个结合贝叶斯和强化学习的系统! 是否可以通过考虑不确定的因素来预防副作用的发生?我们提出了一个结合贝叶 ... 21/01/2022 强化学习