Diffusion Policy : 拡散モデルでロボットを動かす!ロボットがピザを作れる時代に!? Diffusion Policy : 拡散モデルでロボットを動かす!ロ ... 2023年11月06日 Diffusion Model
Implicit Behaviral Cloning : 模倣学習の新しい定式化!ロボットの複雑な動作を実現! Implicit Behaviral Cloning : 模倣学習の新 ... 2023年10月30日 robot
Wikipediaはオフライン強化学習を補助できるか? オフライン強化学習に言語タスクでの事前学習を導入! Wikipediaはオフライン強化学習を補助できるか? オフライン強化 ... 2023年10月11日 Offline Reinforcement Learning
Jump-Start RL: 事前学習した方策によって「ガイド」を行うことで探索を効率化! Jump-Start RL: 事前学習した方策によって「ガイド」を行う ... 2023年10月05日 Offline Pre-Training and Online Finetuning
Cal-QL: 効率的なオンラインファインチューニングを実現する, 事前学習に特化したオフライン強化学習 Cal-QL: 効率的なオンラインファインチューニングを実現する, 事 ... 2023年09月28日 Offline Reinforcement Learning