模拟×强化学习! 从模拟到现实生活中的自动驾驶系统(上)
三个要点
✔️模拟x强化学习
✔️真实世界的自动驾驶测试。
✔️模拟到真实的措施成功过渡。
Simulation-Based Reinforcement Learning for Real-World Autonomous Driving
written by Błażej Osiński, Adam Jakubowski, Piotr Miłoś, Paweł Zięcina, Christopher Galias, Silviu Homoceanu, Henryk Michalewski
(Submitted on 29 Nov 2019 (v1), last revised 4 Mar 2020 (this version, v3))
Comments: Accepted at 2020 IEEE International Conference on Robotics and Automation (ICRA)
Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Robotics (cs.RO)
Paper Official Code COMM Code
介绍
本文介绍了一篇关于通过仿真强化学习获取现实生活中的自动驾驶系统的论文。输入是来自摄像头的RGB图像和语义分割来训练输出转向(方向盘操作)的模型。在实验中,他们已经成功地将Sim-to-Real驾驶系统转移到了这里。在本文的前半部分,我们介绍了所提出的方法。文章后半部分将介绍实验和分析。让我们一起来看看吧。
动力
他们的研究动机是有效利用仿真技术构建现实生活中的自动驾驶系统。与现实生活相比,模拟可以让我们进行一些在现实生活中无法进行的危险动作,而且更容易收集数据。强化学习可以实现超越人工操作范围的探索,提供端到端的学习,这在当今非常流行。在自动操作中,端到端学习可以解决模块组合时,每个模块单独学习时出现的错误积累*。另一个原因是,简单地用手工规则设计每个模块是不现实的,因为工作量太大。
本文的重点是利用仿真数据构建真实的车辆驾驶系统:利用100年的仿真驾驶数据对模型进行训练。
误差的累积是指模块1的误差影响模块2的运行,模块2的误差变大,模块2的误差增大,影响模块3的运行,以此类推。模块1的误差会影响模块2的运行,模块2的误差就会变大,模块2的误差变大就会影响模块3的运行,以此类推。
贡献
本文的贡献有二
- 测试模拟中视觉随机性的效果
- 在现实世界中测试自动驾驶
这里的视觉随机性指的是天气的变化或图像输入中加入的噪声。
要阅读更多。
你需要在AI-SCHOLAR注册。
或与本文相关的类别