最新AI論文をキャッチアップ

シミュレーション x 強化学習!シミュレーションから現実の自動運転システムへ(前半)

シミュレーション x 強化学習!シミュレーションから現実の自動運転システムへ(前半)

Self-Driving

3つの要点
✔️ シミュレーション x 強化学習
✔️ 現実での自動運転テスト

✔️ Sim-to-real方策転移に成功

Simulation-Based Reinforcement Learning for Real-World Autonomous Driving
written by Błażej OsińskiAdam JakubowskiPiotr MiłośPaweł ZięcinaChristopher GaliasSilviu HomoceanuHenryk Michalewski
(Submitted on 29 Nov 2019 (v1), last revised 4 Mar 2020 (this version, v3))

Comments: Accepted at 2020 IEEE International Conference on Robotics and Automation (ICRA)
Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Robotics (cs.RO)
Paper  
Official Code COMM Code

はじめに

今回紹介する論文は,現実での自動運転システムをシミュレーションでの強化学習で獲得するという論文です。入力はカメラからのRGB画像とセマンティックセグメンテーションで,ステアリング(ハンドル操作)を出力するモデルを学習します。実験では,Sim-to-Realの運転システムの転移に成功しています。本記事(前半)では,提案手法までを紹介します。後半記事では実験と分析を紹介します。それでは見ていきましょう。

モチベーション

研究の背景には,現実での自動運転システム構築に,シミュレーションを有効活用したいというモチベーションがあります。シミュレーションでは,現実では行えないような危険な動作が可能であり,現実と比較して,データの収集が容易です。強化学習では,手動の範囲を超えた探索が可能であり,今流行りのEnd-to-Endの学習ができます。自動運転は,End-to-Endの学習は,モジュールに分けてそれぞれ学習したときの,モジュールを結合した際に生じる誤差の蓄積※を解消することができます。また,単純に,1つ1つのモジュールを手作業のルールで設計していくのは,作業量が多すぎて現実的ではないという理由もあります。

この論文では,実車における運転システムの構築の際に,シミュレーションのデータが利用できるのかが焦点となっています。100年分のシミュレーションでの運転データを用いて,モデルを学習しました。

誤差の蓄積とは,モジュール1の誤差が,モジュール2の動作に影響し,モジュール2の誤差がさらに大きくなり,大きくなったモジュール2の誤差が,モジュール3の動作に影響し...というように,モジュールを組み合わせていくことで,誤差が増大していくことです。

貢献

  この論文の貢献は以下の二つです。

  • シミュレーションでの視覚的ランダム性の効果の検証
  • 現実での自動運転のテスト

ここでの視覚的ランダム性とは,天気の変更や,画像入力にノイズを加えることをいいます。

続きを読むには

(4575文字画像5枚)

AI-SCHOLARに
登録いただく必要があります。

1分で無料で簡単登録する

または
  • メルマガ登録(ver
  • ライター
  • エンジニア_大募集!!

記事の内容等について改善箇所などございましたら、
お問い合わせフォームよりAI-SCHOLAR編集部の方にご連絡を頂けますと幸いです。
どうぞよろしくお願いします。

お問い合わせする