深層学習を用いた交通予測モデル手法のサーベイ

survey 2021年04月29日

3つの要点
✔️ 交通工学における深層学習モデルを用いた研究のサーベイ
✔️ 深層学習モデルを最初に適用した研究から説明
✔️ 今後の発展の礎となる論文

learning methods in transportation domain: a review
written by Hoang Nguyen, Le‐Minh Kieu, Tao Wen, Chen Cai
(Submitted on 30 July 2018)
Comments: Accepted to Selected Papers from the 25th ITS World Congress Copenhagen 2018.
Subjects: Machine Learning (cs.LG)

交通工学と深層学習

交通工学と深層学習にはネットワークという関連があり、従来の予測手法に対して深層学習を用いた表現や拡張手法が注目を浴びています。交通渋滞の軽減や交通需要の予測において従来の手法では道路ネットワークの複雑性とネットワーク内での時空間の依存性のせいで、データ転送やモデル化が困難でした。また、交通パターンはそれぞれの道路セグメントごとに個別の時間に依存しています。加えて、交通データは複数のデータソースとセンサーによって得られ、時間ごとのデータの変化、ネットワークの収束性、データの精度を考えると、学習予測モデルへいかに意味のある特徴を与えるかが重要になってきます。これらを踏まえてこの研究では、従来の機械学習手法（サポートベクターマシン、ロジスティックリグレッション、決定木など）による予測における欠点を明らかにし、深層学習モデルを用いて解決した研究を紹介しています。

タスクごとの事例

以下では交通工学における様々なタスクごとの研究を紹介します。

交通ネットワークの表現

Ma, X., Yu, H., Wang, Y., et al. "Large-scale transportation network congestion evolution prediction using deep learning theory" 2015.

交通ネットワークにおいて、道路セグメント（リンク）を道路の状況として表現した論文です。

交通渋滞を2次元配列で表現したものを以下に記します。$N$をリンク、$T$を時間インターバルとしています。

\begin{equation} \left[\begin{array}{ccccc}C_{1}^{1} & C_{1}^{2} & C_{1}^{3} & \ldots & C_{1}^{T} \\C_{2}^{1} & C_{2}^{2} & C_{2}^{3} & \ldots & C_{2}^{T} \\\vdots & \vdots & \vdots & \ddots & \vdots \\C_{N}^{1} & C_{N}^{2} & C_{N}^{3} & \ldots & C_{N}^{T}\end{array}\right]======\Rightarrow\left[\begin{array}{c}C_{1}^{T+1} \\C_{2}^{T+1} \\\vdots \\ C_{N}^{T+1}\end{array}\right] \end{equation}

$C^t_n$は時間$t$、$n$番目のリンクにおける、交通渋滞の状況を表しており、渋滞しているか否かのバイナリ値が入るか、交通状況（例：スムーズ、軽い渋滞、など）に当たります。モデルはインターバル$T$の情報を元に、$T+1$のすべてのリンクにおける交通状況を予測します。個々のリンクが独立であるならば、系列学習の問題に落とし込めるのですが、複数のリンクを考えた時に、時系列に対する深層学習が必要になります。

著者は、時系列における学習のためにReccurent Neural Networks (RNN)と各層における表現を学習するためのdeep Restricted Boltzman Machines (RBM)を用いて、交通ネットワークをモデル化しました (Fig. 4)。シンプルな構造である一方、モデルは過去のデータのみを用いて空間的関連性（例：道路セグメントの関係性）を学習し推測する必要があるため、予測精度精度は振るいませんでした。

この問題を解決するために、FouladgarらはConvolutional Neural Network (CNN)をベースに道路のセグメントの交通状況に比べて、流入、流出情報も推測するような交通流モデルを提案。CNNの特性をもちいて、交通ネットワークにおける道路セグメント間での空間的相関を学習させました。

このモデルでは、交通ネットワーク上のそれぞれの点を$S$、$S$につながる隣接点を$L_1, L_2, \ldots, L_n$、$S$の交通流内の点につながる隣接点を$R_1, R_2, \ldots, R_n$とすると、時間$t$の瞬間の状態は以下で表されます。

時系列 $\left[ t-\delta, \ldots, t-1, t \right]$において、

\begin{equation}\left[ L_n \rightarrow L_{n-1} \rightarrow \ldots L_2 \rightarrow L_1 \rightarrow S \rightarrow R_m \rightarrow R_{m-1} \rightarrow \ldots R_2 \rightarrow R_1 \rightarrow S \right] \end{equation}

ここで求めた交通状況の情報は図にある通りTraffic Conditionとして入力され、これに加えてイベントごとのIncidentsの情報を加えて最後の全結合ネットワークに加えることで$t+1$における交通流を予測しています。また、交通状況をモデル化するためにLong-Short Term Memory (LSTM)も紹介しており、RNNに比べて長期的な時系列の特徴を捉えることに成功しています。しかし、正しいコンフィギュレーションとパラメータの選択をしなければ特定の事故や限られた地域のモデル化に対して個々に処理できない問題点も残っています。

交通流予測

交通流の予測は交通モデルとデータ分析において基本的な問題です。具体的には、未来の道路セグメントにおける自動車の数を予測するタスクです。従来手法では、人手による特徴量選択や別々の学習、層の少ない構造により、精度の良い結果が求められていませんでした。これに対し、Huangらは複数出力を行う層と交通流予測を行うDeep Belief Networks (DBN)で構成される、深層学習にモデルを提案しました。

ある時間以前の時間インターバルにおけるすべての観測点を含む$X$を入力空間とし、DBNによって教師なし学習で特徴量を抽出します。そして、関連する道路をグループ化し学習することで、交通流を予測しています。グループ化する手法としていくつか提案されていますが（空間的クラスタリングや交通流変化クラスタリングなど）Huangらの研究では上層(regression layer)で推測した道路同士の重みを元に、関連道路をクラスタリングする重みクラスタリングを提案し、DBNを用いてデータから有用な特徴量を抽出することに成功しました。実験では、短期間と60分での交通流を予測しました。この研究の良い点として、従来手法のARIMAモデル、ベイジアンモデル、サポートベクターリグレッション(SVR)、ニューラルネットワークモデル、ノンパラメトリックのリグレッションモデルと比較している点があります。比較した結果、PeMSデータセットでテストしたときは従来手法の方が性能よく、low-to-mediumレベルのテストのみで提案手法の性能が上回ったため、依然改良の余地が残りました。

更に最近の研究では、PolsonとSokolovらによってL1制約とtanh層を用いた短期間の交通流予測モデルが提案されました。シンプルな構造ですが、交通流が急に変化するような特別なイベントデータにおける予測結果に対して評価を行っています。結果従来のニューラルネットワークに比べて平均二乗誤差が14%軽減されました。Zhaoらも同様なLSTMによる時空間モデルを提案し短期の交通予測を行いました。Zhaoらは従来手法に加えて、RNNやStacked Auto-Encoders (SAEs)などの深層学習モデルとも比較を行っており、LSTMの方が性能がいいことがわかりました。また、LSTMを用いることで長期においてRNNの性能を上回り、交通のビッグデータを用いて従来のパラメータを用いたアプローチの性能も上回りました。

信号制御

交通渋滞は道路上において非常に重要で解決すべき問題です。解決策として、インフラ設備を拡張する方法もありますが、高価で時間がかかることから、ここでは渋滞を軽減し公害を減らすために交通信号制御(TSCs)を用いて交通流を最適化する手法を紹介します。TSCの最適化には強化学習が多く用いられていますが、近年の利用可能なデータを最大限活用できていません。これを解決するために、GendersとRazaviは深層学習モデルを用いて適応的な交通信号制御エージェントを提案し、最適な制御政策を学ぶように学習させました。学習するにあたって、情報密度を元に新たな離散交通状態エンコーディングを提案しました。このエンコードされた交通状態は深層学習モデルの入力として扱われ、experience replayを持つQ学習を用いた学習に使用されます。深層学習を用いることで、本来必要な状態空間や行動空間の設計を必要とせずに行動を観測することで強化学習におけるプロセスを変化させることができます。これにより、全体の遅延の82%、列の長さを66%、交通時間を20%減らすことに成功しました。

Van Der Polは同様に深層学習とQ学習を扱い、すべての交差点での交通状態をバイナリ行列でエンコードし、単一のエージェントと連動する複数エージェントの強化学習による実験を行いました。その結果ベースラインモデルを圧倒し、複数エージェントに対しても応用可能であることが示されました。

次に、Liらは信号機のタイミングをQ学習により学習させ、深層学習を用いる代わりにsparse auto-encodersニューラルネットワーク(SAE)でQ関数を近似しました。SAEニューラルネットワークは状態行列を入力とし、取りうる行動を持つQ値を出力します。これにより、信号機設計においても深層強化学習による性能が上回ることがわかりました。

自動車検出の自動化

従来、交通データは時期ループ検出器や圧電センサーによって収集されていましたが、一定で信頼のおける数のデータを集めることが困難でした。深層学習アルゴリズムの台頭によって、UAVによる画像システムやカメラを用いた自動車識別システムが実用化されてきました。よく耳にする深層学習モデルは、自動車を車種別に識別するものですが、学習データセット不足のために学習済みモデルの転移学習が多く行われており、モデルの解明が必要とされていました。従来のサポートベクターマシーン(SVM)は地理的なアプローチと見た目ベースのアプローチを用いて複数クラスの自動車の識別に成功していました(Moussa 2014.)。Wangらは自動車検出用に2次元深層ビリーフネットワークを提案。入力に1次元ベクトルではなく2次元平面を用いて、識別可能な情報に対する双線形射影を行いました。その結果ですとデータに対して96.05%の識別精度を達成しました。

しかし、SoTAな自動車検出、識別アルゴリズムを用いても、悪天候など特別な状況においての検出は困難です。加えて、動画カメラを用いることで、交通量、交通密度、自動車の種類、また渋滞状況などをリアルタイムでモニタリングすることが可能です。さらに、自動車の速度検出を行うことで、、システムの地域における適応も行うことができ、今後これらの研究が進むことで、交通エージェントにとってより価値のあるデータの取得が期待されています。

交通需要予測

交通需要予測は、未来においてどれだけ道路と公共交通でユーザーが存在するかを予測するものです。交通需要を予測することで、様々な交通モデルにおける乗客の需要を入力として使用することが可能になります。多くの交通需要予測の研究は長期の需要予測で需要モデルの中でも4つのステップ（trip generation, trip distribution, modal choice, trip assignment）に分かれています。

一方、短期の交通需要予測は新たなトピックとして注目を浴びており、過去のデータを用いて近未来における交通需要の予測を目的とします。特に近年のスマートカード、センサー、プローブ、GPS、CCTVなどのデータ取得手法の激増によって研究が加速しています。これらの取得方法は量があり、情報量も多いですが、同時に解析構造を考えると複雑になります。そこで、深層学習を用いて短期における予測をより正確に、リアルタイム（もしくは非常に短い期間で）行っています。

Chengらは複数の深層学習モデルを提案し、大きな交通ネットワークにおいて1日ごとの交通需要の移り変わりを予測しました。モデルは時間、空間の相関ともに考慮しており、DNN、stacked LSTM、特徴別データ融合モデルの3つのモデルを実装、評価しています。結果、stacked LSTM ネットワークが一番性能が高いことがわかりました。次に、Keらは空間、時間に加えて外因的な関係性を考慮したアプローチを提案し、さらなる制度の向上に成功(Ke et al. 2017.)しました。

Zhuらはカーシェアリングの需要予測モデルを作成しました。SAEモデルを用いて需要の潜在的な時空間相関を学習させています。Yaoらはこのモデルを拡張し、タクシーの需要を予測するモデルを提案。このモデルは、時系列、空間、そしてセマンティックな視点で構成されています。他にも、Liuらは公共交通機関における乗客需要の予測モデルを提案し、DNNを用いて台北のrapid transit systemの需要を予測しました。入力に、過去の乗客の流れや時間的な情報、休日要因なども含めています。

事故予測

交通工学における重要な目標として、交通需要の予測や渋滞の軽減と同様に、交通の安全が挙げられます。交通事故が起きたら人間や建物に被害が及ぶだけでなく、そこを起点とし道路ネットワークに多大な遅延がもたらされます。それゆえに、交通事故の予測は交通状況を制御するシステムを構築する上で非常に重要なものとなります。

Chenらはdeep stack denoise autoencoderを用いて自動車の表現についての階層的特徴量をモデル化しました。事故データを用いてモデルを学習し、自動車データをリアルタイムで入力し交通事故のリスクマップを生成しています。実験の結果、正確に交通事故のリスクを予測出来ていますが、事故データの不足により信頼できるモデルの形成にはもう少し時間がかかりそうです。また、事故のデータのみでなく、立地データやorigin-destinationデータなどを用いることでモデルの改良を行えると考えられています。

個別の自動車事故予測に対して、Chenらは深層遺伝的アルゴリズム(GA)を用いて、背後での衝突を予測する最適なニューラルネットワークの提案をし、自動的な衝突回避システムへ適用しています。このモデルでは、車車間通信、路車間通信、GPSデータを用いる前提で衝突リスクの確率を考えており、GAを用いることで、効率的に最適解を用いることに成功しています。

自動運転

自動運転に対する深層学習手法の提案は容易に考えつくことですが、その一つとして、Huvalらの高速道路における運転に対しての深層学習手法の実験的評価を紹介します。この研究では、CNNモデルを用いると車線や自動車の検出はかなりの精度で可能だが、リアルタイムでの検出を行うためには、計算速度が必要であることが示されています。

また、多くの研究が高速道路や整備された道路における運転を想定している一方、Hadsellらはオフロードの自動運転に対して長期におけるDBNを提案しました。提案モデルによって、入力画像から特徴量が抽出され、リアルタイム識別器を学習することで運転可能性を予測しています。実験では、木や道の識別に成功していますが、性能は学習データのサイズに依存するようで、より情報量の多い画像が求められています。

運転者の行動

自動車内のセンサーとGPSデータを用いてドライバーの運転時の態度を検出するという研究が行われています。これは、ドライバーの居眠りを事前に防ぐことや自動運転の発展、関連する保険会社へ提供する情報をもたらすことを目的としています。GPSを用いたドライバーの行動分析の１つにDongらの研究があり、1次元の畳み込みを持つCNNとRNNを実装し性能を比較しました。これにより、複雑な運転パターンの抽出に成功し、従来手法に比べてドライバー検出の精度も向上しました。また、顔認識技術を用いた居眠り検出の研究では、顔の潜在特徴量と複雑な非線形特徴量を抽出することで、92%を超える精度での検出に成功しています。

まとめ

以上、いろいろな交通タスクにおいて深層学習を用いた手法の紹介を行いました。交通工学においての主目的である効率化と安全性に関連して、深層学習を用いることで複雑なデータに対する予測精度の向上に成功しています。今後はリアルタイムでの課題の解決、データセットの取得、様々な状況に対する手法の提案などがめざされています。自動運転の開発が進むにつれ、データ取得方法であったり運転者の行動、ユーザーの行動も変わってくることが予想されます。目まぐるしく変化する分野で、今後も深層学習を用いた研究が期待されます。