1行のコードで自動的に学習!機械学習を自動化するAutoMLの最新論文!

1行のコードで自動的に学習!機械学習を自動化するAutoMLの最新論文!

3つの要点

✔️ テーブルデータを自動で学習し、高パフォーマンスを発揮するAutoMLフレームワーク
✔️ 既存のAutoMLフレームワークがモデルとハイパーパラメータの選択を重視している一方、本手法は複数のレイヤーを使ってモデルのアンサンブルとスタッキングを行っている。
✔️ この論文では、主要なAutoMLフレームワークの比較も行っている。

AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data
written by Nick Erickson, Jonas Mueller, Alexander Shirkov, Hang Zhang, Pedro Larroy, Mu Li, Alexander Smola
(Submitted on 13 Mar 2020)
Comments: accepted by ICLR 2020 Conference
Subjects: Machine Learning (stat.ML); Machine Learning (cs.LG)

はじめに
AutoMLとは?

AutoML(Automated Machine Learning: 自動化された機械学習)とは、その名の通り機械学習モデルの設計・構築を自動化するための手法全般を指す用語です。ニューラルネットワークの構造を自動で探索するNAS(Network Architecture Search)やモデルのハイパーパラメータを探索するHPO(Hyper Parameter Optimization)もAutoMLの一部と言えるでしょう。

AutoMLの魅力は、なんと言っても特別な機械学習や深層学習の知識がなくても強力な機械学習モデルの構築が可能になることです。また、すでに機械学習に精通しているエキスパートにとっても、モデル・アンサンブル手法・ハイパーパラメータの選択や特徴量選択・データの前処理といった作業はコストが高く、AutoMLを使うことでより効率的な作業が可能なります。

今回紹介するAutoGluon-Tabulerは、なんと1行のコードだけで未加工のテーブルデータ(エクセル表のように各行が個別のデータになっているようなデータ)を自動で前処理から学習まで行えてしまう非常に便利なフレームワークになっています。

この記事をシェアする