機械学習のためのデータ収集に新たな希望！？半教師学習の最前線！

論文 2020年02月12日

3つの要点
✔️ 一部のクラスにラベルが付与されていないデータセットで学習する半教師学習の手法
✔️ Consistency regularizationと呼ばれる手法で仮ラベルを付与し精度を向上
✔️ 既存のデータセット(CIFER-10)で95％の識別精度を達成

FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence
written by Kihyuk Sohn,David Berthelot,Chun-Liang Li,Zizhao Zhang,Nicholas Carlini,Ekin D. Cubuk,Alex Kurakin,Han Zhang,Colin Raffel
(Submitted on 21 Jan 2020)
Comments: Published by arXiv.
Subjects: Computer Vision and Pattern Recognition (cs.CV)

はじめに

機械学習の手法は大きく分けて教師あり学習と教師なし学習がありますが，それぞれ一長一短があります．教師あり学習は教師データを集める必要があり特にラベリングの作業はヒューマンパワーによるものが多いので大変時間と労力がかかります．一方で教師なし学習はクラスタリングのような限られたタスクしかできない場合が多く応用先が限られてしまいますがデータのラベリングは必要ないので前者に比べてデータ整形の手間がかからずに済みます．その2つの特徴のいいとこ取りをしようというのが半教師学習と呼ばれる技術です．

つまり，データ整形の手間をそれほどかけずに画像処理などの識別問題にも応用する試みで，今回紹介するのはその半教師学習の最新の手法です．

続きを読むには

(4047文字画像7枚)

AI-SCHOLARに
登録いただく必要があります。

1分で無料で簡単登録する

または