最新AI論文をキャッチアップ

テンソルCNNを用いた欠陥検知の強化

テンソルCNNを用いた欠陥検知の強化

Tensor

 3つの要点

✔️ 製造業における重要な課題である欠陥検出に向けて、テンソル畳み込みニューラルネットワーク(T-CNN)を紹介します。
✔️ 超音波センサーの部品における欠陥検出の実際のアプリケーションにおいてその性能を検証しています。
✔️ 
量子化したT-CNNは、モデルパラメータ空間を削減することで、同等のCNNモデルと比較して訓練速度と性能を大幅に向上させています。

Boosting Defect Detection in Manufacturing using Tensor Convolutional Neural Networks
written by Pablo Martin-Ramiro,Unai Sainz de la Maza,Sukhbinder Singh,Roman Orus,Samuel Mugel
[Submitted on 29 Dec 2023 (v1), last revised 26 Apr 2024 (this version, v2)]
Comments: Accepted by arXiv
Subjects: 
   Computer Vision and Pattern Recognition (cs.CV); Artificial Intelligence (cs.AI); Machine Learning (cs.LG); Quantum Physics (quant-ph)

code:  

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。

概要

製造業において欠陥検出は重要かつ挑戦的な課題です。本研究では、テンソル畳み込みニューラルネットワーク(T-CNN)を紹介し、ロバート・ボッシュの製造プラントで生産される超音波センサーの部品における欠陥検出の実際のアプリケーションにおいてその性能を検証しました。著者らの量子インスパイアされたT-CNNは、モデルパラメータ空間を削減することで、同等のCNNモデルと比較して訓練速度と性能を大幅に向上させます。具体的には、T-CNNは、最大で15倍少ないパラメータで4%から19%速い訓練時間で同じ性能を達成できることを示します。著者らの結果は、T-CNNが従来の人間の目視検査の結果を大幅に上回り、実際の製造アプリケーションで価値を提供することを示しています。

はじめに

製造業において、高品質な部品と欠陥のある部品を区別することは、製品の組み立て過程で非常に重要です。特に、複雑な構造を持つ大量生産の製造ラインでは、この作業は非常に難しくなります。従来、品質管理は経験豊富な人間の検査官が製品の画像を視覚的に検査することで行われていました。この方法では、1時間に数百から数千枚の画像を分析しなければならず、疲労が結果に影響を与え、結果が主観的で定量化が難しいという問題があります。したがって、人間の検査を超えて品質管理プロセスを自動化し、欠陥検出の精度と性能を向上させ、誤分類される製品の数を減らすことが重要です。

ビッグデータ革命により、大量のデータを活用した新しいアルゴリズムや技術の開発が進みました。現代のディープラーニング技術は、画像分類、物体認識、物体検出など、さまざまな分野で幅広く応用されています。畳み込みニューラルネットワーク(CNN)は、画像の最も関連性の高い特徴(色、形、その他のパターン)を異なるクラスから抽出し学習する能力により、画像分類で非常に成功しています。特に、製造業の欠陥検出などの重要なアプリケーションにおいても成功を収めています。しかし、現実の環境での欠陥検出は非常に難しい課題です。欠陥はしばしば微細で多様であり、識別が難しいため、これらの微細な特徴を捉えるために十分に複雑なモデルアーキテクチャが必要です。これが、しばしば大規模なパラメータを持つモデルと関連しているため、CNNの速度と精度にボトルネックをもたらし、訓練と推論時間に多くの計算資源を必要とし、結果の品質を低下させる可能性があります。

エネルギー(スマートグリッド)、ヘルスケア(患者モニタリング)、通信(モバイルネットワーク)、製造(品質管理、予知保全)などの分野では、データソースにできるだけ近いところにモデルを配置することが重要であることが示されています。これをエッジコンピューティングと呼びます。これらのアプリケーションでは、優れた性能と高い計算効率を持ち、リソースの使用量が少ないモデルを開発することが重要です。これにより、小型のエッジコンピューティングデバイスやFPGAデバイスにモデルを展開することが可能になります。したがって、CNNのパラメータ数を性能を犠牲にせずに削減することが重要です。

CNNのパラメータ数を削減することは、一見すると容易ではありません。学習した情報の量に関係なくパラメータの一部を盲目的に削減すると、精度の大幅な低下や画像の誤分類が発生します。ネットワークパラメータを効率的に削減する最も一般的なアプローチの一つはプルーニングです。プルーニングでは、ネットワークが学習した情報にほとんど寄与しない小さな値の重みやフィルターを削除します。CNNのパラメータ数を削減するための鍵となるのは、パラメータ空間の正しい部分をターゲットにし、学習に最も重要でないパラメータのみを削除することです。量子インスパイアされたテンソルネットワーク手法は、このタスクを効率的かつ体系的に実行するための有力な候補です。これにより、現代の機械学習技術のほとんどで使用される大規模なテンソルを効率的に分解することができます。例えば、テンソル分解法の一つであるカノニカル多重積分解(CP分解)や特異値分解(SVD)およびその高次テンソルへの拡張であるタッカー分解は、多次元テンソルを因数分解し、元のテンソルの中で相関の少ない部分を捨てることができます。これらの因数分解手法は、画像認識、成分分析、辞書学習、回帰モデルなど、さまざまな分野で利用されています。

この研究では、量子インスパイアされたテンソルネットワーク手法とテンソル分解のアイデアを使用して、CNNの効率を向上させ、学習するための重要なネットワークパラメータのみを保持することで、トレーニングウェイトテンソルのパラメータ数を削減しました。この結果として得られるテンソル畳み込みニューラルネットワーク(T-CNN)の価値を、製造業の実際の画像ベースの欠陥検出アプリケーションで実証します。

本研究では、T-CNNの潜在能力を示すために、ロバート・ボッシュの生産ラインで超音波センサーの不良部品を検出する実際の品質管理アプリケーションでT-CNNをテストしました。超音波センサーは、近距離の障害物検出を高速かつ高精度に行うために設計されており、狭い場所での操作や駐車の支援、障害物への迅速な対応による低速での緊急ブレーキ機能を提供します。また、物流、建設、農業分野における自動移動機器の衝突回避にも使用されます。これらのセンサーが日常生活で広く使用されているため、高品質な超音波センサーの製造は非常に重要です。この目的のために、著者らは製造された超音波センサーの部品の欠陥を検出するためのT-CNNを構築し、複数の生産ラインから収集された数千の例を含む画像データセットを使用して適用しました。著者らの結果は、T-CNNが品質管理において従来の目視検査を大幅に上回り、従来のCNNと同じ品質指標で性能を示しながら、パラメータ数と訓練時間の面で大幅な利点を提供することを示しています。

関連研究

画像分類と物体認識

ディープラーニング技術は、画像分類、物体認識、物体検出など、多くの分野で利用されています。 CNNは、画像の最も関連する特徴(色、形、その他のパターン)を抽出し、学習する能力に優れています。

・製造業における欠陥検出

CNNは、製造業における欠陥検出においても成功を収めており、多くの研究が行われています。 Tabernikらは、セグメンテーションベースのディープラーニングアプローチを用いて、製造業における表面欠陥検出を行いました。

・エッジコンピューティングの利用

多くの分野で、データソースに近いところにモデルを配置するエッジコンピューティングが利用されています。 スマートグリッド、ヘルスケア、モバイルネットワーク、製造業の品質管理と予知保全などでの応用があります。

・CNNのパラメータ削減

CNNは、しばしば過剰にパラメータを持ち、大規模なデータで作業する際に計算資源のボトルネックとなります。 プルーニング手法は、CNNのパラメータを効率的に削減するために広く使われています。

・テンソルネットワーク手法の応用

量子インスパイアされたテンソルネットワーク手法は、テンソルの効率的な分解を可能にし、CNNのパラメータ数を削減するための有力な手法です。 テンソル分解法(CP分解、SVD、タッカー分解)は、画像ビジョン、成分分析、辞書学習、回帰モデルなどで利用されています。

・実世界の製造環境での適用

ほとんどの研究は標準データセットで開発・テストされており、実世界の製造環境での性能を完全に代表するものではありません。 本研究では、テンソル分解手法を用いてCNNの効率を向上させ、製造業の実際の画像ベースの欠陥検出アプリケーションでその価値を実証しています。

問題の概要

問題の概要とデータセットの特徴を説明します。検査対象となる製品部品は、ピエゾ電気素子であり、2本のワイヤが溶接されています。この溶接プロセスは微細な欠陥を伴うことがあり、次の製造工程に進む前にこれらの欠陥を検出することが重要です。したがって、この問題は高品質な部品と欠陥のある部品を区別するための二値画像分類問題として自然に定式化されます。以下のサブセクションでは、データセットの詳細と本研究のアプローチを説明します。

データセットの説明

ビッグデータとIndustry 4.0の進展に伴い、製造企業は生産プロセス中に継続的に生成される膨大なデータを収集しています。本研究で使用するデータセットは、このデータのごく一部であり、欠陥部品を識別するための教師ありモデルを訓練する目的で手動でラベル付けされています。データセットには合計11,728枚のラベル付き画像が含まれており、それぞれの解像度は1280x1024ピクセルです。製品部品には以下の9種類の欠陥が存在し、それぞれが1から9の番号でラベル付けされています:

  1. ピエゾ電気素子の破損
  2. 溶接の弱さ
  3. 溶接の強さ
  4. 溶接の位置ずれ
  5. ピエゾ電気素子の位置ずれ
  6. 異物
  7. ワイヤの破損
  8. 評価不能な画像
  9. ワイヤの短絡、長さ不良、またはワイヤなし

この問題は複数の課題を呈します。まず、データは複数のツイン生産ラインから収集されており、照明条件の変動やカメラ位置の微妙な違いにより、データ分布が大きく異なる可能性があります。これにより、モデルの学習プロセスが難しくなり、望ましくないバイアスが導入される可能性があります。さらに、各生産ラインにおける欠陥の種類とその絶対数が異なるため、すべての生産ラインで良好な性能を維持する単一のモデルを訓練することが困難です。最後に、ピエゾ電気素子の供給元が異なる場合があり、欠陥の構造や材料が異なるため、識別がさらに難しくなります。

これらのデータの特徴は、性能に明確な影響を与える可能性があります。この課題を克服するために、次のサブセクションで説明するデータ前処理戦略を導入し、トレーニング中にはデータ拡張戦略を適用します。

問題の定式化

データセットは複数の生産ラインから収集された画像のコレクションで構成されているため、各欠陥タイプの分布とそれぞれの絶対数が異なります。これにより、一部の欠陥クラスのデータ不足が生じます。この問題を解決するために、すべての欠陥タイプを単一クラスにまとめ、二値分類問題として定式化します。

さらに、各生産ラインの照明条件の違いを調整するために、データ前処理ステージを導入し、すべての画像の色を標準化し、より均一にします。具体的には、すべての画像のコントラストを上げて色を均一化し、ピエゾ電気素子の形状や境界を強調することで、高品質な部品と欠陥のある部品を区別しやすくします。さらに、すべての画像を256x256ピクセルの解像度にリサイズし、ピクセル値を正規化します。 

テンソル畳み込みニューラルネットワーク

量子インスパイアされたテンソルネットワーク手法を使用してCNNアーキテクチャの効率を向上させる方法について説明します。まず、テンソルネットワークの基本概念を紹介し、T-CNNを構築するための手法を示し、CNNと比較してパラメータ数がどのように削減されるかを説明します。

畳み込みニューラルネットワーク (CNN)

このサブセクションでは、CNNの概要を説明し、そのアーキテクチャの構成要素と特徴抽出における畳み込み層の役割を説明します。クラシックなCNNは、主に以下の2つの成分から構成されます:

  1. 特徴抽出ネットワーク:入力画像やデータの最も関連性の高い特徴を、複数の畳み込み層とプーリング層を通じて抽出する。
  2. 分類ネットワーク:学習された特徴を、全結合層のシーケンスで処理し、画像やデータのラベルを予測する。

各畳み込み層は、色、エッジ、亀裂などの特定の特徴を学習します。プーリング層は、学習された表現のサイズを縮小し、データのブロックを平均値や最大値に置き換えます。学習された特徴は、分類ネットワークに入力され、最終的なラベル予測に使用されます。

しかし、複雑な画像構造を処理するためには、多くの畳み込み層を使用する必要がある場合があります。これにより、モデルのパラメータ数が増加し、トレーニング時間が長くなり、誤分類や精度の低下が生じる可能性があります。したがって、ネットワークの表現力とパラメータ数のバランスを取ることが重要です。理想的には、キー情報を含むパラメータのみを保持し、冗長なパラメータを削除してモデルの性能と精度に影響を与えないようにすることです。

テンソルネットワークの基本概念

テンソルネットワーク(TN)は、もともと物理学において、量子系の基底状態の効率的な表現を提供するために登場しました。TNは、データの効率的な表現と圧縮のために、高い可能性を持っています。特に、TNは、分類、クラスタリング、異常検出、微分方程式の解法などの機械学習タスクで非常に成功を収めています。

テンソルは、複数次元の複素数の配列であり、各次元はテンソルのランクに対応します【図1参照】。テンソルネットワークダイアグラムは、テンソルを表現するための視覚的な表記法です。ランク-nのテンソルは、n本の連結された線を持つオブジェクトとして表されます。これにより、テンソルの数式表現の負担が軽減されます。

 図1. テンソルネットワーク図。各ランクnのテンソルは、それぞれがテンソルの個々の次元を表すn個の連結リンクを持つオブジェクトで示される。スカラー、ベクトル、行列、rank-nテンソルは、それぞれ0, 1, 2, n個の連結した足を持つ。          

テンソルの収縮(一般的な行列の乗算に相当)は、テンソルネットワークダイアグラムでも表現されます。例えば、ランク2のテンソル(行列)の収縮は、共有された線を接続することで表現されます【図2参照】。

図2. テンソルの縮約。の縮約は、共有された添字上のトレースと等価である。共有リンクを結ぶことで表現される。ここでは、RテンソルとSテンソルが共有の足βに沿って連結されている。この収縮操作は行列の乗算と等価である。行列の乗算と等価である。

テンソル分解の重要な技術の一つが特異値分解(SVD)です。SVDは、入力行列を2つのユニタリ行列と特異値の対角行列の積に分解します。SVDは、高次テンソルに対してタッカー分解を使用することで拡張されます【図3参照】。

図3. 行列のSVDによる2つのランク3テンソルへの分解。行列積演算子(MPO)と呼ばれる。

CNNのテンソル化

次に、テンソルネットワークとタッカー分解を使用してCNNをテンソル化する方法を説明します。2D CNNを考えます。クラシックなCNNの各畳み込み層には、ランク4の重みテンソルがあります【図6参照】。CNNのトレーニングプロセスは、各層の重みテンソルの最適なパラメータを見つけることです。

テンソル分解を適用して、重みテンソルを因数分解し、最も関連性の高い情報を保持しながら、冗長な部分を削除します。タッカー分解を使用して、元のテンソルをコアテンソルと4つの因数行列の積に近似します。このとき、因数行列の次元は圧縮率を制御します。この方法でCNNをテンソル化したモデルをT-CNNと呼びます。

図4. 畳み込みのHOSVD(タッカー)因数分解 重みテンソルをコアテンソルと4つの因子行列に分解する。χは因子行列の因数分解(切り捨て)ランクである。行列の因数分解ランクである。

T-CNNのトレーニングは、勾配降下法による自動微分とバックプロパゲーションを使用して行われます。T-CNNでは、クラシックなCNNとは異なり、各畳み込み層において、1つの大きなランク4の重みテンソルではなく、4つの小さな因数行列とコアテンソルを更新します。テンソル化されたモデルのトレーニングは、新しいテンソル表現の圧縮空間で直接行われます。

パラメータの計数

クラシックなCNNでは、モデルパラメータは主に以下の3つのカテゴリに分類されます:

  1. 畳み込み層のパラメータ(Nc)
  2. バイアスパラメータ(Nb)
  3. 分類層のパラメータ(Nr)

CNNの総パラメータ数(NCNN)は以下のように計算されます:

テンソル化した畳み込み層のパラメータ数は、以下のように計算されます:

T-CNNの総パラメータ数(NT-CNN)は以下のようになります:

パラメータ圧縮率(Cr)は、以下のように定義されます:

実験の設定

本セクションでは、欠陥検出アプリケーションにおいてモデルを構築し、訓練し、テストするために使用した実験の設定を説明します。

モデルアーキテクチャ

参考モデルとして、標準的なVGG16アーキテクチャの簡易版を使用しました。このCNNモデルの構造は、最適な性能を得るために段階的にチューニングされ、最適化されています。最適化されたCNNモデルを基に、このアーキテクチャをテンソル化し、通常の畳み込み層をテンソル畳み込み層に置き換えた新しいT-CNNモデルをゼロから訓練しました【図1参照】。各層のランク設定はハイパーパラメータとして最適化されます。

T-CNNを構築するためには、MPS、タッカー分解、CP分解などのさまざまなテンソル分解スキームを使用することができますが、本研究ではタッカー分解が最も安定した訓練と優れた結果をもたらすことがわかりました。さらに、CNNの分類層も標準的なテンソル化スキームを使用してテンソル化することが可能です。特に、テンソル回帰層は、畳み込み層の出力をフラット化せずに直接接続するため、興味深いアプローチです。しかし、本研究ではテンソル回帰層の導入は性能指標に対して有益ではなかったため、最終モデルには含まれていません。

訓練設定

すべてのモデルはPyTorchを使用して実装され、メモリ使用量と計算要件を削減するために混合精度訓練技術が利用されました。すべてのモデルは、Adamオプティマイザを使用して80エポックで訓練されました。学習率は、マルチステップ固定学習率スケジューラを使用して3×10-4から1×10-6まで変化させました。モデルは、16GBのメモリを搭載し、ディープラーニングの訓練と推論をハードウェア的に加速するために設計されたNVIDIA T4 GPU上で訓練されました。

データセット全体を3つに分割し、80%を訓練用、10%を検証用、10%をテスト用としました。このようにして、11,728枚のラベル付き画像のうち、9,382枚を訓練に使用し、1,173枚を検証に、残りの1,173枚をテストに使用しました。最初の分割はモデルの訓練にのみ使用され、2つ目はモデルの選択とハイパーパラメータのチューニングに使用され、最後の分割は見えないデータでのモデル性能をテストし、すべての結果を生成するために使用されました。

現在のディープニューラルネットワークモデルは良好な結果を得るために多くのデータを必要とし、オーバーフィットを防ぐためです。このため、訓練中にデータの多様性を増やすために、既存のデータをわずかに変更して新しい訓練例を作成するデータ拡張を実装しました。このプロセスは、各生産ラインに特有のスプリアスな相関関係(残存する色のパターンやカメラのわずかな向きの違いなど)を排除し、モデルをより堅牢にします。具体的には、すべての画像に対してランダムな色の変更、リサイズクロップ、およびカットアウト拡張を組み合わせて使用し、最良の性能を得るために調整しました。この前処理および拡張手法により、各生産ラインの特定の特徴に対してモデルをより堅牢にします。

さらに、元のデータセットにおいて不良品の画像の数が正常品の画像よりも多いため、モデルが多数派クラス(正常品)のみを正しく識別するように学習する可能性があります。このクラスの不均衡を緩和するために、不良品の画像をさらに収集し、少数派クラスにより重要性を与える重み付けランダムサンプリング手法を使用しました。

性能指標

不均衡なデータセットでは、精度などの性能指標が誤解を招く可能性があります。したがって、本研究では、品質指標として精度、再現率、およびF1スコアを使用してモデルの性能を評価しました。これらの指標は以下のように定義されます:

さらに、品質管理プロセスにおける欠陥画像の検出漏れを測定するために、「スリップスルー」指標を導入しました。この指標は、欠陥画像のうち検出を逃れる割合を測定します。スリップスルーは次のように定義されます: Slip-through=1−Recall

 

ニューラルネットワークの効率を測定するために、圧縮率と訓練時間の改善を組み合わせた指標を選びました。訓練時間の改善(T)は、T-CNNの訓練時間の優位性をCNNの訓練時間で割った値で定義されます:

 

結果

このセクションでは、高品質および欠陥のあるピエゾ電気素子部品の分類におけるT-CNNの性能について詳細な分析を行います。

T-CNNの性能

このサブセクションでは、テンソル畳み込み層のランク設定が異なるT-CNNの性能を、品質指標、パラメータ数、および訓練時間の観点からクラシックなCNNと比較して分析します。

モデルの詳細とランク設定

各テンソル畳み込み層は、4ランクのテンソルでパラメータ化されます。入力チャネル数(rin)と出力チャネル数(rout)は、畳み込みフィルターのサイズ(および𝑤)と関連しています【表1参照】。T-CNNは、固定されたランク設定を持つ異なるモデルで構築され、各テンソル畳み込み層の最大ランク設定は上限として機能します。

表1. 複数のランク構成を持つT-CNNモデルの性能(品質指標、圧縮率、学習時間の改善によって測定 最適化されたCNNに対する圧縮率と学習時間の改善。2列目から5列目までは、最適化されたCNNにおける T-CNNの各テンソル畳み込み層における基礎となるテンソルの4次元のランク。各モデルについて、 結果は20の異なるランダムシード、したがって20の異なるネットワーク初期化に対する平均として示され、不確実性は1標準偏差に対応する。不確かさは1標準偏差に相当する。

表1には、テンソル畳み込み層のランク設定が異なる5つのT-CNNモデルの詳細な分析結果が示されています。各モデルのランク設定は、(96, 96, 3, 3)、(64, 64, 3, 3)、(32, 32, 3, 3)、(16, 16, 3, 3)、(8, 8, 3, 3)です。これらの設定は、品質指標、圧縮率、および訓練時間のバランスを示しています。

品質指標と圧縮率

T-CNNの性能を評価するために、精度、再現率、F1スコアを品質指標として使用しました。表1の結果は、ランク(96, 96, 3, 3)のT-CNNが最適化されたCNNと同じ性能を示し、20%少ないパラメータと同様の訓練時間であることを示しています。さらに、ランク(64, 64, 3, 3)および(32, 32, 3, 3)のT-CNNも同様の品質指標を達成し、パラメータ数の大幅な削減と訓練時間の短縮が見られます。

この結果は、テンソル畳み込み層がデータの主要な相関を効果的に捉え、ノイズを無視しながら本質的な情報を保持するため、圧縮されたパラメータ空間がCNNよりも優れていることを示唆しています。ランクが低いT-CNNは、品質指標と計算効率の間にトレードオフが存在し、非常に高い圧縮率を達成しながら、性能のわずかな低下を示しています。

エラー分析

表2の最適なT-CNNモデルの誤差分析を行います。目的は、将来のモデル改善のための貴重な洞察を得ることです。

表 2. ランク構成(32, 32, 3, 3)のテストデータに対する最適なT-CNNモデルの性能(品質指標、圧縮率、学習時間の改善によって測定)。この場合、判定閾値に関係なく、モデルの性能の指標としてAUC指標も含める。この場合、決定閾値に関係なく、モデルの性能の指標としてAUC指標も含める。比較のために最良のCNNの結果を示す。いずれの場合も、選択されたモデルは、検証データのF1スコアで測定される最高の性能を示した。すべての測定基準は、固定 これはスリップスルーを低くするための鍵である。参考までに、典型的な生産ラインのシフトにおける人間による検査の推定スリップスルーは10%である。

誤分類の原因

誤分類された欠陥画像の詳細な分析により、以下の結論が得られました:

  1. いくつかの画像は、スリップスルーを減少させるために決定閾値を下げることで正しく分類される可能性があります。
  2. いくつかの画像は誤ってラベル付けされているため、サンプルの再注釈が必要です。
  3. 弱い溶接、強い溶接、位置ずれ溶接、および異物のクラスに属する画像が識別しにくいことが確認されました。

これらの誤分類の改善には、これらの欠陥クラスのデータを増やし、訓練セットに追加することが重要です。さらに、データセット全体の精査が必要です。

最適なT-CNNモデルの性能

最適なT-CNNモデルは、ランク(32, 32, 3, 3)で、クラシックなCNNと同等の品質指標を達成し、パラメータ数が4.6倍少なく、訓練時間が16%短縮されています。これは、圧縮されたパラメータ空間が主要な相関を効果的に捉え、不要な情報を無視できることを示しています。さらに、このモデルは、品質管理プロセスにおける欠陥検出のスリップスルー率を10%から4.6%に減少させることで、人間の検査よりも大幅に優れています。

このような結果は、製造業の品質管理システムにおいて重要な経済的および品質保証上の利点をもたらし、製品の品質と信頼性を向上させます。また、T-CNNモデルを品質管理システムに統合することで、人間の検査員の負担を軽減し、効率性と生産性を向上させることができます。

結論と展望

品質管理の自動化と、量産品における不完全品および欠陥品の検出は、製造業における最も重要かつ挑戦的なタスクの一つです。従来の手法では、製品画像の人間による目視検査に依存しており、欠陥が微妙で識別が難しいため、エラーが発生しやすくなります。このため、結果の質や人間の検査官にとっての負担が大きくなります。本研究では、テンソルネットワーク手法をCNNの構造に統合し、テンソル畳み込みニューラルネットワーク(T-CNN)を構築しました。T-CNNモデルは、ロバート・ボッシュの製造プラントにおける実際の品質管理プロセスにおける欠陥検出の自動化と改善に利用されました。

T-CNNモデルは、クラシックなCNNの畳み込み層を高次テンソル分解に基づくテンソル畳み込み層に置き換えることで構築されています。クラシックなCNNの各畳み込み層のランク4重みテンソルは、4つの因数行列と1つのコアテンソルに分解されます。因数化されたテンソルの相互接続次元はデータ圧縮率と因数化された部分間の相関量を制御します。著者らは、T-CNNモデルを新しいテンソル表現の圧縮パラメータ空間でゼロから訓練しました。その結果、T-CNNは、クラシックなCNNと比較して、パラメータ数が大幅に少なく、訓練時間が短縮されるという2つの利点を持ちながら、同等の学習能力を示しました。これらの利点は、計算コスト、訓練時間、堅牢性、および解釈性の面で重要な利益を提供します。

著者らの結果は、ランクが高いT-CNNは、精度、再現率、およびF1スコアなどの品質指標において、クラシックなCNNと同じ性能を達成しながら、パラメータ数と訓練時間の両方で適度な改善を提供することを示しています。ランクが低いT-CNNは、品質指標を維持しながら、パラメータ数を大幅に削減し、訓練時間を短縮します。特に、各層の最大ランクが(32, 32, 3, 3)のT-CNNは、パラメータ数が4.6倍少なく、訓練時間が16%短縮されています。この結果は、テンソル畳み込み層によって定義された圧縮パラメータ空間が、データの主要な相関を捉え、不要なノイズを無視する上で、クラシックなCNNよりも優れていることを示唆しています。

さらに、著者らのモデルは、人間の検査よりも大幅に優れた性能を示し、欠陥画像の検出漏れの割合を10%から4.6%に減少させました。典型的な生産ラインにおいて、この54%の改善は、コスト削減と製品の品質と信頼性の向上に繋がります。さらに、T-CNNモデルを品質管理システムに統合することで、単調で時間のかかる視覚検査タスクから人間の検査員を解放し、人材を創造的で問題解決能力が求められる分野に投入することができます。これにより、効率性と生産性の向上が期待されます。

T-CNNの優位性は他のデータセットにも適用可能であることが示唆されており、製造業におけるリアルタイム欠陥検出のための品質管理プロセスに統合する大きな可能性を秘めています。T-CNNモデルは、高速で正確かつ効率的であり、モバイルデバイス、エッジコンピューティングデバイス、およびFPGAなどの小型デバイスに展開することができます。さらに、T-CNNのパラメータ数が少ないため、エネルギー効率が向上し、小さなエネルギーリソースやバッテリーを持つデバイスに適しています。

最後に、T-CNNの因数化ランクはハイパーパラメータとして機能し、テンソル畳み込み層のパラメータ数を制御します。本研究では、複数のランク設定を使用して広範な分析を行いましたが、最適な性能を得るためには、システマティックなハイパーパラメータ最適化を行うことが推奨されます。

  • メルマガ登録(ver
  • ライター
  • エンジニア_大募集!!
友安 昌幸 (Masayuki Tomoyasu) avatar
JDLA G検定2020#2, E資格2021#1 データサイエンティスト協会 DS検定 日本イノベーション融合学会 DX検定エキスパート 合同会社アミコ・コンサルティング CEO

記事の内容等について改善箇所などございましたら、
お問い合わせフォームよりAI-SCHOLAR編集部の方にご連絡を頂けますと幸いです。
どうぞよろしくお願いします。

お問い合わせする