スマート製造プロセスにおけるトポロジカルデータ解析--最新技術に関するサーベイ

Topological Data Analysis 2024年01月11日

3つの要点
✔️ インダストリー４．０におけるトポロジカルデータ解析（TDA）について文献調査しています
✔️ TDAを使用することで、従来の方法では検出が困難なデータ内のパターンや関係性を特定することができます
✔️ TDAが工業生産と製造プロセスの領域におけるセンサーやその他のデバイスからの複雑なデータセットの分析に特に適した手法であることが示されました

Topological Data Analysis in smart manufacturing processes -- A survey on the state of the art
written by Martin Uray, Barbara Giunti, Michael Kerber, Stefan Huber
(Submitted on 13 Oct 2023)
Comments: Preprint still under review
Subjects: Machine Learning (cs.LG); Algebraic Topology (math.AT); Applications (stat.AP)

code：

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。

概要

トポロジカルデータ解析（TDA）は、複雑な多次元データの解析にトポロジーの技法を用いた数学的手法であり、医学、材料科学、生物学などの分野で広く応用され、成功を収めています。本サーベイでは、インダストリー4.0の文脈における工業生産と製造という、さらに別の応用分野におけるTDAの最新状況を要約します。工業生産と製造の設定におけるTDAの応用について、厳密かつ再現可能な文献検索を行います。その結果、製造プロセスにおける応用分野と入力データの種類に基づいて、分類・分析されました。この分野におけるTDAとそのツールの主な利点を強調し、その課題と将来の可能性について説明します。最後に、どのTDA手法が産業（の特定分野）において十分に活用されていないか、また、特定されたアプリケーションのタイプについて議論します。

ChatGPTに作ってもらった、この論文の印象を表す画像です。

はじめに

インダストリー4.0は、デジタル技術と物理技術の融合による第四次産業革命です。この革命は製造プロセスを変革し、リアルタイムでデータを収集・分析し、インテリジェントな意思決定を行い、カスタマイズされた製品やオンデマンド生産などの変化する条件に適応するスマート生産システムの開発を可能にしています。トポロジーは、オブジェクトの形状を研究する数学の分野です。最近のトポロジカルデータ分析（TDA）は、データ分析、コンピュータサイエンス、トポロジーが交差する分野で、特に後者を利用してデータを分析します。TDAは異常検出、画像処理、ゲノム配列決定、予測保守など幅広い用途で有効であることが示されています。しかし、インダストリー4.0におけるその可能性はまだ実現されていません。著者らは、TDAが特にスマート生産システムに適していると考えます。これは、センサーや他のデバイスが生成する複雑なデータセットから洞察を抽出し、それに基づいて意思決定を行うために利用できるからです。さらに、TDAを使用することで、従来の方法では検出が困難なデータ内のパターンや関係性を特定することが有益です。本調査では、製造および生産プロセスにおけるTDAの現状の応用をレビューし、これらの分野における将来の研究方向を特定します。

トポロジカルデータアナリシス（TDA）の応用が非常に多岐にわたり、個々の研究者がすべての進展を追跡することは不可能です。このため、TDAの応用領域へのインターフェースをどのように構成すれば、理論家と実務家の両方がアクセスできるようになるかという問題が提起されています。最近の取り組みとしては、TDAのアプリケーションを簡単な方法で検索できる検索エンジンDONUTがあります。この知識を構造化するもう一つの方法は、TDAが応用セットアップにどのようにリンクされてきたかについての異なるアプローチを要約し、比較した科学的な調査論文です。これらの記事は通常、理論を説明し、TDAから利益を得ることができる分野の多様性を示す、いくつかの応用例を提示することに重点を置いています。TDAのすべてのアプリケーションを包括的に調査すると、扱いきれないサイズの文書になってしまうため、このアプローチは合理的です。特に、TDAの理論的成果と産業応用とのギャップを埋めるレビュー作品については、産業生産および製造プロセスでのTDAの応用に関する他のレビュー論文は見当たりません。一方、他の分野へのギャップを埋める文献レビューや、製造プロセスに関する文献調査が存在しますが、TDAに特化しているわけではありません。著者らは、半導体製造の電子設計自動化におけるマシンラーニング（ML）およびその他のデータ分析手法の応用をレビューしており、この製造プロセスにおけるマッパーアルゴリズムの適用についても簡単に触れています。スマートファクトリーのためのビッグデータアナリティクスの課題については、TDAの手法、例えばクラスタリングデータのためのマッパーアルゴリズムが有望であると述べていますが、TDAの実際の応用に関する経験的な研究は提供していません。最近では、加工におけるチャター検出の現状についてのレビューが行われ、この分野の膨大な研究量と、特定の問題に対するTDAの適用の可能性が強調されています。金属成形およびブランキング技術へのデータ駆動型アプローチに関する現行の文献についてもレビューされており、この調査ではUniform Manifold Approximation and Projection（UMAP）の手法が明示的に言及されています。しかし、Industry 4.0やTDAには、もっと多くの領域や方法が含まれています。ビッグデータもIndustry 4.0に関連する分野です。2017年に発表された調査は、幾何学的およびトポロジカルな手法の理論的成果とこの工学分野との間のギャップを埋めることを目指しています。また、3Dプリンティングという優れた技術を持つ付加製造の分野では、永続的ホモロジー（PH: Persistent Homology）およびマッパーアルゴリズムの応用について議論されています。ここでは、産業アプリケーションのドメインエキスパート向けに特化した異なる種類の調査を提案しています。

著者らの知る限り、これは以下の質問に対処する最初の論文です。すなわち、産業製造および生産におけるTDAの現在の応用は何か？また、どのような応用が欠けており、したがって注目すべきか？

本稿では、工業生産と製造プロセスにおけるTDAの適用に関する現在の文献の概要を紹介します。このサーベイは、TDA分野の理論家と工業生産の実務家の双方にとって有益であると確信しています。両分野は非常に活発で、出版物の数も増えていますが、相互の認識はまだ不足しています。このサーベイの目的は、このギャップを埋め、これらの世界の間のアイデアや手法の交換を促進することです。

本稿の貢献は以下の通りです。

1)工業生産と製造プロセスの分野におけるTDAの適用に関する文献を概観すること、
2)使用されている分野と方法の組み合わせを示すこと、
3)十分に活用されていない適用分野と方法の組み合わせを強調すること。

インダストリー4.0におけるスマート製造

インダストリー４．０

「インダストリー4.0」という用語は、2010年代初頭にドイツ政府によって提唱され、「第四次産業革命」という動きを促進するために用いられました。この動きは、生産の柔軟性の向上、より適応性の高い機械の運用、そしてより賢く自律的な機械、生産ライン、工場、さらにはサプライチェーン全体の運営が求められています。これにより、ロットサイズ1の生産や大量カスタマイゼーション、そして機械単位だけでなく価値チェーン全体の生産の最適化が可能になり、新しいビジネスモデルや運用モデルの実現にも寄与しています。インダストリー4.0には、「スマートファクトリー」や「認知工場」などの用語も生まれています。しかし、インダストリー4.0は製品の生産だけにとどまらず、その文脈はより広範です。同時に進行している他の技術、例えば遺伝子配列決定からナノテクノロジー、再生可能エネルギーから量子コンピューティングに至るまでの技術を取り込むことで、革新的で革命的な製品を生み出す可能性があります。これらのシステムの運用には、インダストリー4.0の4つの設計原則が必要です。それらは、

「相互接続」（センサーや機械、人間が相互に接続されている）、
「情報透明性」（システム内のすべてのコンポーネントに関する情報が透明であること）、
「技術支援」（技術設備が意思決定、問題解決の支援、または困難または危険なタスクの支援または引き継ぎを行う）
「分散型決定」（中央集権的な存在による意思決定ではなく、エッジでの意思決定）

です。サイバーフィジカルシステムは、持っている情報に基づいて独自の決定を行うことができます。例外的な場合は、より高位のインスタンスに委ねられます。Erbozのレビューでは、インダストリー4.0のシステムの主要コンポーネントとして、ビッグデータとアナリティクス、自律ロボット、シミュレーション、水平・垂直システム統合、産業用IoT、クラウド、サイバーセキュリティ、付加製造、拡張現実（AR）が挙げられています。インダストリー4.0の文脈でのサイバーセキュリティについては、運用技術（OT）セキュリティという用語も参照されます。OTセキュリティは、OTシステムのサイバーセキュリティ分野です。付加製造という用語は、工業生産文脈における3Dプリンティング技術を指します。この技術では、三次元オブジェクトがコンピュータ制御のプロセスにより層状に材料を積み重ねて作成されます。

生産と製造

ここでは、製品を作成するプロセスに関連する用語として、「製造（Manufacturing）」と「生産（Production）」が用いられていることを説明しています。分野によっては、半導体のように「製作（Fabrication）」という用語も見られるとのことです。製造、生産、製作という用語には意味の違いがあるものの、この論文では「生産」と「製造」を同義語として、これら三つの用語を総称して使用しています。製品の製造には、生産ラインの産業用機械によって適用される一連のプロセスステップが含まれます。設計プロセスの始めには、製品要件の定義が行われ、次にその概念設計と評価が行われます。これに基づいてプロトタイプが作成され、工業的再生産のための図面が作成されます。ここで「工業的」とは、繰り返し可能で効率的かつ効果的な方法を意味します。これらの図面と製品の要件は、材料、プロセス、および生産機器の選択のための仕様を定義します。その後、生産は検査および品質保証によって伴われ、製品が包装される前に完了します。製造工学または生産工学は、製造の全プロセスに関わる工学の分野を記述しています。この分野では、生産プロセスの計画や最適化などが関心事です。図1は、製造工学プロセスの段階を順に示しています。一般的に、インダストリー4.0におけるスマート製造は、従来の製造に比べて新たな課題を提起します。ここでは、製造プロセスを改善し、インダストリー4.0への統合のためのニーズを満たすために、追加の戦略や技術が使用されます。スマート製造システムのための技術とアーキテクチャの概要については、別の文献で説明されています。

図1. 製品の定義から始まり、最終的に大量生産される成果物までの、製品製造に沿った段階を持つ製造エンジニアリング・プロセス。読みやすくするため、フィードバック接続は省略。

トポロジカルデータ解析

トポロジカルデータアナリシス（TDA）の分野は、マッパーアルゴリズム、永続ホモロジー（PH）、そしてUniform Manifold Approximation and Projection（UMAP）の3つの主要な方法に分類されています。これらの方法に共通しているのは、まず手元にあるデータを適切な幾何学的表現に変換し、そのトポロジカルな特性を分析することです。重要な観察点は、データを分析する際に多くのパラメータを扱う必要があるということです（チューニング、削除、重み付けなど）。トポロジーは形状を扱う数学の分野であり、データがしばしば形状を含むため、形状に「関連する」パラメータを処理するためにトポロジーを使用できます。

これら三つの方法は、パラメータを異なる方法で扱います。マッパーアルゴリズムは、パラメータ（およびその値）を異なるグループに組み合わせ、それに応じて入力をクラスタリングします。これらのグルーピングは、データセット内の以前に知られていなかった関係を見つけることがよくあります。一方、PHはパラメータの閾値を選択する必要を克服し、すべての可能な選択肢に対してデータを分析します。これにより、データ内の形状が閾値に沿ってどのように進化するかを追跡します。このため、自動化生産に特に適しています。UMAPは次元削減方法であり、データをより容易に分析できる低次元の環境空間に投影することで、いくつかのパラメータを削除します。

各方法のパイプラインは図2で示されており、続く部分でさらに詳しく議論されています。

図2 (a) マッパーパイプライン。(b) 永続的ホモロジーパイプライン。(c) UMAPパイプライン

マッパーのアルゴリズム

マッパーアルゴリズムは概念的に単純なアプローチであり、考慮される唯一のトポロジカル特性は接続性です。本質的には、オブジェクト集合Vを低次元空間Rdにマッピングし、クラスタのグラフを構築する方法です。マッピングには、例えばPCAやオートエンコーダーなどを使用します。このステップは重要で、入力設定で非常に離れた位置にある2つの要素が、低次元空間で近接してグループ化されることがあり、そうするとこれらの関連は検出されません。次に、f(V)の像を（重複する）集合U1, ..., Ukで覆います。各UiはRnに引き戻され、選択したクラスタリング方法（例えば、Vがユークリッド空間の場合は固定kのk-means、より一般的なVの場合はカーネルk-meansなど）を用いてクラスタリングされます。すべてのf^-1(Ui)のクラスタはマッパーグラフGの頂点を形成し、これらのクラスタが交差する場合、Gにエッジを追加します。クラスタリングは元の点集合の空間で行われますが、フィルタ関数とカバレッジによってガイドされます。マッパーグラフは探索的データ分析に使用されます。通常、グラフ内の隆起（フレア）を探します。これは、いくつかのスケール（間隔）をまたいで接続され、これらのスケールで他のオブジェクトから区別されるサブポピュレーションです。その後、これらのサブポピュレーションを（伝統的なデータ分析方法で）分析し、その特徴を見つけます。

実際の例を挙げると、Rodrigo Rivera-Castroらの論文では最先端の需要予測方法の改善が目的です。問題は次の通りです：メーカーは製品とその（階層的な）コンポーネントの需要を予測する必要があります。各コンポーネントの需要の頻度は時系列で、最適な予測モデルでラベル付けされます。これらの時系列はマッパーグラフに組み込まれ、最適な予測モデルに基づいてクラスタに分けられます。この方法は、予測モデルの理解を深めるだけでなく、新しいコンポーネントの予測モデルを効率的に選択するという大きな利点もあります。実際には、f(V)をU₁, ..., U_nに分割することがマッパーアルゴリズムの主な障壁であり、結果の解釈可能性はこの選択に完全に依存します。いくつかの標準的な選択肢が知られていますが、マッパーパイプラインから意味のある洞察を得るためには通常、ドメインエキスパートの事前知識が必要です。それにもかかわらず、マッパーアルゴリズムはデータセット内の隠れた接続性を明らかにすることができる強力で多用途な対話型ツールと考えられるべきです。

持続的ホモロジー（PH）

この段落では、代数的トポロジーからの基本的な概念であるホモロジーについて説明しています。ホモロジーは、互いに連続的に変形できない形状を識別するために用いられます。正式な説明は本稿の範囲を超えますが、非公式には、ホモロジーはある形状のk次元の穴の数を、すべての整数kに対して明らかにします。k=0, 1, 2の場合、これは形状の連結成分、トンネル、空洞の数に対応します。重要なことに、2つの形状間の連続写像が与えられた場合、たとえばXからYへの包含であれば、これらの穴間にはよく定義された写像が存在します。

PHのパイプラインでは、フィルトレーションと呼ばれる一連の拡大される形状Xrをスケールパラメータr≥0ごとに構築し、Xrの成長を連続的なプロセスとして考えるときに、さまざまな次元の穴がどのように現れ消えるかを観察します。このトポロジカル特徴の進化は、バーコード（別名パーシステンス図）として表現できます。これは、フィルトレーション内の穴の存続期間を表す間隔（バー）の集合です。バーの長さは、対応するトポロジカル特徴のパーシステンスと呼ばれます。

実用的な例として、Jeffrey Mahlerらの結果を説明します。製造において、オブジェクトを掴むことはよく知られたタスクです。形状閉包グリップや力閉包グリップに加えて、エネルギーに制限のあるケージを考慮することもできます。物体Oに作用する力場fが、物体をグリッパーに押し込みます。したがって、物体がfに逆らってグリッパーから脱出するためには、一定のエネルギーが必要です。脱出エネルギーに制限を設定すると、エネルギー制限のあるケージが形成されます。この論文の目的はこれらを特定することです。そのため、著者たちはOの設定空間を考慮し、自由空間をサンプリングし、アルファ複体を用いて近似し、各単体に対するエネルギーポテンシャルに従ってスーパーレベルセットフィルトレーションを構築します。設定空間のエネルギー制限のあるケージは、パーシステンス図の中の永続ホモロジークラスとして表示されます。そこでは、誕生時間が脱出ポテンシャルに、死亡時間がケージ内の最深ポテンシャルに、パーシステンスがこれらのポテンシャルの差としての脱出エネルギーに対応します。このフレームワークの利点の一つは、フィルトレーションを選択するための自然な選択肢がしばしばあるため、パイプラインをより容易に自動化できることです。また、2つのデータセットをバーコードを比較する方法、およびMLメソッド（カーネルベースのメソッドやニューラルネットなど）にPHを統合する方法には豊富な理論があります。よく確立された理論と得られた特徴の解釈可能性が、実践におけるPHの成功に貢献しています。さらに、フィルトレーションとバーコードを計算し、それらを比較するための多くの効率的なアルゴリズムがあります。ただし、これらの進歩にもかかわらず、PHは非常に大きなデータセットには容易にスケールしないという点が指摘されています。これは、概念的に単純なマッパーアルゴリズムや、大規模データセットに特化した次に説明されるUMAPとは対照的です。

図3. 左側はエネルギーに束縛されたケージ：力場fが与えられたとき、物体の与えられたポーズ（青）に対して、グリッパー（黒）から脱出するためにはあるエネルギーが必要です。右側は持続性ダイアグラムの点で、持続性は必要な脱出エネルギーに対応します。

一様多様体近似と射影 (UMAP)

高次元の環境に存在するデータについて、そしてそれらの次元を削減する手段としてUMAP（Uniform Manifold Approximation and Projection）の効果について説明します。多くの場合、データは空間的次元、コスト、材料、生産における階層的位置など、多次元の情報を持っています。しかし、特定の分析ではこれらの情報の多くは不要であり、理解を妨げることさえあります。そのため、実際の分析の前にデータの次元を削減することが望ましい場合があります。UMAPはこのタスクに非常に適しています。

UMAPは、入力点から重み付きグラフを作成し、それを低次元空間に投影して、重要と見なされる情報を保持する別の、より単純なグラフを得ることによって機能します。この後者の選択は、適切な投影の選択によって行われます。グラフの構築は簡単ではなく、点の局所距離に関する情報を維持する必要があります。これは、k近傍法とファジィ構造に基づいており、ファジィ構造は集合への所属を重み付けする方法です（完全に所属または非所属ではなく、要素が集合にファジィに属することができます）。この構築は非常に抽象的であるため、ここでは詳細には立ち入りません。

例として、電磁デバイスの付加製造を考えてみましょう。そこでは、製造異常（幾何学的情報）が予測不可能な性能問題を引き起こす可能性があります。したがって、幾何学的でない情報や電磁性能に関する情報以外は無視され、これがまさにUMAPがこの場合に行うことです。残った情報はMLパイプラインに供給され、その出力は幾何学的欠陥と性能との間の関係です。UMAPの出力は、マッパーアルゴリズムやPHの出力とは異なり、直接解釈可能ではなく、さらに分析する必要があります（例えば、MLを使用して）。それにもかかわらず、UMAPは産業内外での大きな応用があります。

調査方法

調査結果の再現性を確保するために、各ステップが文書化され、再現可能な網羅的文献レビューとしてレビューを行うことにしました。この作業のために定義された問題は、工業生産と製造プロセスの適用に関するTDAからの手法のレビューです。調査方法のパイプラインは以下の通りです：検索に適したキーワードの定義、検索対象のデジタルライブラリの特定、得られた著作物のフィルタリング。ここでは、これらのステップを詳細に説明します。

キーワードとクエリー

文献レビューのための検索クエリの定義方法について説明します。検索クエリは「方法（Method）」と「ドメイン（Domain）」の2つのカテゴリによって定義されます。方法カテゴリのキーワードは、トポロジカルデータアナリシス（TDA）のツールについての応用を探すためのものです。一方、ドメインカテゴリのキーワードは、産業製造プロセスにおける応用とタスクを説明しています。図4はこれらのカテゴリと特定されたキーワードを示しています。両方のカテゴリの交差点がこの文献レビューのための検索空間です。

図4. カテゴリー「Domain」の13個のキーワードの集合（左セグメント）とカテゴリー「Method」の4個のキーワードの集合（右セグメント）のベン図。両者の交点が文献検索の範囲を示します。注：アスタリスク「*」はワイルドカードを示し、キーワードの変種を考慮することができます（例：TechnologiesとTechnology）。

意味のある検索クエリを作成するために、各カテゴリのキーワードは「OR」ステートメントを使用して接続されます。両方のカテゴリの検索文字列の結果は、ブール型の「AND」演算子を使用して接続されます。この結果として得られた単一の検索クエリは、デジタルライブラリから文献を収集するために使用されます。

デジタルライブラリー

文献調査で使用される5つのデジタルライブラリは以下の通りです：

IEEE（IEEE Xplore Digital Library）
Springer（SpringerLink）
Elsevier（ScienceDirect）
ACM（ACM Digital Library）
The American Society of Mechanical Engineers（ASME）（ASME Digital Collection）

これらのデジタルライブラリは、コンピュータ科学とエンジニアリングの分野、特にTDAとMLの応用、および産業工学の分野における科学的な出版物のための最も顕著なデジタルライブラリであるということから選択されました。唯一の例外は、ASMEデジタルコレクションです。これは、Google Scholarで制限されたキーワードセットを使用して行われた、Maximilian E. Tschuchnigらで使用された方法に似た初期かつ予備的な半尽力的な検索が、最初の4つのデジタルコレクションで見つかったものとは異なる追加の関連結果を示したために選ばれました。

IEEE Xplore、SpringerLink、ACMデジタルライブラリは、生成された検索文字列を使用することが可能な検索インターフェースを提供しています。ScienceDirectのインターフェースは、ブール式と検索文字列の組み合わせが限られているため、制限されています。ブール演算子「OR」がブール演算子「AND」に配布可能であるため、検索文字列は複数の検索文字列に分割され、ブール演算子「OR」で組み合わされます。これにより、検索文字列ごとのキーワード数が減少し、同じ検索結果が得られます。最後に、ASMEデジタルコレクションは高度な検索を提供せず、クエリごとに1つのブール演算子のみをサポートしています。この特定のケースでは、13×4=52のキーワードの組み合わせが独立して使用されます。結果として出版物の数が適度に少ないため、このアプローチは実現可能でした。

これらすべてのデジタルライブラリから、すべての結果はZoteroリファレンスマネージャーを使用して収集され保存されます。各出版物のメタデータは、デジタルオブジェクト識別子（DOI）を通じて自動的に抽出されます。

結果のフィルタリング

文献レビューのためのフィルタリングプロセスについて説明しています。検索結果を特定の期間に制限しなかった理由は、トポロジカルデータアナリシス（TDA）がまだ若い研究分野であり、特に産業製造プロセスの分野でのTDAの応用はさらに新しいからです。検索は2023年6月末に行われ、それまでに公開された作品がすべて考慮されました。フィルタリング手順は段階的に行われ、以下の基準に従って項目を除去しました：

重複
出版物の関連タイプ
参考文献の言語
フルテキストの利用可能性
作品のコンテキスト

フィルタリング手順の最初のステップは、DOIと出版物のタイトルによって識別される重複の除去でした。タイトルに基づいて重複が見つかった場合は、手動でこの重複を確認しました。各重複は除去され、出版物の1つのインスタンスのみが保持されました。意味のある高品質なレビューを提供するために、一定の品質基準を満たす出版物のみが考慮されました（つまり、査読済みの出版物）。この要件に基づいて、このレビューでは、会議録とジャーナルの出版物のみが考慮されました。デジタルライブラリによって査読プロセスのステータスが提供されていないため、これらが査読されていると仮定しています。プレプリント、プレゼンテーション、書籍、レポートなどの他の参照は除外され、分析には考慮されませんでした。出版物から情報を正しく抽出し、一般的に再現可能であることを確保するために、英語のフルテキストが利用可能な出版物のみが考慮されました。利用可能性は、当社の機関がこれらのデジタルライブラリへのアクセスとサブスクリプションに大きく依存しています。したがって、利用可能なフルテキストがないすべての出版物は手動でスクリーニングされ、関連する出版物が見逃されないようにしました。欠落しているが関連するフルテキストの場合は、プレプリントサーバーや著者のウェブページなどの代替ソースが検索され、フルテキストが取得されました。この手順の実行は必要ありませんでしたが、出版物のフルテキストの大部分がデジタルライブラリで利用可能でした。半自動でフィルタリングされた参照は、コンテキストについて分析されます。そのため、すべての出版物は手動でスクリーニングされました。ここで、方法とドメインのカテゴリのキーワードが出版物内で検索されました。これらは、貢献に関連するセクションに存在する必要がありました。特に、関連する作業や展望でのみメソッドやドメインを言及するだけでは不十分でした。このフィルタリング手順の後、残りの出版物のみがこの調査にさらに考慮されます。合計で4683の結果がスクリーニングされ、27の出版物が私たちの研究質問に関連すると見なされました。これらの出版物は詳細にスクリーニングされました。このスクリーニングに基づいて、出版物は手動で異なるカテゴリに分類され、次に提示されます。

結果

トポロジカルデータアナリシス（TDA）の方法が厳密なデータ分析タスクだけでなく、他の方法によって実行された分析の検証にも使用されていることが説明されています。例えば、ある論文では永続ホモロジー（PH）が評価に使用され、いくつかの論文ではUMAPが同じ目的で使用されています。しかし、この調査はTDAの直接的な応用に焦点を当てているため、これらの作業は以下の議論には含まれません。

また、石油生産などの製造以外の生産分野からの研究も文献検索中に見つかりました。これらの研究は製造プロセスに関連していないため、この調査には含められませんでした。さらに、他の研究では、製造プロセスにおけるTDA方法の使用について言及されていますが、実証的な作業は行われていません。これには、スマート製造のためのハイブリッドツインへのTDA方法の潜在的な応用や3Dプリンティングなどが含まれます。

合計で27の作品がこの調査に関連していると特定されました。それぞれの作品は、製造プロセス内での応用に基づいて、3つのクラスター（A-C）のいずれかに割り当てられました。特定されたクラスターは以下の通りです：

A：製品レベルの品質管理
B：プロセスレベルの品質管理
C：製造工学

関連する作品は表Iにリストされています。この表では、各作品が3つのクラスター（A-C）のいずれかに割り当てられ、使用されたTDA方法に基づいて配列されています。図5はこれらの作品を割り当てられたクラスターとの関係において概観しています。また、この図は各応用領域における使用されたTDA方法をも示しています。リストされた作品の出版日から、製造プロセスにおけるTDA方法への関心が過去数年間で増加していることがわかります。TDAの方法を使用した最初の出版物は2016年に出版されました。2022年から関心の大幅な増加が観察されます。2022年以降の出版物の数は、2022年以前の年よりも多いです。この調査作業のために2020年に出版された作品は見つかりませんでした。図6は年ごとに特定された出版物の絶対数を示しています。図6の図示は、2023年に向けて製造プロセスにおけるTDA方法への関心が減少しているように思われますが、2023年のデータは不完全であり、この調査には2023年6月30日までにデジタルライブラリに追加された出版物のみが含まれていることに注意が必要です。より詳細な結果の概要は表IIに示されています。この表には、各個別の作品、関連するクラスター、使用されたTDA方法、およびタスクを解決するために使用された入力データの種類が示されています。入力データの種類は参照された作品から抽出されました。最も一般的なデータタイプは時系列データであり、次いで点群とスカラー場が続きます。さらに、テキストログファイルやラベル付きグラフにTDA方法を適用した1つの作品も見つかりました。このセクションの残りの部分では、特定された3つの応用クラスターが議論されます。各応用領域について、簡単な説明が提示され、関連する作品の簡潔な要約が続きます。これらの作品の詳細については、元の参照された出版物を参照してください。

図5. この図は、特定されたクラスターと作品の関係を示しています。さらに、使用されたTDA手法が各クラスターの上に示されています。括弧内の数字は、関連する出版物の数を示しています。

図6. 年間の関連論文数。

製品レベルの品質管理

見つかった作品の中で製品レベルまたは生産プロセスレベルでの品質管理について2つの異なる方法が考慮されています。最初のクラスでは、生産された商品に基づいて生産の品質が評価されます。2番目のクラスでは、生産プロセスからの観察によって品質が評価されます。ここでは、最初のクラスに関する結果に焦点を当てます。

製品レベルでのTDA方法を使用すると、生産された商品の品質を非常に効率的に分析できます。一般に、TDAの方法は構造、表面、形状の分析に非常に適しており、ノイズに対するロバスト性に加えて計算の複雑さの観点からも非常に効率的です。この部分で特定された作品は、TDAの「古典的な」タスクを実行しており、これらのタスクは文献でよく見られます。それでも、生産プロセスにおける製品レベルでのTDAの応用を明示的に言及している作品のみを含めました。

製品レベルでのTDAの自然な応用は、製品のトポロジーの相違の分析です。この作品では、著者たちは付加製造（AM）におけるトポロジカルな相違の分類について説明しています。製品はR3のメッシュとして埋め込まれ、主に純粋なホモロジーが使用されています。表面のテクスチャの分析も自然な用途です。初期の作品ではPHが区別のために使用されました。この初期の作品では具体的なタスクは提供されませんでしたが、後続の作品ではそうです。後者では、表面テクスチャが製品の品質において重要な要素であることを論じています。彼らの方法は、表面プロファイルに適用され、その後顕微鏡画像のより具体的なタスクに適用されました。

形状のセグメンテーションについては、PHとグラフ畳み込みネットワークを用いた新しい方法が提案されています。彼らのPHベースのグラフ畳み込みネットワークは、点群データで実行された細かい3D形状セグメンテーションの方法において最先端を上回っています。より専門的なユースケースが提示されています。彼らの作業の応用はウエハー生産における品質管理です。マッパーアルゴリズムを使用して、欠陥パターンをクラスタリングするタスクがあります。入力特徴はウエハーマップ画像からビジョントランスフォーマーによって抽出されます。別のケースは電動モーターの生産です。別の論文では、著者たちは電動モーターの偏心検出にPHを使用しています。ここでのデータは、電動モーターのプロセスパラメータの時系列として与えられています。彼らの研究では、合理的な精度で故障レベルを予測できると同時に、単純な回帰モデルの使用により計算の複雑さを低く保っています。同様に、機械部品の製造プロセスにおける部品間の製造バリエーションの根本原因を分析しています。光学スキャンデータから取得された点群データに適用され、UMAPを使用してML方法を拡張しています。別の論文では、製品の個別の異常を分類していません。彼らのユースケースの要件は、製造されたウエハーマップの欠陥を検出し、廃棄することです。彼らのディープラーニングパイプラインのサブシステム内で、次元削減のためにUMAPが使用されています。同じタスクは非常に最近の作品[27]で実行されており、生産プロセス中にウエハーマップで欠陥パターンを検出しています。この作品では、著者たちはニューラルネットワークの特徴生成のためにPHの使用を提案しています。ニューラルネットワークによるさらなる処理のために、結果として得られたパーシステンス図はパーシステンス画像に変換されます。RFデバイスの付加製造のタスクでは、顕微鏡画像にUMAPと畳み込みニューラルネットワークを使用することを提案しています。幾何学的な変動を電磁性能メトリックにマッピングすることによって欠陥メカニズムとそのパフォーマンスへの影響を特定することは、インラインの電磁シミュレーションが不要であるため、より速く安価な品質管理に貢献します。

プロセスレベルでの品質管理

品質管理に関する文献の概説に続き、プロセスレベルでの結果について議論します。プロセスデータを用いて、製品の品質ではなく、プロセス変数を観察することで生産プロセスの品質を評価することが目標です（図7参照）。データの例には、機械の状態、センサーデータ、または生産プロセスから取得されたその他のデータが含まれます。このタスクについては、レビュー中に7つの研究が見つかりました。この数は多様な応用を示唆しているものの、実際には2つの主要な応用が特定されました。

図 7. プロセスレベルの品質管理に関するアプリケーションは、機械プロセスの品質管理の基礎として、主要なプロセスパラメータを時系列データとして取り込みます。プロセスパラメータは、射出成形機の概略図に示されています。この図は、表 II に示すように、入力データのタイプ（時系列）に関して完全なものです。

キープロセスパラメーターからの観測を用いた研究の目標は、製造プロセスの生産性を予測することです。著者によると、製造への応用にTDAの方法を用いることは、これらの研究が最初です。

ベンチマーク処理データセットの固有クラスターを識別するための、マッパーアルゴリズムの使用の提案もあります。マッパーアルゴリズムの出力ネットワークを使用して、最終製品の品質に影響を与える主要なプロセス変数または特徴が選択されます。彼らの研究は、すべてのプロセス変数を使用する場合と同じレベルの予測精度を達成し、よりコスト効率が良いことを示しました。

プロセスレベルの品質管理のクラスター内の2番目の応用は、チャターの検出です。加工におけるチャター検出は、ここ数年で注目を集めており、その特定の応用領域に関する調査研究によっても見られます。チャターの検出は重要であり、それによってワークピースや機械工具に損傷を与える可能性があります。特に、TDAの方法を使用したチャターの検出は、いくつかの注目を集め、Firas A. Khasawnehの研究に5つの作品を提供することに影響を与えました。最初の作品は概念実証であり、著者はPHを使用してチャターを検出できることを示しました。続く作品[26]では、著者はPHと教師あり学習に基づいたチャター検出の方法を提案しています。著者は、この方法で高い精度でチャターを検出できると述べています。[60]では、PHを使用して得られたトポロジカル特徴ベクトルに基づいた教師ありのチャター検出方法を提案しています。同じ作品は[59]でより詳細に説明されています。続く作品では、彼らはさらにトランスファーラーニングの方法を提案しています[58]。ここでは、異なるデータセットを使用してトレーニングする際に、トランスファーラーニングを使用することでチャターのパフォーマンスを向上させることができることを示し、評価しました。この作品では、時系列を整列させるために動的時間ワーピングも使用されています。当然、すべてのプロセスタスクは、時間的に連続したステップに依存しています。したがって、このクラスターのすべての作品が時系列データに対してその方法を適用していることは自然な事実です。

製造工学

このセクションでは、製造工学分野におけるTDA（位相データ解析）の応用について説明しています。製造工学とは、製造プロセスやシステムの設計、分析、改善を行う工学分野を指します。この分野のタスクは、製品自体に焦点を当てるのではなく、これらの製品を製造するためのプロセスやシステムに関心を持っています。製造工学のタスクには、材料フローの最適化、生産プロセスの最適化、生産システムの最適化、コンポーネントの選択、生産ラインの設計などが含まれます。製造業者にとって一般的なタスクは、生産の時間的計画です。製品の需要は季節、地域、天候、プロモーションや祝日などのイベントによって変動する可能性があります。需要に応えられないと顧客を失うことになりますが、過剰生産は製品の大量保管や廃棄による金銭的損失につながります。類似製品をグルーピングして予測モデルを共有することが有益な場合もあります。Rodrigo Rivera-Castroらは、異なる方法での需要予測のための方法を提案しています。新製品の予測を生成するためには、予測モデルを選択する必要があります。この選択プロセスには、Mapper Graphに基づくk近傍アルゴリズムが提案されています。歴史的時系列データの位相的特性を利用することで、予測モデルの選択が他の方法と比べてより正確で速くなると著者らは主張しています。最近の研究では、機械オペレーターの専門知識と経験に依存する問題に取り組んでいます。機械の交替には再パラメータ化が必要ですが、これらのパラメータの変更は数値的な証拠に基づくのではなく、機械オペレーターの手作業と経験によって行われます。これによるデメリットは、この再パラメータ化がある程度までしか再現できないことと、特定の機械タイプに関する必要な経験を得るためにオペレーターを長時間トレーニングする必要があることです。D. Mu ̃ nozらは、既存の幾何学的デザインから縮小された多様体を抽出するために既存のMLツールを共同利用することを提案しています。補間技術を使用して、縮小された多様体を使用して、クラスタリング技術を使用して欠落情報を推測することで新しい幾何学的デザインを生成します。彼らの研究は、PH（永続的ホモロジー）と永続的イメージに大きく依存しています。材料フローの最適化は、生産システムを通じて材料のスケジュールと流れを最適化するタスクです。このタスクには、デポから生産現場への原材料の輸送、生産ライン間の半製品の輸送、生産からデポへの完成品の輸送が含まれます。生産システムの複雑さを考えると、材料フローの最適化は、すべての関与するコンポーネントが異なる容量、交換時間、その他の制約を持っているため、難しい課題です。これらの制約を考慮に入れると、材料フローの最適化はビジネス的な観点と技術的な観点の両方から取り組まれる必要があります。材料フローの最適化のタスクは、材料フローのコストと時間を最小限に抑えることを目的とする多目的最適化問題です。このベンチマークタスクにおいては、デポから生産ラインへの材料フローを多次元空間の点群として表現されたデータを用いて、複数車両ルーティング問題として最適化することが提案されています。評価はPHを使用して行われます。

このセクションでは、製造環境内での独立した動くオブジェクト（グリッパーやロボットなど）の最適化タスクについて説明しています。これらのオブジェクトは、他のオブジェクト、周囲の環境、そして最も重要なのは人間のオペレーターとの衝突から保護される必要があります。保護は、オブジェクトが操作する物理的なケージを使用することによって達成されますが、これらのケージは建設が複雑で、柔軟性がなく、高価です。よりコスト効率の高い解決策は、仮想の境界によってオブジェクトを制限する仮想ケージを使用することです。この作業のタスクは、与えられたオブジェクトにとって最適な構成を持つ平面エネルギー制限ケージの合成です。グリッパーと力方向の構成を特定し、永続的ホモロジー(PH)を適用することにより、最適な構成が見つかります。この目的のために、オブジェクトとグリッパーは点群としてモデル化されます。製造ラインを出る製品が一定の品質であることを確認することは、製造工学における主要なタスクです。不良品を出荷することは評判の損失につながり、最悪の場合は人命の損失にもつながります。品質要件を満たすために、各製品に対してシステムレベルのテストが実施されます。不良品の分類ルールを生成するために、Ho-Chieh HsuらはUMAPを使用して次元削減を行う方法を提案しています。OTシステムは一般的にサイバー・フィジカル・プロダクション・システムであり、物理部分はセンサーやアクターを介してコンピューターシステムによって制御されます。そのようなシステムの構築と拡張は、これらのシステムが非常に複雑で異質になる傾向があるため、難しい課題です。したがって、これらのシステムの繰り返しパターンを見つけるために、Markus Unterdechlerらは、既にシステムに確立されているコンポーネントを再利用する方法が提案されています。これにより、信頼性が高まり、コストが低減され、メンテナンスの労力が軽減されます。彼らの方法では、次元削減のためにUMAPが使用されます。薬草医薬品製造業界におけるケーススタディが紹介されています。この研究では、著者たちは蒸発プロセスの劣化を分析しようとしています。これは製造コストの主要な要因であるためです。分析には、時系列データの次元削減のためにUMAPが使用されています。予防保守のタスクに対して、Xiaoyu Zhangらは機械保守データの分析方法が提案しています。そのようなデータセットは、多くの場合、異質で多次元のログです。これらのデータは、故障を示すパターンを見つけるために分析される必要があります。著者たちは、このような異質で多次元の機械保守データ（テキストログデータ）の診断のための視覚分析アプローチを導入しており、処理パイプラインの一環として次元削減のためにUMAPが使用されています。機械保守データの分析に関する別のアプローチが紹介されています。彼らの研究では、精密ブランキング業界の機械の劣化問題を、音響放射を使用して機械の摩耗を観察することによって軽減しています。このアプローチは、時系列データのUMAPと階層的クラスタリングに基づいています。著者らは、2次元で視覚化されたデータが、データの時間的依存関係を表しながら、機械の摩耗を特定することを可能にすると主張しています。Industry 4.0において、OTシステムのセキュリティは重要な懸念事項です。OTは情報技術（IT）システムとはまったく異なる要件を持っています。これはセキュリティ分野の課題を反映しています。OTセキュリティに関するトピックを網羅している作品は調査中に1つしか見つかりませんでした。Joaquı ́n Ordieres-Mer ́ eらは鋼の生産プロセスのセキュリティアプリケーションにおける下流タスクでUMAPを使用することを提案しており、データは時系列データとして提供されています。

考察と今後の研究の方向性

最近数年間で、トポロジカルデータ解析（TDA）の工業生産や製造プロセスへの応用への関心が高まっています。2016年に初めて応用されてから、出版物の数は順調に増加し、2022年にはピークを迎えました。今後もこの分野でのTDAの応用に対する関心は続くと予想されます。特定の応用分野ごとの出版物数は様々です。この調査の中で人気のある応用の一つは、製品の形状、表面、特徴の分析という、トポロジー的な観点から非常に自然なものです。もちろん、生産と製造の設定に適用されている作品以外にも、類似のトピックに取り組む出版物が多数存在します。もう一つの人気の応用は、製造工学の分野でのプロセスデータの分析です。最も多く使用されているTDAの方法はPHで、14のワークが何らかの方法で使用しています。UMAPは9つの作品で使用されています。いくつかの作品ではUMAPのトポロジ的保存に関する有利な特性を強調していますが、他の次元削減方法と比較して議論したり、実証的に比較したりすることはほとんどありません。最も少なく使用されている方法はマッパーアルゴリズムで、たった4つのワークが使用しています。しかし、医学など他の応用分野では非常に成功している方法です。したがって、産業4.0におけるマッパーアルゴリズムの潜在能力はまだ十分に活用されていないと考えられます。データタイプの観点から言えば、このコンテキストでTDAが最も多く応用されているのは時系列データです。特に、加工プロセスにおけるチャタリングの検出は非常に人気のあるタスクです。この応用は過去数年間で多くの注目を集めており、TDAの応用は多くの中でも非常に競争力のあるアプローチの一つです。それにもかかわらず、このコンテキストで点群のようなより古典的なTDAデータが時系列データほど人気がないことは少し驚きです。

TDA（トポロジカルデータ解析）の方法のデータタイプへの応用において、時系列データは観察されている全ての方法で解決されています。スカラー場も同様ですが、ここではマッパーアルゴリズムを使用している作品は1つだけで、他の方法はより頻繁に使用されています。興味深い観察点は、マッパーアルゴリズムを使用している作品が時系列データ（3件）とウェーハーマップ（1件）にのみ適用されていることです。これは少し驚きです。なぜなら、マッパーアルゴリズムは主にクラスタリング問題に適用されるアルゴリズムであり、点群の自然なタスクです。この調査の文脈で、点群を用いてマッパーアルゴリズムを使用するワークは一つも見つかりませんでした。すべてのワークが時系列データにのみ関連しているクラスター（B）には驚きません。なぜなら、プロセスは基本的に一連のアクションであり、自然に時系列のイベントとして記述されるからです。しかし、産業4.0の他の多くのデータは点群でモデル化され、マッパーアルゴリズムで分析することができます。したがって、このタイプのデータを扱う実務者には、分析にマッパーアルゴリズムを検討することをお勧めします。将来的には、工業生産の文脈でTDAがより多くの応用に適用されることを望んでいます。なぜなら、これが有益である可能性が多くあると考えているからです。この作業から見ると、出版物の数はまだ少ないですが、成長しています。これまでの議論では、将来の研究の可能性が見られるいくつかの分野、および入力タイプと方法のいくつかの未利用の組み合わせがすでに示されています。しかし、将来の研究の可能性がある他の分野もまだ存在します。まず、行動データにTDAを適用することに大きな可能性があります。機械からの実行時測定データは、分析するための大きな可能性があります。これは、チャタリングの検出だけでなく、生産プロセスの異常の検出、予測保守、セキュリティインシデントの検出など、他のタスクにも使用できます。OTの主要なトピックの一つはサイバーセキュリティとサイバー物理システムの保護、つまりOTセキュリティです。侵入検出および予防システムの設計は、OT環境を保護するための多くの措置の一つです。そのようなシステムにはさまざまなアプローチがあり、異常検出へのデータ駆動型アプローチがその一つです。これは再び時系列分類タスクとして言い換えることができます。TDAの方法をこのタスクに適用することは自然な適合ですが、TDAを使用している作品はUMAPを次元削減に使用しているものが1つだけ見つかりました。ここでは、将来的には異常検出のためのPHの適用を含む、さらに多くのことが期待されます。最後に、この作品と同じテーマで数年後に定期的な調査が行われることを望みます。これにより、このドメインでのTDAの応用の発展を観察し、分野の発展についての洞察を得ることができます。この作業で使用された方法の性質を考えると、これは高度に再現可能であり、他の研究者がこの作業を拡張するために開かれています。

結論

本研究では、工業生産と製造プロセスにおけるTDAに関する現在の文献の概要を紹介しました。TDAの手法と工業生産・製造プロセスの領域との相互関係を示しました。この研究は、工業生産と製造プロセスにおけるTDAの適用に関する技術の現状の包括的な概要を提供し、適用されているTDAの適用領域と使用されている方法を示し、TDAの適用領域と方法の利用されていない組み合わせを強調することにより、現在の文献に貢献します。文献の検索と特定に透明で厳格な方法を採用することで、この研究の再現性を確保しました。この方法により、27の関連文献が明らかになりました。これらの文献は手作業で分類され、その結果は3つのカテゴリー、すなわち製品レベルの品質管理、プロセスレベルの品質管理、生産工学のいずれかに割り当てられています。全ワークについて、使用されたデータ形式と、特定のユースケースで採用されたTDAの方法を簡単に説明します。本研究では、TDAが工業生産と製造プロセスの領域におけるセンサーやその他のデバイスからの複雑なデータセットの分析に特に適した手法であることを示します。さらに、この分野でのTDAの応用はまだ初期段階にあり、今後の研究の可能性が大いにあることを示します。