機械学習とリアルタイムフィードバック制御による半導体基板の万能脱酸

機械学習 2024年01月15日

3つの要点
✔️ 半導体製造工程の内、エピタキシャル成長のその場(in situ)終点検出に機械学習を適用しました
✔️ 基板表面の結晶性を反映する画像データを与える反射高エネルギー電子回折（RHEED）の画像解析は、専門家の知見を必要とし、誤差を含みます
✔️ ハイブリッド畳み込みと画像トランスフォーマー（CNN-ViT）モデルの適用により、リアルタイムで高精度の終点検出が可能になりました

Universal Deoxidation of Semiconductor Substrates Assisted by Machine-Learning and Real-Time-Feedback-Control
written by Chao Shen, Wenkang Zhan, Jian Tang, Zhaofeng Wu, Bo Xu, Chao Zhao, Zhanguo Wang
(Submitted on 4 Dec 2023)
Comments: Accepted on arXiv
Subjects: Mesoscale and Nanoscale Physics (cond-mat.mes-hall); Machine Learning (cs.LG); Image and Video Processing (eess.IV); Systems and Control (eess.SY)

code：

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。

概要

特定の例ではありますが、半導体製造工程の中の一つへの機械学習の適用例を見てみたいと思います。薄膜成膜は半導体プロセスにおいて不可欠な工程です。下地結晶の方向に沿った結晶成長を行うエピタキシャル成長では、薄膜蒸着前に表面の酸化物（自然酸化膜: native oxide)を除去するプロセス制御の研究が進められてきました。ランダム基板に対する分子線エピタキシー（MBE）前の脱酸プロセスを最適化することは、多次元的な課題であり、時に議論の的となります。半導体材料や成長プロセスにはばらつきがあるため、基板の脱酸温度の決定は成膜プロセスエンジニアの専門知識に大きく依存します。ここでは、機械学習（ML）ハイブリッド畳み込みと画像トランスフォーマー（CNN-ViT）モデルを採用します。このモデルは、基板表面の結晶性を反映する画像データを与える反射高エネルギー電子回折（RHEED）ビデオを入力として利用し、出力として基板の脱酸状態を決定し、制御されたアーキテクチャの下で基板の自動脱酸を可能にします。これはまた、他の基板上の脱酸プロセスアプリケーションへの拡張につながります。さらに、単一のMBE装置からのデータで学習したモデルが、他のMBE装置で高精度の展開を達成する可能性を示しています。従来の方法とは対照的に、著者らのアプローチは非常に実用的です。さまざまな装置や基板材料にわたって脱酸温度を標準化し、薄膜成長技術における重要なマイルストーンである半導体前処理における標準化研究プロセスを前進させます。この研究で実証された概念と方法は、多様な材料成長プロセスに適用することで、オプトエレクトロニクスおよびマイクロエレクトロニクス産業における半導体製造に革命をもたらすことが期待されます。

はじめに

エピタキシー薄膜は、最先端のオプトエレクトロニクスおよびマイクロエレクトロニクスデバイスの心臓部です。これらの層の結晶品質と欠陥密度は、成長条件と基板準備後のスタート表面によって大きく影響を受けます。分子線エピタキシーや有機金属気相エピタキシー（MOVPE）などによる高品質なエピタキシャル層の成長には、良質な結晶成長を妨げる半導体基板の自然酸化物を取り除く脱酸プロセスが重要です。

通常、エピタキシー前に酸化膜を意図的に除去するためにエッチャントが使用されますが、周囲雰囲気に曝されると瞬時に新鮮な自然酸化膜が形成されます。しかし、脱酸の時間や温度は、基板の酸化膜厚や構造に依存するため、複雑で議論の余地があります。反射高エネルギー電子回折（RHEED）は通常、基板からの酸化物の脱離を決定するために表面の再構成をモニターするために使用されます。MBE成長中のRHEEDパターンの解析には、人工知能（AI）を使用しました。これは、Si(111)基板の脱酸プロセス中にリアルタイムでRHEEDパターンを検出し、特定の表面再構成との類似性によって分類します。 RHEEDビデオを入力として用いて学習させた機械学習（ML）モデルを開発し、プロセス制御のための表面形態に関するリアルタイムフィードバックを提供しました。

しかしながら、これまでの報告は、一般的に特定の材料と収集したデータに対するモデル結果の後処理分析に集中しており、リアルタイム展開を可能にする同様のアプリケーションに普遍的に適用可能なモデルの構築を軽視していました。また、データセットの収集と適用が同じ MBE 装置に限定されており、異なる装置間で一貫した性能を維持できるモデルを探求する努力はなされていませんでした。普遍的なモデルが実現できれば、プロセスエンジニアの経験への依存を減らし、材料調製の再現性を向上させ、絶え間なく進化する技術や材料の進歩によりよく適応できるようになります。

この論文では、GeとInAsを含む小規模なデータセットとともに、GaAsを網羅する大量の脱酸RHEEDビデオデータを収集しました。モデルの学習パラメータを何度も最適化することで、非常にロバストなハイブリッド畳み込み画像トランスフォーマー（CNN-ViT）モデルの開発に成功しました。このモデルは、カメラのハードウェア解像度の制約に影響されることなく、入力として様々な解像度のサンプルに適応できることを実証しています。モデルのパラメータを詳細に分析した結果、モデルによって出力された分類結果には明確な境界があり、これはデータに対する感度が高いことを示しています。

さらに、CNN-ViTモデルのアテンションモジュールから出力された重みが最も高い領域は、経験豊富なプロセスエンジニアの関心領域と一致しています。この整合性は、このモデルが合理的であり、強い解釈可能性を持っていることを示しています。in-situ自動脱酸実験が実施され、動的な基板加熱プロセス中に、モデルはGaAs、Ge、InAs基板の脱酸状態を正確に識別し、正確な脱酸温度を提供しました。さ

らに、データセットに含まれていない基板や装置から収集したRHEEDデータの解析にもこのモデルを適用し、卓越した精度を示すとともに、その堅牢な普遍的性能を強調しました。この研究により、単一のデータソースで、異なる材料系のさまざまなデバイスにまたがる普遍的なモデルを作成できることが実証されました。さらに、このモデルの普遍性により、材料成長の各段階の標準化が可能になり、従来の人間の経験に基づく判断による誤差が軽減されます。

今後、より普遍的な標準化モデルが開発されることで、半導体製造における標準化プロセスがさらに進展することが期待されます。

実験

サンプルは、ヒ素（As）バルブクラッカー(高蒸気圧を持つ材料を効果的にクラックする)と蒸気相化合物を制御するエフュージョンセルを備えたRiber 32P MBEシステムを用いて作製しました。基板温度はC型熱電対で測定しました。脱酸のために基板を成長チャンバーに導入する前に、バッファーチャンバーで 6 時間の低温脱ガスを実施しました。MBE 成長チャンバー内での RHEED により、脱酸プロセス中の基板表面の分析とモニタリングが容易になりました。RHEED パターンは、12 kV の電子エネルギー (STAIB 製 RHEED 12) で記録しました。カメラを備えた暗室を設置し、基板を20rpmで回転させながらRHEEDビデオを連続撮影。露光時間は100ミリ秒、フレームサンプリングレートは8フレーム/秒（fps）。図1に示すように、カメラで撮影されたデータは、動的加熱および脱酸プロセス中に選択された正方形のマトリックス領域のみを保存するように処理されます。その後、収集されたデータは時系列で様々な画像に分割されます。各画像は輝度チャンネルで正規化され、深さ8ビットの2次元マトリックスに変換されます。これらの複数の連続した2次元行列は、接続され、結合されて新しい3次元行列を形成し、モデルの入力となります。モデルの出力は、基板が脱酸されたかどうかを決定します。脱酸が不完全な場合、基板の温度は上昇し続けます。脱酸が完了すれば、現在の脱酸温度が得られ、実験の終了を意味します。生のRHEEDビデオデータを前処理することで、トレーニング用に320,000個のNPYファイルを得ました。

図1. 実験の全体的な枠組み。

他の畳み込みベースのモデルと比べて、CNN-ViTはTransformerのセルフアテンションメカニズムを組み込んでおり、画像から大域的な情報を捕捉するモデルの能力を高めています。これにより、ロバスト性を確保しながら、多数のパラメータへの依存性を低減しています。従来の畳み込みアーキテクチャは、大域的な情報を処理する際に受容野によって制限される可能性があり、大域的な情報を幅広く捕捉するために多くのパラメータを必要とすることがよくあります。さらに、ViTは入力位置の影響を受けず、異なるサイズの画像に対してより柔軟です。また、著者らのモデルには畳み込み層の前にアップサンプリング層が含まれており、図2aに示すように、モデル構造を変更することなく、様々なピクセルサイズの入力への適応性を高めています。図2aの方法で処理された生データは、固定サイズのブロック行列に標準化されます。このシーケンスは次に、図2bに示されているように、各層がマルチヘッドアテンションメカニズムとフィードフォワードニューラルネットワークを包含するトランスフォーマエンコーダに入力されます。最後に、フィードフォワードニューラルネットワークによって処理された結果は統合され、多層パーセプトロン（MLP）層、GELU層、および別のMLP層を介して順次出力されます。図2cにおいて、マルチヘッドアテンションメカニズムの入力シーケンスは線形変換され、それぞれがアテンションヘッドと呼ばれる複数の部分空間、例えば値（V）、キー（K）、クエリ（Q）に分割されます。各アテンションヘッドはアテンション分布を計算するための重み行列を持ちます。データ処理を通して、各アテンションヘッドの出力は統合され、続いて線形変換され、マルチヘッドアテンションメカニズムの最終出力が得られます。

パラメータと入力サイズを変化させた場合のモデルの精度を評価するためのテストを実施しました。図2dに示すように、深さとヘッドの数が徐々に増加するにつれて、検証精度は上昇傾向を示し、検証損失は下降傾向を示しました。しかし、深さとヘッドを16以上に設定しても検証精度の大幅な向上は見られず、検証損失も大幅な減少は見られません。このことは、これらのパラメータをさらに増加させても、モデルの性能を効果的に向上させることなく、モデルの複雑さを増大させるだけであることを示唆しています。

さらに、図2eに示すように、画像数が増加するにつれて、モデルの性能も上昇傾向を示します。しかし、画像数が12枚を超えるとモデルの精度は低下します。この現象は、パラメータが複雑なため、モデルがより良い結果を得るために、より多くのエポックを必要とするために生じる可能性があります。とはいえ、学習時間と精度のバランスをとるには、モデルの入力として12枚ごとに画像を選択するのが最適であることがわかります。このアプローチを選択した理由は、基板を毎分20回転で回転させ、フレームサンプリング速度を毎秒8フレームにすると、基板が1回転する間に収集されるRHEEDデータが24フレームになるからです。この24フレームのうち、12フレームには重複した情報が含まれています。12フレームの画像を毎回入力することで、RHEEDで収集したデータの重複を効果的に回避し、データの冗長性を防ぎ、モデルデータの処理効率を向上させました。最後に、各画像の画素数を調整し、モデルの精度の変化を調べました。これらのモデルを100エポック学習した結果、図2fに示すように、画像のピクセル数が増えるにつれて、モデルの性能が徐々に向上することが確認されました。しかし、解像度が64を超えると、モデル精度の向上には限界があります。入力ピクセルのサイズが128の場合、プログラムに導入されたモデルは、カメラのサンプリング・レートに非常に近い値で、カメラで収集されたRHEEDデータを十分に活用して、1秒間に約9件の結果を生成できます。さらに、より豊富な入力情報がモデルの精度を向上させることを考慮し、最終的に各画像の入力ピクセルサイズを128に設定することにしました。以上の結果、モデルの構造を決定し、十分なトレーニングの後、モデルの検証精度は99.95%に達し、平均検証損失はわずか0.001646399でした。

図2. CNN-ViTモデルの構造：a)アップサンプリングによる畳み込みデータ処理を示す模式図 b)ViTのアーキテクチャ c)マルチヘッド注目メカニズム。d）ヘッドと深さ、（e）画像数、（f）画像ピクセルを変えた場合のモデル検証精度と検証損失の変化。

図3aに示すように、CNN-ViTモデルによって学習された特徴を分析するために、典型的な脱酸データを選択しました。まず、元のデータにわずかな摂動を与え、対応する敵対的なサンプルを生成し、モデルの応答を観察しました。その結果、図3bに示すように、生成されたサンプルは元の画像とほぼ同じであり、モデルが良好な頑健性を持つことが分かりました。その後、図3cに示すように、モデルが入力データで注目した領域を可視化し、アテンションヒートマップを生成しました。図3aはグリッド分割法に基づいて注釈が付けられ、アテンションヒートマップ内の注目領域が強調されています。ヒートマップ内のアテンション領域は、RHEEDの鏡面スポットの近くに集中していることが観察され、これは鏡面スポットとその周囲の背景との輝度差に基づく経験豊富なプロセスエンジニアの判断プロセスと一致し、強い解釈可能性を示しています。次に、5つの酸化データと5つの脱酸化データを無作為に選択し、t-分散確率的近傍埋め込み（t-SNE）アルゴリズムを使用して、モデルの高次元特徴を2次元空間にマッピングし、図3dに示すような散布図を形成しました。散布図は、図3dの赤い破線枠で示されるように、明確な境界を持つ2つのカテゴリーに明確に分離され、このモデルが基質の脱酸状態を決定する際に優れた感度を有することを示唆しています。さらに、図3eに示されるように、トレーニングセット上の各特徴マップの活性化値が平均化され、曲線としてプロットされました。図 3e から 3 つの典型的な畳み込みカーネルと畳み込み層が出力した特徴マップを選択し、そのパラメータを図 3f と 3g に可視化しました。RHEED鏡面スポット近傍の畳み込みカーネルと畳み込み層出力の重みの変化は大きく、モデルと人間の識別手法との整合性が改めて示されました。続いて、図3hに示すように、モデルに対して他のMBE装置から収集したデータの解析を試みました。図 3h に示すように、異なる回転速度の基板や、非データセットの GaSb 基板データにモデルを適用した場合でも、脱酸を識別する確率は平均 96.3%と高いことが観察されました。また、酸化を識別する確率は88.9%と高く、このモデルは新たな学習を行わなくても高い汎用性を示すことが分かりました。

図3. モデル特徴分析： a) 元画像の可視化 b) 敵対サンプルの生成 c) 注意ヒートマップ d) 高次元特徴のt-SNE可視化 e) 平均活性化曲線 f) 畳み込みカーネルの可視化 g) 畳み込み後の特徴マップの可視化 h) 非データセット上のデータのモデル処理結果。

さらに、脱酸は一般に、基板表面の原子の一貫性のない蒸発に起因する非化学量論的な影響を最小化するために、可能な限り低い温度で実施することが意図されています。このため、基板の酸化が検出されると、プログラムは基板の温度を現在のレベルよりも高くします。その後、モデルはこの温度を一定期間維持してから二次判定を行い、基板が脱酸されたと判定するまでこのプロセスを繰り返します。さらに、基板が脱酸されたかどうかの基準は、モデルの24回の連続判定のうち、95％が脱酸の結果を得ることで確立されます。これにより、基板表面の酸化膜の厚みが不均一なために、正確な脱酸温度を認識できない事態を回避します。

結果と議論

このプログラムを用いて、GaAs 基板の自動脱酸実験を行いました。プログラムの操作段階は、図4a に示すように、プログラム・インターフェースの「リマインダ情報」の変更に基づいて分割されました。図4bに描かれているように、プログラム操作を通して脱酸のために11回の加熱サイクルが実行され、350℃から始まり405℃に達しました。各加熱の後、基板はこの温度で6分間保持されます。6分間が終了する前にRHEEDシャッターを開き、モデルを使用して連続判定を行いました。モデルの判定結果は散布図を用いてプロットし、判定結果の統計解析には移動平均法を用いました（図4c）。脱酸温度では、モデル出力が「Yes」となる確率が急激に上昇し、他の温度ポイントでは、モデル出力結果は主に「No」を示しました。プログラムはモデルの24の出力結果を連続的にカウントし、モデル出力が「Yes」である確率が95%を超え、基板のどの角度から得られたRHEEDも脱酸と判断できることを示した場合にのみ、図4dに示すように、現在の温度を脱酸温度とみなしました。図4e～4gに示すように、350 °C、400 °C、および405 °Cの典型的なRHEED画像を選択しました。350 °Cと400 °CのRHEED像では、輝度が弱く、比較的ぼやけた輝点の特徴が見られました。しかし、405 °Cで得られたRHEEDパターンでは、明瞭ではっきりとした光スポットの輪郭を示し、405 °Cで基材の脱酸に成功したことを示しています。このプログラムにより、GaAs基板の自動脱酸が実現しました。さらに、Ge基板とInAs基板でも同様の実験に成功しました。

図4. a)プログラムの実行段階の分割。 b)基板の温度曲線。 c)モデルの出力結果と移動平均法の統計結果。 d)プログラムが基板が脱酸段階にあるかどうかを判断。 e)350℃で捕捉したRHEED。 f)400℃で捕捉したRHEED。 g)405℃で捕捉したRHEED。

さらに、Riber C21 MBEシステムからGaSb基板上の脱酸のRHEEDデータの一部を、基板回転速度30 rps、カメラサンプリングレート8 fpsで記録し、データを処理するためにモデルに入力しました。モデルの出力結果を図5aに示します。400番目のシーケンスから800番目のシーケンスまで、モデルが「Yes」と出力する確率が徐々に増加し、移動平均法の統計曲線が着実に増加していることが観察できます。典型的なRHEEDは、図5b-5dに示すように、400番目、600番目、800番目のシーケンスから達成されました。400番目のシーケンスでは、RHEEDパターンにはほとんどパターンがなく、脱酸が起こっていないことを示しています。しかし、600番目のシーケンスでは、RHEEDにシャープな主光斑が見られますが、周囲の光斑が目立たない場合は、基質が徐々に脱酸状態に近づいていることを示しています。800番目のシーケンスでは、RHEEDパターンの鏡面スポットが鋭くなるだけでなく、輝度も目立つようになり、周囲の小さなスポットも徐々に目立つようになることから、基板が脱酸状態に近づいていることがわかります。このデータ結果から、このモデルが他のデバイスの未知の材料の脱酸を識別でき、強い普遍性を持つことが確認されました。

図5. GaSb 基板脱酸データのモデル結果。a) モデルの出力結果と移動平均法の統計結果。b) シーケンス400で捉えたRHEED。c) シーケンス600で捉えたRHEED。d) シーケンス800で捉えたRHEED。

まとめ

本報告では、CNN-ViTハイブリッドモデルを用いた基板の自動脱酸を包括的に検討します。このモデルは、GaAs、Ge、InAs基板からの脱酸RHEEDビデオデータを含む多様なデータセットで学習され、様々な解像度やカメラハードウェアに適応できることを示しました。モデルパラメータ、注意メカニズム、および特徴の詳細な分析により、その頑健性と人間の経験的手法との一貫性が強調され、強力な解釈可能性が実証されました。さらに、その場で自動脱酸実験を行いました。モデルは、動的な基板加熱プロセス中のGaAs、Ge、およびInAs基板の脱酸状態を正確に識別し、正確な脱酸温度を提供します。このモデルは、さまざまなMBE装置から得られたGaSb基板のデータを処理した際に、かなりの精度を実証しました。様々な装置や基板におけるこのモデルの普遍性は、半導体製造分野における標準化プロセスを促進する方法を提供し、将来的により普遍的な標準化モデルの開発が期待されます。