利用机器学习和实时反馈控制实现半导体基底的通用脱氧

机器学习 15/01/2024

三个要点
✔️ 将机器学习应用于半导体制造过程中外延生长的原位端点检测
✔️ 反射高能电子衍射（RHEED）图像分析可提供反映衬底表面结晶度的图像数据，但这种分析需要专业知识，而且容易出错
✔️ 应用混合卷积和图像变换器（CNN-ViT）模型进行实时和高精度端点检测

Universal Deoxidation of Semiconductor Substrates Assisted by Machine-Learning and Real-Time-Feedback-Control
written by Chao Shen, Wenkang Zhan, Jian Tang, Zhaofeng Wu, Bo Xu, Chao Zhao, Zhanguo Wang
(Submitted on 4 Dec 2023)
Comments: Accepted on arXiv
Subjects: Mesoscale and Nanoscale Physics (cond-mat.mes-hall); Machine Learning (cs.LG); Image and Video Processing (eess.IV); Systems and Control (eess.SY)

code：

本文所使用的图片要么来自论文、介绍性幻灯片，要么是参考这些图片制作的。

概述

在一个具体的例子中，我们将了解机器学习在半导体制造工艺中的应用。薄膜沉积是半导体工艺中不可或缺的一部分。在外延生长过程中，晶体的生长方向与底层晶体的生长方向一致，因此在薄膜沉积之前，人们一直在进行去除表面氧化物（原生氧化物）的工艺控制研究。在随机基底上进行分子束外延（MBE）之前，优化脱氧工艺是一项多维挑战，有时还会引起争议。由于半导体材料和生长工艺的多变性，基底脱氧温度的确定高度依赖于沉积工艺工程师的专业知识。这里采用的是机器学习（ML）混合卷积和图像变换器（CNN-ViT）模型。该模型使用反射式高能电子衍射（RHEED）视频作为输入，该视频可提供反映基底表面结晶度的图像数据，并将确定基底的脱氧状态作为输出，从而在受控架构下实现基底的自动脱氧。这也有助于扩展到其他基底脱氧工艺应用。此外，根据单台 MBE 仪器的数据训练的模型显示了在其他 MBE 仪器上实现高精度部署的潜力。与传统方法相比，作者的方法非常实用。它使一系列设备和基底材料的脱氧温度标准化，推进了半导体制备的标准化研究进程，这是薄膜生长技术的一个重要里程碑。本研究中展示的概念和方法可应用于各种材料生长过程，有望彻底改变光电子和微电子行业的半导体制造工艺。

介绍

外延薄膜是最先进的光电和微电子设备的核心。这些薄膜层的晶体质量和缺陷密度深受生长条件和基底制备后的起始表面的影响。要通过分子束外延或金属有机气相外延（MOVPE）等方法生长出高质量的外延层，必须采用脱氧工艺去除半导体衬底上阻碍晶体良好生长的天然氧化物。

蚀刻剂通常用于刻意去除外延前的氧化膜，但新鲜的天然氧化膜在暴露于环境气氛时会立即形成。然而，脱氧的时间和温度取决于基底上氧化膜的厚度和结构，因此非常复杂且存在争议。反射高能电子衍射（RHEED）通常用于监测表面重构，以确定基底上的氧化物解吸情况；人工智能（AI）用于分析 MBE 生长过程中的 RHEED 模式。它能在 Si(111) 基底脱氧过程中实时检测 RHEED 图样，并根据其与特定表面重构的相似性对其进行分类。使用 RHEED 视频作为输入，开发了一个机器学习 (ML) 模型，以提供用于过程控制的表面形态实时反馈。

然而，以前的报告一般都集中在对特定材料和所收集数据的模型结果进行后处理分析，而忽略了为类似应用构建可实时部署的通用模型。此外，数据集的收集和应用仅限于相同的 MBE 设备，没有努力探索可在不同设备上保持性能一致的模型。通用模型如能实现，将减少对工艺工程师经验的依赖，提高材料制备的可重复性，并更好地适应不断发展的技术和材料进步。

本文收集了大量涉及砷化镓的去酸化 RHEED 视频数据，以及一个包含砷化镓和砷化铟的小型数据集。通过对模型的训练参数进行多次优化，成功开发出了高鲁棒性混合卷积图像变换器（CNN-ViT）模型。该模型证明，它能适应各种分辨率的样本输入，而不受摄像头硬件分辨率限制的影响。对模型参数的详细分析表明，该模型输出的分类结果具有明确的界限，这表明它对数据具有很高的灵敏度。

此外，CNN-ViT 模型的注意力模块输出权重最高的区域与经验丰富的工艺工程师所关注的区域不谋而合。这种一致性表明该模型是合理的，具有很强的可解释性：在原位自动脱氧实验中，在基底动态加热过程中，该模型准确识别了 GaAs、Ge 和 InAs 基底的脱氧状态，并提供了准确的脱氧温度。Sa.

该模型还应用于分析从数据集未包含的基底和器件收集的 RHEED 数据，显示了出色的准确性，并突出了其强大的通用性能。这项研究表明，单一数据源就能生成一个通用模型，适用于不同材料系统中的一系列器件。此外，该模型的通用性还允许对材料生长的每个阶段进行标准化，从而减少传统的基于人类经验的判断所造成的误差。

我们希望，开发更通用的标准化模型将进一步推动半导体制造的标准化进程。

试验

样品使用 Riber 32P MBE 系统制备，该系统配有砷（As）阀裂解器（可有效裂解蒸汽压力较高的材料）和一个用于控制气相化合物的喷流池。基底温度用 C 型热电偶测量。在将基底引入生长室进行脱氧之前，先在缓冲室中进行 6 小时的低温脱气，然后在 MBE 生长室中进行 RHEED，以便在脱氧过程中分析和监测基底表面。来自 STAIB 的 RHEED 12）。在基底以每分钟 20 转的速度旋转时，一个配备了摄像头的暗室被用来连续捕捉 RHEED 视频。曝光时间为 100 毫秒，帧采样率为每秒 8 帧（fps）。如图 1 所示，在动态加热和脱氧过程中，摄像机捕捉的数据经过处理，只存储选定的正方形矩阵区域。然后将采集到的数据按时间顺序分割成不同的图像。每幅图像都在亮度通道中进行归一化处理，并转换成深度为 8 位的二维矩阵。这些连续的二维矩阵被连接并组合成一个新的三维矩阵，这就是模型的输入。模型的输出决定了基底是否已经脱氧。如果脱氧不完全，基质的温度将继续上升。一旦脱氧完成，就会得到当前的脱氧温度，标志着实验结束。对原始 RHEED 视频数据进行预处理后，生成了 32 万个 NPY 文件用于训练。

图 1. 实验的总体框架。

与其他基于卷积的模型相比，CNN-ViT 采用了 Transformer 自我关注机制，从而增强了模型捕捉图像全局信息的能力。这减少了对大量参数的依赖，同时确保了鲁棒性。传统的卷积架构在处理全局信息时会受到感受野的限制，通常需要大量参数才能捕捉到广泛的全局信息。此外，ViT 不受输入位置的影响，在处理不同尺寸的图像时更加灵活。如图 2a 所示，作者的模型还在卷积层之前加入了一个上采样层，从而在不改变模型结构的情况下提高了对不同像素尺寸输入的适应性。以图 2a 所示方式处理的原始数据被标准化为固定大小的块矩阵。然后将该序列输入变压器编码器，如图 2b 所示，该编码器的每一层都包含多头注意力机制和前馈神经网络。最后，前馈神经网络处理后的结果通过多层感知器（MLP）层、GELU 层和另一个 MLP 层进行整合并依次输出。在图 2c 中，多头注意力机制的输入序列经过线性变换，被划分为多个子空间，每个子空间称为一个注意力头，如值（V）、键（K）、查询（Q）。每个注意力头都有一个权重矩阵，用于计算注意力分布。通过数据处理，对每个注意力头的输出进行整合，然后进行线性变换，得到多头注意力机制的最终输出。

测试评估了模型在不同参数和输入大小下的精度。如图 2d 所示，随着深度和水头数量的逐渐增加，验证精度呈上升趋势，验证损失呈下降趋势。然而，将深度和水头设置为 16 以上并不能显著提高验证精度，也不能显著降低验证损失。这表明，进一步增加这些参数只会增加模型的复杂性，而不会有效提高其性能。

此外，如图 2e 所示，随着图像数量的增加，模型的性能也呈上升趋势。但是，当图像数量超过 12 幅时，模型的准确性就会下降。这可能是由于参数的复杂性，模型需要更多的历时才能取得更好的结果。尽管如此，我们发现在训练时间和准确性之间的最佳平衡点是选择每 12 幅图像作为模型的输入。之所以选择这种方法，是因为如果基板以每分钟 20 转的速度旋转，帧采样率为每秒 8 帧，那么在基板旋转一圈的过程中就会收集到 24 帧 RHEED 数据。在这 24 幅图像中，有 12 幅包含重复信息；通过每次输入 12 幅图像，可有效避免 RHEED 重复采集数据，防止数据冗余，提高模型数据的处理效率。最后，通过调整每幅图像的像素数来研究模型精度的变化。对这些模型进行 100 次历时训练的结果表明，随着图像像素数的增加，模型的性能逐渐提高，如图 2f 所示。但是，一旦分辨率超过 64，模型精度的提高就会受到限制。输入像素大小为 128 时，程序中引入的模型每秒可生成约 9 个结果，非常接近相机的采样率，充分利用了相机收集的 RHEED 数据。此外，考虑到更丰富的输入信息可提高模型的准确性，最终决定将每幅图像的输入像素大小设为 128。综上所述，在确定模型结构并进行充分训练后，模型验证准确率达到 99.95%，平均验证损失仅为 0.001646399。

图 2：CNN-ViT 模型的结构：a) 卷积数据处理与上采样示意图；b) ViT 的结构；c) 多头关注机制；d) 不同头和深度的模型验证精度和验证损失，（e）图像数量和（f）图像像素。

为了分析 CNN-ViT 模型学习到的特征，我们选择了一个典型的去酸化数据集，如图 3a 所示。首先，对原始数据进行轻微扰动，生成相应的敌对样本，然后观察模型的响应。结果，如图 3b 所示，生成的样本与原始图像几乎完全相同，表明模型具有良好的鲁棒性。然后，模型将输入数据中的感兴趣区域可视化，并生成注意力热图，如图 3c 所示。图 3a 根据网格划分方法进行了标注，突出了注意力热图中的感兴趣区域。可以看出，热图中的注意力区域集中在 RHEED 镜面光斑附近，这与有经验的工艺工程师根据镜面光斑与周围背景之间的亮度差异做出决策的过程一致，表明具有很强的可解释性。然后随机选取五组氧化数据和五组脱氧数据，使用 t 分布随机邻域嵌入（t-SNE）算法将模型的高维特征映射到二维空间，形成图 3d 所示的散点图。如图 3d 中红色虚线框所示，散点图明显分为两类，且边界清晰，这表明该模型在确定基质脱酸状态方面具有极高的灵敏度。此外，对训练集上每个特征图的激活值进行平均并绘制成曲线，如图 3e 所示。从图 3e 中选取了三个典型的卷积核和卷积层输出特性图，并在图 3f 和图 3g 中直观地显示了它们的参数：卷积核和卷积层输出在 RHEED 镜面光斑附近的权重变化显著，再次显示了模型与人类识别方法的一致性。结果如图 3a 和 3b 所示。然后，我们尝试分析从其他 MBE 设备收集到的模型数据，如图 3h 所示。如图 3h 所示，我们观察到，即使将模型应用于不同旋转速度的基底和来自非数据集的 GaSb 基底数据，识别脱氧的概率也很高，平均为 96.3%。识别氧化的概率也高达 88.9%，这表明该模型具有很强的通用性，无需任何新的训练。

图 3 模型特征分析：a) 原始图像可视化 b) 对手样本生成 c) 注意力热图 d) 高维特征的 t-SNE 可视化 e) 平均激活曲线 f) 卷积核可视化 g) 卷积后特征图可视化 h) 非数据集上数据的模型处理结果。

此外，脱氧通常是在尽可能低的温度下进行的，以尽量减少基底表面原子蒸发不一致造成的非计量效应。因此，当检测到基底氧化时，程序会将基底的温度提高到当前水平以上。然后，模型会将这一温度保持一段时间，然后再进行二次测定，并重复这一过程，直到确定基底已经脱氧为止。此外，当模型连续 24 次测定结果中有 95% 出现脱氧时，就可以确定基质是否已经脱氧。这就避免了因基底表面氧化膜厚度不均而无法识别准确脱氧温度的情况。

结果和讨论

该程序用于在砷化镓基底上进行自动脱氧实验。程序运行阶段根据程序界面上 "提醒信息 "的变化进行划分，如图 4a 所示。如图 4b 所示，在整个程序运行过程中，共进行了 11 次脱氧加热循环，从 350°C 开始，直至 405°C。每次加热后，基底在此温度下保持 6 分钟；在 6 分钟结束前，打开 RHEED 快门，使用模型进行连续测定。使用散点图绘制模型测定结果，并使用移动平均法对测定结果进行统计分析（图 4c）。在脱氧温度下，模型输出结果为 "是 "的概率迅速增加，而在其他温度点，模型输出结果主要显示为 "否"。程序对模型的 24 个输出结果进行了连续计数，只有当模型输出结果为 "是 "的概率超过 95% 时，才会将当前温度视为脱氧温度，这表明从基底的任何角度获得的 RHEED 都可视为脱氧，如图 4d 所示。如图 4e-4g 所示，选择了 350 ℃、400 ℃ 和 405 ℃ 时的典型 RHEED 图像。350 ℃ 和 400 ℃ 时的 RHEED 图像亮度较弱，亮点特征相对模糊。然而，在 405 °C 时获得的 RHEED 图样显示出清晰明确的光斑轮廓，表明基底在 405 °C 时成功脱氧。该方案实现了砷化镓基底的自动脱氧。此外，在 Ge 和 InAs 衬底上也成功进行了类似的实验。

图 4. a) 程序执行阶段的划分。 b) 基质的温度曲线。 c) 模型输出结果和移动平均法的统计结果。 d) 程序确定基质是否处于脱氧阶段。 e) 350 °C 时捕获的 RHEED。

此外，还以 30 rps 的衬底旋转速度和 8 fps 的相机采样率记录了 Riber C21 MBE 系统在 GaSb 衬底上脱氧的一些 RHEED 数据，并将这些数据输入模型进行处理。模型的输出结果如图 5a 所示，从图中可以看出，从第 400 个序列到第 800 个序列，模型输出 "是 "的概率逐渐增加，移动平均法的统计曲线稳步上升。如图 5b-5d 所示，从第 400、600 和 800 个序列中获得了典型的 RHEED。在第 400 个序列中，RHEED 模式几乎没有规律可循，表明脱酸尚未发生。但是，在第 600 次序列中，RHEED 中可以看到尖锐的主光斑，而周围的光斑则不那么突出，这表明基底正在逐渐接近脱酸；在第 800 次序列中，RHEED 图案中的镜面光斑不仅变得更加尖锐，而且亮度也更加突出周围的小斑点也逐渐变得突出，表明基底正在接近脱氧状态。数据结果证实，该模型可以识别其他设备中未知材料的脱氧情况，具有很强的普适性。

图 5：GaSb 衬底脱氧数据的模型结果。 a) 模型输出结果和移动平均统计量。 b) 序列 400 中捕获的 RHEED。

摘要

本报告介绍了使用 CNN-ViT 混合模型对基底自动脱氧的综合研究。该模型在不同的数据集上进行了训练，包括来自砷化镓、锗和砷化镓基底的脱氧 RHEED 视频数据，结果表明该模型可适应各种分辨率和相机硬件。对模型参数、注意机制和特征的详细分析突出了其稳健性以及与人类经验方法的一致性，证明了其强大的可解释性。此外，还在现场进行了自动脱氧实验。该模型在基底动态加热过程中准确识别了 GaAs、Ge 和 InAs 基底的脱氧状态，并提供了准确的脱氧温度。在处理来自各种 MBE 仪器的 GaSb 基底面数据时，该模型表现出相当高的准确性。该模型在一系列设备和基底上的通用性为促进半导体制造领域的标准化进程提供了一种方法，希望将来能开发出更多通用的标准化模型。