AI模型革新缺陷检测与审查,但规模化仍面临挑战

AI模型正在显著提升半导体制造中的缺陷捕获率,帮助工程师区分真实缺陷与干扰性缺陷,并发现传统技术难以识别的缺陷类型。在晶圆边缘检测和混合键合等新兴工艺中,AI表现尤为突出。然而,超过70%的AI项目在试点后陷入停滞,主要原因在于数据碎片化、遗留系统兼容性差及企业级部署模型缺失。专家指出,数据工程平台的质量比模型本身更为关键。

当前,AI应用最亮眼的领域之一,是帮助半导体行业更有效地捕捉从光刻、图形化到多芯片封装组装等数百道工艺步骤中出现的大量缺陷类型。

工程师们正在聚焦投资回报率最高的项目,其中许多以良率提升为核心目标。借助AI模型,他们能够更轻松地区分真实缺陷与干扰性缺陷,并识别出以往难以发现的缺陷。然而,将AI解决方案从试点阶段扩展到工厂乃至企业级规模,依然面临相当大的挑战,需要更高的数据质量、更强的关联性以及更稳健的基础设施,以确保所有数据点能够正确连接。

AI模型让新型缺陷机制的处理变得更加便捷。Nordson测试与检测部门研发副总裁Charlie Zhu表示:"传统算法基于统计原理,需要收集大量数据,再根据分布规律设定标称值和公差范围,若某个值超出范围即判定为缺陷。但实际上,编程中往往涉及多个参数。如果原本有五个参数,现在要新增一个,AI只需进行逐点添加,识别出不良缺陷。只要训练数据中包含足够的变化样本,模型便会自主学习。如果没有AI模型,手动添加参数是一项繁琐耗时的工作,往往还需要专业领域知识才能实现。"

Zhu还指出,当今的AI算法相比早期模型有了显著提升,"与传统机器视觉算法相比,甚至与支持向量机(SVM)或主成分分析(PCA)等复杂机器学习算法相比,现在的模型都要稳健得多。"

混合键合等新工艺也带来了独特的缺陷特征,尤其集中在晶圆边缘区域。Microtronic应用总监Errol Akomer表示:"AI正被用于检测和分类残余钨CMP缺陷。这类钨缺陷位于晶圆边缘,传统技术根本无法检测,但AI宏观缺陷检测可以有效捕获它们。"

晶圆边缘缺陷之所以是一大难题,根源在于传统检测方式的局限性。Onto Innovation产品营销总监Woo Young Han解释道:"传统检测技术通常依赖高度重复的图形和完整的芯片参考(即芯片间比较),这使得边缘区域及不完整芯片的检测面临较大挑战。深度学习模型能够更好地泛化处理不完整或不规则结构,从而提升晶圆键合应用中局部芯片区域的缺陷检测精度。"

值得注意的是,在半导体制造环境中,机器学习模型通常与基于物理的模型结合使用。Onto Innovation高级首席应用工程师Nick Keller表示:"混合机器学习/物理模型优于纯机器学习模型,因为其本质上更具稳健性,能够像物理模型一样良好地外推至训练集之外。"

在可扩展分析领域,关键能力在于同时处理海量测量数据与高产量生产数据。PDF Solutions产品管理高级总监Ken Harris指出,多芯片封装的普及进一步加剧了数据过载问题。"新产品正通过小芯片与先进封装技术进行构建,这带来了数据规模的急剧膨胀,这正是可扩展分析真正发挥价值的地方。"

AI用于量测与AI用于缺陷检测的差异

AI和机器学习模型在缺陷检测领域的应用始终比在量测领域更为成熟。Nordson的Zhu表示:"AI在检测领域比量测领域更成熟、应用更广泛,原因是多方面的。在检测空洞、颗粒、缺口、桥接等缺陷方面,AI模型表现尤为突出。"

这一优势源于AI最擅长的能力——模式识别。通过比较图形差异进行分类,分类标准由人工训练确定。在获得足够数据的前提下,AI在缺陷分类以及区分干扰性缺陷与真实缺陷方面表现出色。

量测是一项基于物理原理的工作,旨在寻求真实准确性,或更常见的是追求精确性。捕获TSV轮廓、薄膜厚度、关键尺寸或套刻精度,并非图形识别,而是量化特征并进行可溯源的低误差测量。尽管如此,AI模型在量测改进方面也有所应用。

Onto Innovation的Han表示:"在量测领域,深度学习越来越多地被用于信号重建、轮廓提取和工艺建模。"这些模型可通过推理来提升性能,"基于AI的模型能够从嘈杂或不完整的光学信号中推断尺寸测量值、套刻误差和轮廓特征,从而提升测量精度和吞吐量。这些方法对于传统基于物理模型计算成本高昂或难以扩展的先进制程节点尤为重要。"

如今这类模型得到更广泛应用,部分原因在于推理速度的提升以及在晶圆厂现场快速落地的能力。Zhu以焊料凸块空洞检测为例说明:"传统上,我们使用二值化技术,例如为黑色焊料、良好区域与白色区域(即空洞)设定对比度容差。问题在于,对比度并不总是一致的,因为它取决于多少X射线穿透凸块并到达检测器。传统做法是操作员监控统计过程控制并进行人工调整。现在,我们整合了来自多个客户的凸块数据,构建了通用模型,单张X射线图像可在毫秒级时间内完成处理,准确率达90%。处理速度很快,客户无需从自身生产环境中收集大量数据就可以直接使用我们的AI。"

图1:跨多个客户应用的AI模型,即便在客户数据稀缺的情况下,也能改善焊料凸块X射线空洞检测效果。来源:Nordson测试与检测

自动缺陷分类

在半导体生产线上,光学工具往往先识别缺陷,再通过SEM、AFM或其他量测工具进行复检。AI和机器学习模型可以改善自动缺陷分类(ADC)流程。Onto Innovation的Han表示:"深度学习正在重塑缺陷分类与复检方式。卷积神经网络不再依赖人工设计的特征,而是能够从图像数据中自动学习复杂的缺陷特征,从而实现对颗粒、划痕、空洞、图形倒塌及其他缺陷类型更快速、更精准的分类,大幅减少人工复检工作量,加速良率学习进程。"

图2:无害缺陷与真实缺陷在外观上往往难以区分(左图)。基于机器学习的自动缺陷分类可有效过滤干扰性缺陷(右侧晶圆图)。来源:Onto Innovation

数据不足时的应对策略

由于晶圆工艺控制极为严格,可用于训练机器学习模型的缺陷样本往往数量不足。幸运的是,工程师可以通过合成数据来弥补这一不足。

Microtronic的Akomer表示:"从挑战角度来看,AI检测与分类需要足够数量且标注准确的缺陷样本。由于半导体晶圆缺陷本身较为罕见,收集起来十分困难。数据增强(仿真模拟)在克服真实缺陷图像不足问题方面发挥着重要作用,通常是训练稳健检测模型的必要手段。"

合成数据还可以帮助企业提前应对下一代节点器件的检测需求,并纳入新的缩放参数。Onto Innovation的Han表示:"基于生成式与仿真的AI模型可以创建模拟真实缺陷行为、几何形态和工艺交互的合成缺陷样本。这些仿真数据集可用于在真实缺陷数据充分积累之前,对检测系统进行训练和验证,尤其适用于新工艺节点、先进封装技术或罕见缺陷机制。通过以真实感合成缺陷扩充稀疏数据集,AI有助于提升模型稳健性、检测灵敏度和整体缺陷检测性能。"

Nordson的Zhu对此表示认同:"我们从客户处获得的许多数据集存在偏差,这是半导体检测领域的一大特殊挑战。客户的工艺良率很高,因此好数据远多于坏数据,而缺陷类型又多种多样。"他强调,实际数据固然最优,但在无法获取时,基于生成式方法的仿真模拟正在得到越来越多的评估与应用。

AI的规模化推广

晶圆厂或企业层面的数据管理,正是许多公司当前面临的主要挑战。PDF Solutions解决方案架构高级总监、无晶圆厂解决方案负责人Marc Jacobs表示:"分析服务提供商所能提供的最大价值,在于能否收集、对齐和规范化数据,并在任何需要的地方部署模型。模型本身固然重要,但其背后的数据工程平台更为关键。"

PDF Solutions估计,大多数AI项目难以实现规模化,超过70%的项目在试点阶段后便陷入停滞,原因在于数据碎片化、遗留工厂系统的制约、主题专家(SME)资源有限,以及缺乏清晰的企业级AI部署运营模型。

PDF Solutions全球晶圆厂应用解决方案经理Jon Holt表示:"要实现AI的规模化落地,企业需要一套将AI愿景转化为覆盖半导体全生命周期、持续产生高价值影响的实施蓝图。"

该公司提出了AI规模化推广的八大支柱:

符合SEMI标准的物理设备与传感器;

故障检测与分类(FDC)及循环控制;

基于计算机集成制造(CIM)/制造执行系统(MES)的数据集成,包括具备AI就绪能力的数据存储库;

用于工厂规划、调度与派工的数字孪生;

具备基于角色访问控制的知识中枢;

用于模型训练与部署的企业AI平台;

结合智能体AI与人类专家反馈的多智能体系统;

具备人工监督的自主工程。

在这一组织化过程中,确保测试与检测供应链中准确数据的可用性是常见难题之一。Jacobs表示:"当人工分析师进行探索性分析时,他们可以凭借直觉绕过不完整的元数据,察觉到数据的割裂,识别异常并加以纠正。但一旦引入自动化,这种容错能力便消失了。如果元数据对齐不到位,下游操作将无法获取其所需的上下文信息。"

数据质量在采集点最高,无论是在工艺晶圆厂生产线还是在OSAT封装测试线。将输入数据与MES或ERP系统中的真实数据进行交叉比对,可以在数据缺失或有误时实现数据增强与纠正。例如,元数据一致性是一个持续性问题,而在当今并购频发的背景下,企业还会面临不同的数据标准、批次命名规范以及标识与标签方法的差异。

结语

各企业在数据集成与AI模型应用方面处于不同阶段,但可以明确的是,模型正变得越来越智能,这将有助于降低当前的编程工作量。

Zhu表示:"对于特定的图形化芯片,传统上我们需要逐一引导模型去查找特征,针对TSV、RDL或凸块分别进行训练。但现在,借助更强大的模型,我们可以直接说'帮我找到所有RDL'或'找到所有凸块',这有望大幅减少现有的编程需求。"

现有模型尤其擅长检测工艺中的细微变化,并区分真实缺陷与干扰性缺陷。在异常识别方面,AI模型能够通过学习大量检测、量测和工艺数据中的规律,识别出正常工艺行为的细微偏差。Onto Innovation的Han表示:"与传统基于阈值的方法不同,机器学习模型能够识别出以往未曾见过或低频出现的异常,这些异常可能预示着工艺问题萌芽、设备漂移或潜在缺陷。这一能力在降低误报率的同时,也提升了对有意义异常的检测灵敏度。"

一旦工厂具备互联数据基础设施,失效根因分析将大大简化。Han补充道:"在良率学习方面,AI通过关联制造多个阶段的缺陷图形、工艺参数、设备特征和电测结果,加速根因分析。通过挖掘高维数据集中隐藏的关联关系,AI模型帮助工程师更快速地识别影响良率的关键因素,并以更高精度优化工艺条件。"

AI模型在缺陷检测领域如鱼得水,因为它们依赖模式识别。然而,其在量测领域的应用仍处于发展阶段,因为量测输出依赖精确数值。尽管如此,对于某些方法中涉及的复杂数学运算——例如散射测量中的严格耦合波分析(RCWA)——AI模型同样可以帮助加速繁琐的计算过程。此外,工具间与腔室间匹配等项目,也可通过对"黄金"工具或腔室进行训练来提升AI模型的性能。

更大的挑战不在于AI或机器学习模型本身有多先进,而在于那些远不那么光鲜的、枯燥的数据互联工作——打通工艺孤岛之间的壁垒,贯穿检测、测试、封装,乃至延伸至现场应用。当工程师能够发现新部件上的缺陷,在合理时间内迅速追溯其根因到某台特定CMP设备在特定日期的某次运行,并快速纠正工艺问题时,AI才能真正兑现它的承诺。

Q&A

Q1:AI模型在半导体缺陷检测中相比传统算法有哪些具体优势?

A:传统算法基于统计原理,需要大量数据来设定阈值,添加新参数时既繁琐又需要专业知识。AI模型则可以通过逐点学习识别不良缺陷,只需在训练数据中包含足够变化样本,模型便能自主学习,无需逐一手动编程。此外,AI更擅长模式识别,能有效区分真实缺陷与干扰性缺陷,还能检测出传统方法无法发现的边缘缺陷,例如晶圆边缘的残余钨CMP缺陷。

Q2:半导体AI检测项目为什么超过70%在试点后停滞不前?

A:PDF Solutions的数据显示,超过70%的AI项目在试点阶段后陷入停滞,主要原因包括:数据碎片化、遗留工厂系统的制约、主题专家资源不足,以及缺乏清晰的企业级AI部署运营模型。当自动化引入后,人工分析师凭直觉绕过不完整元数据的能力消失了,若元数据对齐不到位,下游操作将无法获取所需上下文信息,导致整个流程失效。

Q3:缺陷检测训练数据不足时,如何解决AI模型的数据短缺问题?

A:当真实缺陷样本稀缺时,工程师可采用合成数据来弥补。基于生成式与仿真的AI模型可创建模拟真实缺陷行为、几何形态和工艺交互的合成缺陷样本,用于在真实数据充分积累之前完成模型训练和验证。这种数据增强方法尤其适用于新工艺节点、先进封装技术或罕见缺陷机制等场景,可显著提升模型稳健性和检测灵敏度。

来源:Semiconductor Engineering

0赞

好文章,需要你的鼓励

2026

06/09

17:38

分享

点赞

邮件订阅