System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于軟傳感器技術數據生成領域,尤其涉及一種基于擴散模型的軟傳感器技術數據生成方法和系統。
技術介紹
1、在半導體制造領域,精確控制生產過程對于確保高產品質量和運營效率至關重要。一種常見的工業做法是進行計量步驟,包括在關鍵工藝步驟后對物理特征(如薄膜厚度)進行采樣和測量。這些測量用于指導后續工藝調整,旨在優化生產結果。然而,這種方法通常依賴于有限的樣本數據,通常每批次僅采樣2到3片晶圓,這種數據局限性導致生產過程控制不夠精確,可能引發質量波動。此外,頻繁的物理測量步驟不僅耗時,還需要昂貴的計量設備,增加了生產成本和周期時間,降低了整體生產效率。軟傳感器技術或虛擬計量提供了一種創新解決方案,通過無需直接物理測量來估算關鍵尺寸和材料特性。這減少了對昂貴計量工具的依賴,并降低了昂貴測量步驟的頻率。盡管如此,減少物理計量的數量限制了開發有效軟傳感器模型所需的標記訓練樣本的可用性。
2、最近的研究探索了數據生成方法以應對這些挑戰,但現有解決方案依然存在以下問題:
3、1.?生成數據質量與多樣性不足:現有的數據生成方法通常缺乏多樣性,生成的樣本質量低,無法充分模擬實際生產條件。這限制了生成數據在訓練軟傳感器模型時的有效性,導致模型性能提升有限。同時,由于生成數據質量和多樣性不足,訓練得到的軟傳感器模型在面對新數據時的泛化能力較差,難以適應生產過程中的變化和新條件。
4、2.?復雜映射關系與數據分布學習不足:傳統生成模型在捕捉工藝變量與目標變量之間的復雜映射關系時表現不佳,導致生成的虛擬樣本無法準確
5、3.?缺乏有效的優化與選擇機制:現有技術缺乏優化生成數據選擇的有效機制,無法確保所選數據在分布和多樣性上達到最佳平衡。這種不足影響了模型的訓練效果,無法充分利用生成的虛擬樣本來提升軟傳感器模型的性能。
技術實現思路
1、本專利技術為解決現有軟傳感器技術數據生成方法的缺陷,提出了一種基于擴散模型的軟傳感器技術數據生成方法和系統,該擴散模型是一種回歸增強擴散模型,將其命名為redm(regression-enhanced?diffusion?model),適用于軟傳感器技術的虛擬數據生成,能夠廣泛地提升現有的軟傳感器模型的預測性能。
2、本專利技術采用的技術方案如下:
3、第一方面,本專利技術提出了一種基于擴散模型的軟傳感器技術數據生成方法,包括以下步驟:
4、(1)收集晶圓制造過程中的數據,包括半導體關鍵制造步驟的過程數據和量測數據,將收集到的過程數據和量測數據作為訓練集;
5、(2)利用訓練集迭代訓練回歸增強擴散模型;
6、所述的回歸增強擴散模型包括擴散加噪模塊、回傳去噪模塊和基于多頭注意力機制的回歸增強模塊,所述擴散加噪模塊逐步將隨機噪聲添加至訓練集的過程數據中得到純高斯噪聲數據,回傳去噪模塊逐步將純高斯噪聲數據去噪復原,生成虛擬過程數據;回歸增強模塊分別根據真實過程數據和虛擬過程數據生成虛擬量測數據,根據虛擬量測數據和真實量測數據的損失、回傳去噪損失和利普希茨約束損失更新回歸增強擴散模型參數;
7、在迭代訓練回歸增強擴散模型過程中,每完成一輪訓練后更新訓練集,更新方法為:將回傳去噪模塊所生成的虛擬過程數據劃分為虛擬樣本子集,根據虛擬樣本子集的非支配排序結果和擁擠度結果篩選部分虛擬樣本子集并加入訓練集;
8、(3)以隨機高斯噪聲為輸入,利用訓練后的回歸增強擴散模型的回傳去噪模塊生成虛擬過程數據,將生成結果作為半導體關鍵制造步驟的軟傳感器技術數據。
9、進一步地,所述的半導體關鍵制造步驟包括化學氣相沉積步驟、刻蝕步驟、化學機械研磨步驟。
10、進一步地,所述的半導體關鍵制造步驟的過程數據為一系列傳感器數值。
11、進一步地,所述的回歸增強模塊包括編碼器、預訓練的多頭注意力模塊、線性預測層;所述的真實過程數據和虛擬過程數據分別由編碼器編碼后,再由預訓練的多頭注意力模塊提取特征,最后由線性預測層生成虛擬量測數據。
12、進一步地,迭代訓練回歸增強擴散模型的過程中,回傳去噪模塊和回歸增強模塊的損失函數分別為:
13、
14、
15、其中,和分別是回傳去噪模塊和回歸增強模塊的總損失,是回傳去噪過程中預測噪聲和實際添加噪聲之間的損失,是根據真實過程數據預測生成的虛擬量測數據與真實量測數據之間的損失,是根據虛擬過程數據預測生成的虛擬量測數據與真實量測數據之間的損失,是利普希茨約束損失,為損失系數。
16、進一步地,所述的根據虛擬樣本子集的非支配排序結果和擁擠度結果篩選部分虛擬樣本子集,包括:
17、計算每一個虛擬樣本子集與訓練集之間的sliced-wasserstein距離;
18、計算每一個虛擬樣本子集內的樣本相似度分數;
19、基于每一個虛擬樣本子集的sliced-wasserstein距離和樣本相似度分數,對虛擬樣本子集進行非支配排序,得到帕累托前沿序列,其中每一個虛擬樣本子集對應一個帕累托前沿層級;
20、計算帕累托前沿序列中每一個虛擬樣本子集的擁擠距離;
21、從帕累托前沿第一層級開始選擇虛擬樣本子集,若當前層級的虛擬樣本子集數量不滿足篩選數量要求,則從下一層級繼續選擇,對于帕累托前沿層級相同的虛擬樣本子集,優先選擇擁擠距離較大的子集,直至滿足篩選數量要求。
22、第二方面,本專利技術提出了一種基于擴散模型的軟傳感器技術數據生成系統,用于實現上述的基于擴散模型的軟傳感器技術數據生成方法。
23、第三方面,本專利技術提出了一種電子設備,包括處理器和存儲器,所述存儲器存儲有能夠被所述處理器執行的機器可執行指令,所述處理器執行所述機器可執行指令以實現上述的基于擴散模型的軟傳感器技術數據生成方法。
24、第四方面,本專利技術提出了一種機器可讀存儲介質,該機器可讀存儲介質存儲有機器可執行指令,該機器可執行指令在被處理器調用和執行時,用于實現上述的基于擴散模型的軟傳感器技術數據生成方法。
25、本專利技術具備的有益效果是:
26、(1)本專利技術提出了回歸增強擴散模型,可用于生成生成具備代表性的高質量的合成訓練樣本,將生成的半導體關鍵制造步驟的軟傳感器技術數據用于軟傳感器模型的訓練,可顯著提升現有軟傳感器模型的性能。
27、(2)本專利技術在擴散模型引入了多頭注意力機制,增強模型捕捉復雜映射關系的能力。
28、(3)本專利技術將回傳去噪模塊所生成的虛擬過程數據劃分為虛擬樣本子集,根據虛擬樣本子集的非支配排序結果和擁擠度結果篩選既具分布相似性又具多樣性的虛擬樣本,優化合成樣本并入訓練集參與訓練,確保所選數據在分布和多樣性上達到最佳平衡。
本文檔來自技高網...【技術保護點】
1.一種基于擴散模型的軟傳感器技術數據生成方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于擴散模型的軟傳感器技術數據生成方法,其特征在于,所述的半導體關鍵制造步驟包括化學氣相沉積步驟、刻蝕步驟、化學機械研磨步驟。
3.根據權利要求1所述的基于擴散模型的軟傳感器技術數據生成方法,其特征在于,所述的半導體關鍵制造步驟的過程數據為一系列傳感器數值。
4.根據權利要求1所述的基于擴散模型的軟傳感器技術數據生成方法,其特征在于,所述的回歸增強模塊包括編碼器、預訓練的多頭注意力模塊、線性預測層;所述的真實過程數據和虛擬過程數據分別由編碼器編碼后,再由預訓練的多頭注意力模塊提取特征,最后由線性預測層生成虛擬量測數據。
5.根據權利要求1所述的基于擴散模型的軟傳感器技術數據生成方法,其特征在于,迭代訓練回歸增強擴散模型的過程中,回傳去噪模塊和回歸增強模塊的損失函數分別為:
6.根據權利要求1所述的基于擴散模型的軟傳感器技術數據生成方法,其特征在于,所述的根據虛擬樣本子集的非支配排序結果和擁擠度結果篩選部分虛擬樣本子集,包括
7.一種基于擴散模型的軟傳感器技術數據生成系統,其特征在于,包括:
8.根據權利要求7所述的基于擴散模型的軟傳感器技術數據生成系統,其特征在于,所述的回歸增強模塊包括:
9.一種電子設備,其特征在于,包括處理器和存儲器,所述存儲器存儲有能夠被所述處理器執行的機器可執行指令,所述處理器執行所述機器可執行指令以實現權利要求1至6任一項所述的基于擴散模型的軟傳感器技術數據生成方法。
10.一種機器可讀存儲介質,其特征在于,該機器可讀存儲介質存儲有機器可執行指令,該機器可執行指令在被處理器調用和執行時,用于實現權利要求1至6任一項所述的基于擴散模型的軟傳感器技術數據生成方法。
...【技術特征摘要】
1.一種基于擴散模型的軟傳感器技術數據生成方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于擴散模型的軟傳感器技術數據生成方法,其特征在于,所述的半導體關鍵制造步驟包括化學氣相沉積步驟、刻蝕步驟、化學機械研磨步驟。
3.根據權利要求1所述的基于擴散模型的軟傳感器技術數據生成方法,其特征在于,所述的半導體關鍵制造步驟的過程數據為一系列傳感器數值。
4.根據權利要求1所述的基于擴散模型的軟傳感器技術數據生成方法,其特征在于,所述的回歸增強模塊包括編碼器、預訓練的多頭注意力模塊、線性預測層;所述的真實過程數據和虛擬過程數據分別由編碼器編碼后,再由預訓練的多頭注意力模塊提取特征,最后由線性預測層生成虛擬量測數據。
5.根據權利要求1所述的基于擴散模型的軟傳感器技術數據生成方法,其特征在于,迭代訓練回歸增強擴散模型的過程中,回傳去噪模塊和回歸增強模塊...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。