System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請實施例涉及人工智能,具體而言,涉及一種錯誤定位方法、裝置、設備及存儲介質。
技術介紹
1、在大語言模型芯片的開發過程中,對大語言模型進行調試和優化時,若大語言模型的計算出現錯誤,需要盡快的定位錯誤發生的位置。相關技術中,通過在仿真環境中大語言模型的設計進行全面的功能驗證和性能分析來定位大語言模型的錯誤,或者通過在芯片設計過程中插入大量的打印語句和日志記錄,收集運行時信息來定位大語言模型的錯誤。
2、相關技術中,無法快速定位大語言模型出現錯誤的具體位置和原因,并且需要耗費大量的時間和資源才能完成調試過程。
技術實現思路
1、本申請實施例提供一種錯誤定位方法、裝置、設備及存儲介質,旨在快速定位大語言模型出現的錯誤。
2、本申請實施例第一方面提供一種錯誤定位方法,所述方法包括:
3、將第一計算設備中的目標模型的每一層的目標算子對應的計算參數以及第一結果參數拷貝至第二計算設備中;
4、通過所述第二計算設備中的深度學習框架,根據所述計算參數執行與所述目標算子相同的計算步驟,得到第二結果參數;
5、在所述第一結果參數與所述第二結果參數之間的誤差值超過預設的第一誤差閾值的情況下,在所述第一計算設備與所述第二計算設備中對所述目標算子的計算步驟進行中間結果對比,確定所述目標模型中的錯誤位置。
6、可選地,其特征在于,所述方法還包括:
7、對所述目標模型中的錯誤進行錯誤類型判斷,確定所述錯誤對應的錯誤類型;
>8、生成包括所述錯誤類型的錯誤報告。
9、可選地,在將第一計算設備中的目標模型的每一層的目標算子對應的計算參數以及第一結果參數拷貝至第二計算設備中之前,所述方法還包括:
10、根據所述目標模型的結構,確定所述目標模型中的每一層中包括的主要算子;
11、將所述主要算子作為所述目標算子。
12、可選地,所述將第一計算設備中的目標模型的每一層的目標算子對應的計算參數以及第一結果參數拷貝至第二計算設備中,包括:
13、在所述第一計算設備中將所述計算參數以及所述第一結果參數進行備份,得到備份數據;
14、將所述備份數據發送至所述第二計算設備中;
15、根據第二計算設備中的所述備份數據,生成預設格式的參數文件;
16、將所述參數文件保存至所述第二計算設備中。
17、可選地,所述通過所述第二計算設備中的深度學習框架,根據所述計算參數執行與所述目標算子相同的計算步驟,得到第二結果參數,包括:
18、通過所述第二計算設備讀取從所述第一計算設備中獲取的參數文件;
19、從所述參數文件中獲取所述計算參數;
20、將所述計算參數輸入所述深度學習框架中,執行與所述目標算子相同的計算步驟,得到所述第二結果參數。
21、可選地,所述在所述第一計算設備與所述第二計算設備中對所述目標算子的計算步驟進行中間結果對比,確定所述目標模型中的錯誤位置,包括:
22、確定所述目標算子在所述第一計算設備中與所述第二計算設備中執行的所有的計算步驟;
23、獲取所述第一計算設備中的所述目標算子對應的所有計算步驟的第一中間結果;
24、獲取所述第二計算設備中的所述目標算子對應的所有計算步驟的第二中間結果;
25、將所述第一計算設備中的所有計算步驟與所述第二計算設備中的所有計算步驟進行一一對應,得到所述第一計算設備與所述第二計算設備中的計算步驟對應關系;
26、根據所述計算步驟對應關系,對所述第一中間結果與第二中間結果進行對比;
27、在所述第一中間結果與所述第二中間結果之間的誤差超過預設的第二誤差閾值的情況下,確定所述第一中間結果與所述第二中間結果對應的計算步驟;
28、確定所述目標模型中的錯誤位置為所述計算步驟。
29、可選地,所述對所述目標模型中的錯誤進行錯誤類型判斷,確定所述錯誤對應的錯誤類型,包括:
30、在所述目標模型的計算步驟中加載了錯誤的參數的情況下,確定所述錯誤類型為加載參數錯誤;
31、在所述目標類型的計算步驟中出現了計算錯誤的情況下,確定所述錯誤類型為計算錯誤。
32、本申請實施例第二方面提供一種錯誤定位裝置,所述裝置包括:
33、參數拷貝模塊,用于將第一計算設備中的目標模型的每一層的目標算子對應的計算參數以及第一結果參數拷貝至第二計算設備中;
34、第二結果參數獲取模塊,用于通過所述第二計算設備中的深度學習框架,根據所述計算參數執行與所述目標算子相同的計算步驟,得到第二結果參數;
35、錯誤位置確定模塊,用于在所述第一結果參數與所述第二結果參數之間的誤差值超過預設的第一誤差閾值的情況下,在所述第一計算設備與所述第二計算設備中對所述目標算子的計算步驟進行中間結果對比,確定所述目標模型中的錯誤位置。
36、可選地,所述裝置還包括:
37、錯誤類型判斷模塊,用于對所述目標模型中的錯誤進行錯誤類型判斷,確定所述錯誤對應的錯誤類型;
38、錯誤報告生成模塊,用于生成包括所述錯誤類型的錯誤報告。
39、可選地,所述裝置還包括:
40、主要算子確定模塊,用于根據所述目標模型的結構,確定所述目標模型中的每一層中包括的主要算子;
41、目標算子確定模塊,用于將所述主要算子作為所述目標算子。
42、可選地,所述數據拷貝模塊包括:
43、數據備份子模塊,用于在所述第一計算設備中將所述計算參數以及所述第一結果參數進行備份,得到備份數據;
44、數據發送子模塊,用于將所述備份數據發送至所述第二計算設備中;
45、參數文件生成子模塊,用于根據第二計算設備中的所述備份數據,生成預設格式的參數文件;
46、參數文件保存子模塊,用于將所述參數文件保存至所述第二計算設備中。
47、可選地,所述第二結果參數獲取模塊包括:
48、參數文件讀取子模塊,用于通過所述第二計算設備讀取從所述第一計算設備中獲取的參數文件;
49、計算參數獲取子模塊,用于從所述參數文件中獲取所述計算參數;
50、第二結果參數獲取子模塊,用于將所述計算參數輸入所述深度學習框架中,執行與所述目標算子相同的計算步驟,得到所述第二結果參數。
51、可選地,所述錯誤位置確定模塊包括:
52、計算步驟確定子模塊,用于確定所述目標算子在所述第一計算設備中與所述第二計算設備中執行的所有的計算步驟;
53、第一中間結果獲取子模塊,用于獲取所述第一計算設備中的所述目標算子對應的所有計算步驟的第一中間結果;
54、第二中間結果獲取子模塊,用于獲取所述第二計算設備中的所述目標算子對應的所有計算步驟的第二本文檔來自技高網...
【技術保護點】
1.一種錯誤定位方法,其特征在于,所述方法包括:
2.根據權利要求1所述的錯誤定位方法,其特征在于,所述方法還包括:
3.根據權利要求1所述的錯誤定位方法,其特征在于,在將第一計算設備中的目標模型的每一層的目標算子對應的計算參數以及第一結果參數拷貝至第二計算設備中之前,所述方法還包括:
4.根據權利要求1所述的錯誤定位方法,其特征在于,所述將第一計算設備中的目標模型的每一層的目標算子對應的計算參數以及第一結果參數拷貝至第二計算設備中,包括:
5.根據權利要求1所述的錯誤定位方法,其特征在于,所述通過所述第二計算設備中的深度學習框架,根據所述計算參數執行與所述目標算子相同的計算步驟,得到第二結果參數,包括:
6.根據權利要求1所述的錯誤定位方法,其特征在于,所述在所述第一計算設備與所述第二計算設備中對所述目標算子的計算步驟進行中間結果對比,確定所述目標模型中的錯誤位置,包括:
7.根據權利要求2所述的錯誤定位方法,其特征在于,所述對所述目標模型中的錯誤進行錯誤類型判斷,確定所述錯誤對應的錯誤類型,包括:
...【技術特征摘要】
1.一種錯誤定位方法,其特征在于,所述方法包括:
2.根據權利要求1所述的錯誤定位方法,其特征在于,所述方法還包括:
3.根據權利要求1所述的錯誤定位方法,其特征在于,在將第一計算設備中的目標模型的每一層的目標算子對應的計算參數以及第一結果參數拷貝至第二計算設備中之前,所述方法還包括:
4.根據權利要求1所述的錯誤定位方法,其特征在于,所述將第一計算設備中的目標模型的每一層的目標算子對應的計算參數以及第一結果參數拷貝至第二計算設備中,包括:
5.根據權利要求1所述的錯誤定位方法,其特征在于,所述通過所述第二計算設備中的深度學習框架,根據所述計算參數執行與所述目標算子相同的計算步驟,得到第二結果參數,包括:
6.根據權利要求1...
【專利技術屬性】
技術研發人員:王辰,
申請(專利權)人:蘇州元腦智能科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。