System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及模型訓練,尤其涉及一種模型訓練的改進方法及裝置。
技術介紹
1、隨著大模型技術在現實社會中的廣泛應用,訓練規模日益龐大,對計算資源的需求也急劇增加,這不僅導致了高昂的物力成本,還使得訓練過程變得漫長而繁瑣。
2、目前,在模型訓練和優化過程中,將數據輸入至模型中,得到輸出結果,對輸出結果進行分析,得到分析結果,根據分析結果去調整某些參數,重新進行訓練,并再次評估模型的性能。然而,每次調整參數后都需要重新訓練模型,耗費大量時間和資源,導致模型訓練的效率低下。
3、因此,如何提升模型訓練的效率,成為本領域亟需解決的問題。
技術實現思路
1、本申請提供了一種模型訓練的改進方法及裝置,目的在于提升模型訓練的效率。
2、為了實現上述目的,本申請提供了以下技術方案:
3、一種模型訓練的改進方法,包括:
4、獲取多個待訓練數據;
5、對于每個所述待訓練數據,將所述待訓練數據以矩陣方式填充至矩陣空間的多維數據空間中,得到多個信息區域;
6、分別將多個所述信息區域輸入至模型中,得到每個所述信息區域的訓練結果;
7、分別將每個所述信息區域的訓練結果以所述矩陣方式,依次存儲至所述矩陣空間的目標區域中;所述目標區域為另一個所述多維數據空間;
8、基于所有所述目標區域與所有所述信息區域生成模型變化報告;
9、根據所述模型變化報告確定所述模型訓練的相關方向,并根據所述模型訓練的相關方
10、可選的,所述獲取多個待訓練數據之后,還包括:
11、獲取待訓練數據的量級和精確度要求;所述待訓練數據的量級指示所述待訓練數據的數量和所述待訓練數據的維度,所述精確度要求指示計算結果的精度;
12、根據所述待訓練數據的量級和所述精確度要求構建數據空間;
13、將所述數據空間進行轉換,得到初始矩陣空間;
14、利用稀疏矩陣方式對所述初始矩陣空間的存儲空間進行縮減,得到矩陣空間;所述矩陣空間包括多維數據空間。
15、可選的,所述基于所有所述目標區域與所有所述信息區域生成模型變化報告,包括:
16、對于每個所述信息區域,將所述信息區域和所述信息區域對應的目標區域進行比對,得到比對結果;
17、基于所有所述比對結果生成模型變化報告。
18、可選的,所述根據所述模型變化報告確定所述模型訓練的相關方向,包括:
19、從所述模型變化報告中,篩選出所述信息區域和所述目標區域之間差距最大的區域,并標識為敏感交互區域;
20、將所述敏感交互區域確定為所述模型訓練的相關方向。
21、可選的,還包括:
22、從所述模型變化報告中,篩選出所述信息區域和所述信息區域對應的目標區域之間存在差異的區域,并標識為激活信息區域;
23、根據所述激活信息區域生成空間邏輯鏈反應圖;
24、從所述空間邏輯鏈反應圖中篩選出存在偏差的數據;
25、對所述存在偏差的數據進行分析,得到所述待訓練數據的數據類型和所述模型訓練的相關方向;
26、根據所述待訓練數據的數據類型和所述模型訓練的相關方向,對所述模型進行訓練。
27、一種模型訓練的改進裝置,包括:
28、獲取單元,用于獲取多個待訓練數據;
29、填充單元,用于對于每個所述待訓練數據,將所述待訓練數據以矩陣方式填充至矩陣空間的多維數據空間中,得到多個信息區域;
30、輸入單元,用于分別將多個所述信息區域輸入至模型中,得到每個所述信息區域的訓練結果;
31、存儲單元,用于分別將每個所述信息區域的訓練結果以所述矩陣方式,依次存儲至所述矩陣空間的目標區域中;所述目標區域為另一個所述多維數據空間;
32、生成單元,用于基于所有所述目標區域與所有所述信息區域生成模型變化報告;
33、訓練單元,用于根據所述模型變化報告確定所述模型訓練的相關方向,并根據所述模型訓練的相關方向對所述模型進行訓練。
34、可選的,還包括:
35、數據獲取單元,用于獲取待訓練數據的量級和精確度要求;所述待訓練數據的量級指示所述待訓練數據的數量和所述待訓練數據的維度,所述精確度要求指示計算結果的精度;
36、構建單元,用于根據所述待訓練數據的量級和所述精確度要求構建數據空間;
37、轉換單元,用于將所述數據空間進行轉換,得到初始矩陣空間;
38、縮減單元,用于利用稀疏矩陣方式對所述初始矩陣空間的存儲空間進行縮減,得到矩陣空間;所述矩陣空間包括多維數據空間。
39、可選的,所述生成單元具體用于:
40、對于每個所述信息區域,將所述信息區域和所述信息區域對應的目標區域進行比對,得到比對結果;
41、基于所有所述比對結果生成模型變化報告。
42、可選的,所述訓練單元具體用于:
43、從所述模型變化報告中,篩選出所述信息區域和所述目標區域之間差距最大的區域,并標識為敏感交互區域;
44、將所述敏感交互區域確定為所述模型訓練的相關方向。
45、可選的,還包括:
46、篩選單元,用于從所述模型變化報告中,篩選出所述信息區域和所述信息區域對應的目標區域之間存在差異的區域,并標識為激活信息區域;
47、信息生成單元,用于根據所述激活信息區域生成空間邏輯鏈反應圖;
48、數據篩選單元,用于從所述空間邏輯鏈反應圖中篩選出存在偏差的數據;
49、分析單元,用于對所述存在偏差的數據進行分析,得到所述待訓練數據的數據類型和所述模型訓練的相關方向;
50、模型訓練單元,用于根據所述待訓練數據的數據類型和所述模型訓練的相關方向,對所述模型進行訓練。
51、本申請提供的技術方案,獲取多個待訓練數據;對于每個待訓練數據,將待訓練數據以矩陣方式填充至矩陣空間的多維數據空間中,得到多個信息區域;分別將多個信息區域輸入至模型中,得到每個信息區域的訓練結果;分別將每個信息區域的訓練結果以矩陣方式,依次存儲至矩陣空間的目標區域中;基于所有目標區域與所有信息區域生成模型變化報告;根據模型變化報告確定模型訓練的相關方向,并根據模型訓練的相關方向對模型進行訓練。在本申請中,通過模型變化報告來確定模型參數明顯變化的區域,通過對模型參數變化的區域進行分析,就能得到模型訓練的相關方向,通過模型訓練的相關方向的待訓練數據對模型進行訓練即可,不需要根據每一個方向的待訓練數據的數據類型對模型進行訓練,減少了模型訓練的訓練時間和資源,進而提升了模型訓練的訓練效率。
本文檔來自技高網...【技術保護點】
1.一種模型訓練的改進方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取多個待訓練數據之后,還包括:
3.根據權利要求1所述的方法,其特征在于,所述基于所有所述目標區域與所有所述信息區域生成模型變化報告,包括:
4.根據權利要求1所述的方法,其特征在于,所述根據所述模型變化報告確定所述模型訓練的相關方向,包括:
5.根據權利要求1所述的方法,其特征在于,還包括:
6.一種模型訓練的改進裝置,其特征在于,包括:
7.根據權利要求6所述的裝置,其特征在于,還包括:
8.根據權利要求6所述的裝置,其特征在于,所述生成單元具體用于:
9.根據權利要求6所述的裝置,其特征在于,所述訓練單元具體用于:
10.根據權利要求6所述的裝置,其特征在于,還包括:
【技術特征摘要】
1.一種模型訓練的改進方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取多個待訓練數據之后,還包括:
3.根據權利要求1所述的方法,其特征在于,所述基于所有所述目標區域與所有所述信息區域生成模型變化報告,包括:
4.根據權利要求1所述的方法,其特征在于,所述根據所述模型變化報告確定所述模型訓練的相關方向,包括:
5....
【專利技術屬性】
技術研發人員:譚明旭,李瑞東,聶春梅,趙文杰,李峰,梁志海,董毅,
申請(專利權)人:山東矩陣軟件工程股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。