System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及人工智能,尤其涉及一種dropout掩膜生成器、設備、模型訓練系統及方法。
技術介紹
1、在當前的人工智能尤其是大模型訓練中,dropout掩膜被用來完成dropout計算,而dropout計算是大模型訓練的關鍵步驟,故dropout掩膜生成是重要的一步。
2、目前,現有的dropout掩膜生成方法,通常由人工智能處理器采用軟件算法,例如,伯努利分布算法等,實現dropout掩膜生成。但是,dropout掩膜生成的計算量與模型上下文長度強相關,在大模型訓練過程中,dropout掩膜生成會占用人工智能處理器寶貴的計算資源,從而影響模型訓練效率。
技術實現思路
1、本專利技術提供了一種dropout掩膜生成器、設備、模型訓練系統及方法,可以減少對人工智能處理器的計算資源的占用,可以提升大模型訓練效率。
2、根據本專利技術的一方面,提供了一種dropout掩膜生成器,包括控制模塊、多個隨機數發生模塊和多個比較模塊,所述隨機數發生模塊與所述比較模塊一一對應;
3、所述控制模塊與各所述比較模塊的輸入端連接,用于接收人工智能處理器發送的目標概率,并根據所述目標概率生成閾值,并發送所述閾值到各所述比較模塊;
4、各所述隨機數發生模塊與對應的比較模塊的輸入端連接,用于生成隨機數,并發送所述隨機數到對應的比較模塊;
5、各所述比較模塊,用于將接收的隨機數與閾值進行數值比較,并根據數值比較結果生成dropout掩膜元素。
...【技術保護點】
1.一種Dropout掩膜生成器,其特征在于,包括控制模塊、多個隨機數發生模塊和多個比較模塊,所述隨機數發生模塊與所述比較模塊一一對應;
2.根據權利要求1所述的Dropout掩膜生成器,其特征在于,所述控制模塊還與各所述隨機數發生模塊的輸入端連接,還用于轉發人工智能處理器發送的隨機數種子到各所述隨機數發生模塊;
3.根據權利要求1所述的Dropout掩膜生成器,其特征在于,還包括緩存模塊和組包模塊;
4.根據權利要求1所述的Dropout掩膜生成器,其特征在于,所述控制模塊具體用于:
5.根據權利要求1所述的Dropout掩膜生成器,其特征在于,各所述比較模塊具體用于:
6.一種網絡設備,其特征在于,包括如權利要求1-5中任一所述的Dropout掩膜生成器。
7.一種模型訓練系統,其特征在于,包括人工智能處理器以及如權利要求6所述的網絡設備;
8.一種模型訓練方法,其特征在于,應用于權利要求7所述的模型訓練系統,包括:
9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存
10.一種計算機程序產品,其特征在于,包括計算機程序,所述計算機程序在被處理器執行時實現權利要求8所述的模型訓練方法。
...【技術特征摘要】
1.一種dropout掩膜生成器,其特征在于,包括控制模塊、多個隨機數發生模塊和多個比較模塊,所述隨機數發生模塊與所述比較模塊一一對應;
2.根據權利要求1所述的dropout掩膜生成器,其特征在于,所述控制模塊還與各所述隨機數發生模塊的輸入端連接,還用于轉發人工智能處理器發送的隨機數種子到各所述隨機數發生模塊;
3.根據權利要求1所述的dropout掩膜生成器,其特征在于,還包括緩存模塊和組包模塊;
4.根據權利要求1所述的dropout掩膜生成器,其特征在于,所述控制模塊具體用于:
5.根據權利要求1所述的dropout掩膜生成器,其特征在于,各...
【專利技術屬性】
技術研發人員:王建國,王兵,胡僑娟,周永財,張亞林,
申請(專利權)人:上海燧原科技股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。