System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開的各實現方式涉及機器學習,更具體地,涉及用于管理多任務模型的方法、裝置、電子設備和存儲介質。
技術介紹
1、機器學習技術已經在多個行業中得到廣泛應用,并且目前已經提出了可以處理多個任務的多任務模型。在多任務模型中,可以基于在多個任務模型之間共享的特征提取網絡來獲取訓練數據的特征,進而執行訓練過程。然而,上述特征分別來自于多個任務模型各自的訓練數據,并且可能會導致多任務模型的識別精度下降。此時,如何以更為準確并且有效的方式生成特征、進而執行訓練過程,成為一個研究熱點。
技術實現思路
1、根據本公開的第一方面,提供了一種用于管理多任務模型的方法。在此,多任務模型包括第一任務模型和第二任務模型。在該方法中,基于注意力(attention)機制來確定第一任務模型的第一訓練數據的第一特征的第一查詢項。基于注意力機制來確定第二任務模型的第二訓練數據的第二特征的第二關鍵字項和第二數值項。基于第一查詢項、第二數值項和第二關鍵字項,確定與第一任務模型相關聯的第一目標特征。
2、根據本公開的第二方面,提供了一種用于管理多任務模型的裝置。在此,多任務模型包括第一任務模型和第二任務模型。該裝置包括:第一注意力模塊,被配置用于基于注意力機制來確定第一任務模型的第一訓練數據的第一特征的第一查詢項;第二注意力模塊,被配置用于基于注意力機制來確定第二任務模型的第二訓練數據的第二特征的第二關鍵字項和第二數值項;以及確定模塊,被配置用于基于第一查詢項、第二數值項和第二關鍵字項,確定與第一任務模型相關
3、根據本公開的第三方面,提供了一種電子設備,包括:存儲器和處理器;其中存儲器用于存儲一條或多條計算機指令,其中一條或多條計算機指令被處理器執行以實現根據本公開的第一方面的方法。
4、根據本公開的第四方面,提供了一種計算機可讀存儲介質,其上存儲有一條或多條計算機指令,其中一條或多條計算機指令被處理器執行實現根據本公開的第一方面的方法。
5、根據本公開的第五方面,提供了一種計算機程序產品,包括計算機程序/指令,其中計算機程序/指令被處理器執行時實現根據本公開的第一方面的方法。
本文檔來自技高網...【技術保護點】
1.一種用于管理多任務模型的方法,所述多任務模型包括第一任務模型和第二任務模型,所述方法包括:
2.根據權利要求1所述的方法,其中確定所述第一目標特征包括:
3.根據權利要求1所述的方法,其中確定所述第一權重包括:基于所述第一查詢項和所述第二關鍵字項的點積來確定所述第一權重。
4.根據權利要求1所述的方法,其中確定所述第一目標特征包括:基于所述第一權重和所述第二數值項的乘積來確定所述第一目標特征。
5.根據權利要求1所述的方法,其中確定所述第一目標特征包括進一步包括:
6.根據權利要求5所述的方法,其中基于所述第二權重和所述第一數值項,確定所述第一目標特征包括:
7.根據權利要求6所述的方法,其中所述多任務模型進一步包括第三任務模型,以及確定所述第一目標特征進一步包括:
8.根據權利要求1所述的方法,進一步包括:基于所述第一特征和所述第一目標特征的加權求和,更新所述第一目標特征。
9.根據權利要求5所述的方法,進一步包括:
10.根據權利要求9所述的方法,進一步包括:基于所
11.根據權利要求9所述的方法,進一步包括以下至少任一項:
12.根據權利要求11所述的方法,進一步包括:利用所述第一損失函數和所述第二損失函數中的至少任一項,訓練所述多任務模型。
13.根據權利要求12所述的方法,進一步包括:
14.一種用于管理多任務模型的裝置,所述多任務模型包括第一任務模型和第二任務模型,所述裝置包括:
15.一種電子設備,包括:
16.一種計算機可讀存儲介質,其上存儲有一條或多條計算機指令,其中所述一條或多條計算機指令被處理器執行以實現根據權利要求1至13中任一項所述的方法。
17.一種計算機程序產品,包括計算機程序/指令,其中所述計算機程序/指令被處理器執行時實現根據權利要求1至13中任一項所述的方法。
...【技術特征摘要】
1.一種用于管理多任務模型的方法,所述多任務模型包括第一任務模型和第二任務模型,所述方法包括:
2.根據權利要求1所述的方法,其中確定所述第一目標特征包括:
3.根據權利要求1所述的方法,其中確定所述第一權重包括:基于所述第一查詢項和所述第二關鍵字項的點積來確定所述第一權重。
4.根據權利要求1所述的方法,其中確定所述第一目標特征包括:基于所述第一權重和所述第二數值項的乘積來確定所述第一目標特征。
5.根據權利要求1所述的方法,其中確定所述第一目標特征包括進一步包括:
6.根據權利要求5所述的方法,其中基于所述第二權重和所述第一數值項,確定所述第一目標特征包括:
7.根據權利要求6所述的方法,其中所述多任務模型進一步包括第三任務模型,以及確定所述第一目標特征進一步包括:
8.根據權利要求1所述的方法,進一步包括:基于所述第一特征和所述第一目標特征的加權求和,更新所述第一目標特征。
9...
【專利技術屬性】
技術研發人員:薛韜略,王智恒,張天明,
申請(專利權)人:北京嘀嘀無限科技發展有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。