System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及人工智能,尤其涉及一種多任務標注模型的訓練方法、裝置、電子設備及存儲介質。
技術介紹
1、在自動駕駛數據預標注過程中,長尾數據的標注是一個常見且難以解決的挑戰。相關技術中在遇到對長尾數據標注效果不好的情況時,或者更新包括長尾數據相關類型數據的樣本,重新對標注模型進行訓練,或者嘗試對長尾數據進行增強,由或者對長尾數據的類別權重進行調整,以解決該問題。
2、這些處理方式成本較高,且在某些情況下訓練得到的標注模型對長尾數據的標注準確度仍然不夠。
技術實現思路
1、有鑒于此,本申請實施例提供了一種多任務標注模型的訓練方法、裝置、電子設備及存儲介質,以解決現有技術中對長尾數據的標注不夠準確的問題。
2、本申請實施例的第一方面,提供了一種多任務標注模型的訓練方法,包括:
3、獲取訓練樣本,所述訓練樣本包括圖像數據集,所述圖像數據集中的每一圖像數據分別被標注至少一個類別標簽,且所述圖像數據集對應n個不同的類別,n為大于1的正整數;
4、獲取預訓練多任務標注模型,所述預訓練多任務標注模型包括共享特征提取網絡和n個不同的分類網絡,每個分類網絡對應一個類別;
5、使用所述訓練樣本對所述預訓練多任務標注模型進行訓練,響應于確定所述共享特征提取網絡收斂,凍結所述共享特征提取網絡的網絡參數;
6、使用所述訓練樣本對凍結了共享特征提取網絡的網絡參數的預訓練多任務標注模型再次進行訓練,直至所述n個分類網絡均收斂,得到訓練后的多任務
7、本申請實施例的第二方面,提供了一種數據標注方法,包括:
8、獲取目標數據;
9、獲取采用如上述第一方面提供的方法訓練得到的多任務標注模型;
10、使用所述訓練后的多任務標注模型對所述目標數據進行預測,得到預測分類;
11、使用所述預測分類對所述目標數據進行標注。
12、本申請實施例的第三方面,提供了一種多任務標注模型的訓練裝置,包括:
13、獲取模塊,被配置為獲取訓練樣本,所述訓練樣本包括圖像數據集,所述圖像數據集中的每一圖像數據分別被標注至少一個類別標簽,且所述圖像數據集對應n個不同的類別,n為大于1的正整數;
14、所述獲取模塊還被配置為獲取預訓練多任務標注模型,所述預訓練多任務標注模型包括共享特征提取網絡和n個不同的分類網絡,每個分類網絡對應一個類別;
15、訓練模塊,被配置為使用所述訓練樣本對所述預訓練多任務標注模型進行訓練,響應于確定所述共享特征提取網絡收斂,凍結所述共享特征提取網絡的網絡參數;
16、所述訓練模塊還被配置為使用所述訓練樣本對凍結了共享特征提取網絡的網絡參數的預訓練多任務標注模型再次進行訓練,直至所述n個分類網絡均收斂,得到訓練后的多任務標注模型。
17、本申請實施例的第四方面,提供了一種電子設備,包括存儲器、處理器以及存儲在存儲器中并且可在處理器上運行的計算機程序,該處理器執行計算機程序時實現上述方法的步驟。
18、本申請實施例的第五方面,提供了一種計算機可讀存儲介質,該計算機可讀存儲介質存儲有計算機程序,該計算機程序被處理器執行時實現上述方法的步驟。
19、本申請實施例與現有技術相比存在的有益效果是:本申請實施例通過獲取訓練樣本和預訓練多任務標注模型,利用訓練樣本首先訓練預訓練多任務標注模型中的共享特征提取網絡,并在共享特征提取網絡訓練完成后凍結其網絡參數,然后使用訓練樣本對凍結了共享特征提取網絡的網絡參數的預訓練多任務標注模型再次進行訓練,得到n個訓練好的分類網絡,進而得到訓練后的多任務標注模型,實現了僅訓練一個模型即可得到能夠識別多種不同類別數據的標注模型,同時共享特征提取網絡在訓練完成后可以進行參數凍結,后續訓練各分類網絡時無需調整共享特征提取網絡的網絡參數,降低了數據處理量且能夠較好地保持標注結果的一致性,提高了數據標注的效率。
本文檔來自技高網...【技術保護點】
1.一種多任務標注模型的訓練方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述確定所述共享特征提取網絡收斂,包括:
3.根據權利要求1所述的方法,其特征在于,所述使用所述訓練樣本對凍結了共享特征提取網絡的網絡參數的預訓練多任務標注模型再次進行訓練,直至所述N個分類網絡均收斂,包括:
4.根據權利要求1所述的方法,其特征在于,所述分類網絡至少包括第二目標分類網絡,所述第二目標分類網絡用于對長尾數據進行標注,所述長尾數據為屬于目標類別的數據量小于預設數據量閾值的數據;
5.根據權利要求1所述的方法,其特征在于,所述方法還包括:
6.根據權利要求5所述的方法,其特征在于,所述使用更新后的訓練樣本重新訓練所述多任務標注模型,包括:
7.根據權利要求1所述的方法,其特征在于,在得到訓練后的多任務標注模型后,所述方法還包括:
8.一種多任務標注模型的訓練裝置,其特征在于,包括:
9.一種電子設備,包括存儲器、處理器以及存儲在所述存儲器中并且可在所述處理器上運行的計算機程序,其
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至7中任一項所述方法的步驟。
...【技術特征摘要】
1.一種多任務標注模型的訓練方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述確定所述共享特征提取網絡收斂,包括:
3.根據權利要求1所述的方法,其特征在于,所述使用所述訓練樣本對凍結了共享特征提取網絡的網絡參數的預訓練多任務標注模型再次進行訓練,直至所述n個分類網絡均收斂,包括:
4.根據權利要求1所述的方法,其特征在于,所述分類網絡至少包括第二目標分類網絡,所述第二目標分類網絡用于對長尾數據進行標注,所述長尾數據為屬于目標類別的數據量小于預設數據量閾值的數據;
5.根據權利要求1所述的方法,其特征在于,所述方法還包括:
6.根據權利...
【專利技術屬性】
技術研發人員:肖貴明,張操,蘇星溢,
申請(專利權)人:重慶賽力斯鳳凰智創科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。