System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機,特別是涉及一種內容審核模型訓練方法、裝置、計算機設備、存儲介質和計算機程序產品。
技術介紹
1、隨著計算機技術的發展,內容創作行業迎來了一個快速發展的新時代。無論是個人還是企業,都在通過各種形式的內容來表達自我、傳遞信息以及塑造品牌形象。這個過程中,高質量的內容成為了吸引用戶關注、增強互動性的關鍵要素。
2、為了提高內容質量,可以對內容進行審核,過濾低質量的內容。可以訓練內容審核模型來進行內容審核。目前,通常是基于訓練數據集直接對內容審核模型進行多任務學習,然而,多任務學習的難度大,難以訓練得到準確性較高的內容審核模型。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種能夠提高模型準確性的內容審核模型訓練方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品。
2、本申請提供了一種內容審核模型訓練方法,包括:
3、獲取多個內容審核任務分別對應的訓練數據集;所述訓練數據集包括訓練樣本和所述訓練樣本對應的訓練標簽,所述訓練樣本包括訓練圖像和訓練圖像對應的訓練文本,所述訓練標簽為所述訓練圖像對應的內容審核標簽;
4、將多個訓練樣本輸入初始內容審核模型,得到多個訓練樣本對應的第一預測標簽,基于多個訓練樣本對應的第一預測標簽和訓練標簽,調整所述初始內容審核模型中的全局多模態對齊參數,直至滿足第一收斂條件,得到中間內容審核模型;
5、將多個訓練樣本輸入所述中間內容審核模型,得到多個訓練樣本對應的第二預測
6、將多個訓練樣本輸入所述初始內容審核模型,得到多個訓練樣本對應的第三預測標簽,基于屬于同一任務組的多個訓練樣本對應的第三預測標簽和訓練標簽,分別得到所述多個任務組對應的任務組損失,基于屬于同一內容審核任務的多個訓練樣本對應的第三預測標簽和訓練標簽,分別得到所述多個內容審核任務對應的任務損失;
7、基于所述任務組損失,調整所述初始內容審核模型中相應任務組對應的組內多模態對齊參數,基于所述任務損失,調整所述初始內容審核模型中相應內容審核任務對應的任務多模態對齊參數,直至滿足第二收斂條件,得到目標內容審核模型。
8、本申請還提供了一種內容審核模型訓練裝置,包括:
9、數據集獲取模塊,用于獲取多個內容審核任務分別對應的訓練數據集;所述訓練數據集包括訓練樣本和所述訓練樣本對應的訓練標簽,所述訓練樣本包括訓練圖像和訓練圖像對應的訓練文本,所述訓練標簽為所述訓練圖像對應的內容審核標簽;
10、第一訓練模塊,用于將多個訓練樣本輸入初始內容審核模型,得到多個訓練樣本對應的第一預測標簽,基于多個訓練樣本對應的第一預測標簽和訓練標簽,調整所述初始內容審核模型中的全局多模態對齊參數,直至滿足第一收斂條件,得到中間內容審核模型;
11、任務分組模塊,用于將多個訓練樣本輸入所述中間內容審核模型,得到多個訓練樣本對應的第二預測標簽,基于多個訓練樣本對應的第二預測標簽和訓練標簽,將所述多個內容審核任務分組,得到多個任務組;
12、第二訓練模塊,用于將多個訓練樣本輸入所述初始內容審核模型,得到多個訓練樣本對應的第三預測標簽,基于屬于同一任務組的多個訓練樣本對應的第三預測標簽和訓練標簽,分別得到所述多個任務組對應的任務組損失,基于屬于同一內容審核任務的多個訓練樣本對應的第三預測標簽和訓練標簽,分別得到所述多個內容審核任務對應的任務損失;
13、所述第二訓練模塊,還用于基于所述任務組損失,調整所述初始內容審核模型中相應任務組對應的組內多模態對齊參數,基于所述任務損失,調整所述初始內容審核模型中相應內容審核任務對應的任務多模態對齊參數,直至滿足第二收斂條件,得到目標內容審核模型。
14、本申請還提供了一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現上述內容審核模型訓練方法所述的步驟。
15、本申請還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現上述內容審核模型訓練方法所述的步驟。
16、本申請還提供了一種計算機程序產品,包括計算機程序,所述計算機程序被處理器執行時實現上述內容審核模型訓練方法所述的步驟。
17、上述內容審核模型訓練方法、裝置、計算機設備、存儲介質和計算機程序產品,獲取多個內容審核任務分別對應的訓練數據集,基于多個訓練數據集訓練得到目標內容審核模型。先基于多個訓練數據集對初始內容審核模型進行訓練,在訓練時調整初始內容審核模型中所有任務之間共享的全局多模態對齊參數,從而得到中間內容審核模型,使得中間內容審核模型具有一定的內容審核能力。然后,基于中間內容審核模型對多個內容審核任務進行分組,將相似的內容審核任務歸入一個任務組,得到多個任務組。基于多個訓練數據集對初始內容審核模型進行分組訓練,在訓練時不同的任務組各自計算自己的損失,基于任務組對應的任務組損失調整同一任務組中各個任務之間共享的組內多模態對齊參數,以加強組內任務的互相學習,提高相似任務之間的互補性,不同的任務各自計算自己的損失,基于任務對應的任務損失調整任務自己的任務多模態對齊參數,以提高各個任務的獨特性,最終得到目標內容審核模型,使得目標內容審核模型可以在多個內容審核任務上均具有較高的準確性。
本文檔來自技高網...【技術保護點】
1.一種內容審核模型訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述將多個訓練樣本輸入初始內容審核模型,得到多個訓練樣本對應的第一預測標簽,包括:
3.根據權利要求1所述的方法,其特征在于,所述基于多個訓練樣本對應的第二預測標簽和訓練標簽,將所述多個內容審核任務分組,得到多個任務組,包括:
4.根據權利要求1所述的方法,其特征在于,所述將多個訓練樣本輸入所述初始內容審核模型,得到多個訓練樣本對應的第三預測標簽,包括:
5.根據權利要求1所述的方法,其特征在于,所述獲取多個內容審核任務分別對應的訓練數據集,包括:
6.根據權利要求1所述的方法,其特征在于,所述方法還包括:
7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
8.一種內容審核模型訓練裝置,其特征在于,所述裝置包括:
9.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至7中任一項所述的方法的步驟。
...【技術特征摘要】
1.一種內容審核模型訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述將多個訓練樣本輸入初始內容審核模型,得到多個訓練樣本對應的第一預測標簽,包括:
3.根據權利要求1所述的方法,其特征在于,所述基于多個訓練樣本對應的第二預測標簽和訓練標簽,將所述多個內容審核任務分組,得到多個任務組,包括:
4.根據權利要求1所述的方法,其特征在于,所述將多個訓練樣本輸入所述初始內容審核模型,得到多個訓練樣本對應的第三預測標簽,包括:
5.根據權利要求1所述的方法,其特征在于,所述獲取多個內容審...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。