System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本申請涉及計算機視覺應用,具體而言,涉及一種模型訓練方法、裝置及目標裝備的識別方法。
技術介紹
1、現(xiàn)有的對例如頭盔等目標裝備的識別系統(tǒng)大多基于傳統(tǒng)的計算機視覺技術,這些技術通常依賴于手工設計的特征提取方法和靜態(tài)的目標檢測模型。雖然這些方法在一些場景下表現(xiàn)良好,但在面對多樣化的實際應用環(huán)境時,其性能往往受到限制。具體來說,可能在人體多樣化姿態(tài)和目標裝備種類較多的情況下出現(xiàn)誤檢或漏檢的問題。
2、針對上述的問題,目前尚未提出有效的解決方案。
技術實現(xiàn)思路
1、本申請實施例提供了一種模型訓練方法、裝置及目標裝備的識別方法,以至少解決相關目標裝備識別模型的識別精度較低的技術問題。
2、根據(jù)本申請實施例的一個方面,提供了一種模型訓練方法,包括:獲取視頻流中的多個圖像幀,其中,每個圖像幀中包括:佩戴目標裝備的目標對象;對圖像幀進行卷積操作,并對卷積操作得到的特征進行批量歸一化處理,得到第一目標特征圖;利用不同尺度的卷積核對第一目標特征圖進行卷積操作,并將不同尺度的卷積核的輸出特征圖進行融合,得到卷積層輸出的n層的第二目標特征圖,其中,n為大于1的正整數(shù);對n層的第二目標特征圖中每層的第二目標特征圖進行多尺度特征融合,得到每層的第二目標特征圖對應的第一特征,對第一特征進行加權融合,得到第三目標特征圖;利用第三目標特征圖對深度學習模型進行訓練,得到目標裝備識別模型,其中,目標裝備識別模型用于識別目標對象是否佩戴目標裝備。
3、可選地,對圖像幀進行卷積操作,并對
4、可選地,對n層的第二目標特征圖中每層的第二目標特征圖進行多尺度特征融合,得到每層的第二目標特征圖對應的第一特征,包括:對于第i層的第二目標特征圖,對第i+1層的第二目標特征圖進行上采樣,并將上采樣結果與第i的第二目標特征圖進行融合,得到第一融合結果,其中,i為不大于n的正整數(shù);對于第i層的第二目標特征圖,對第i-1層的第二目標特征圖進行下采樣,并將下采樣結果與第i層的第二目標特征圖進行融合,得到第二融合結果;對于第i層的第二目標特征圖,對第一融合結果以及第二融合結果進行融合,得到每層的第二目標特征圖對應的第一特征。
5、可選地,對第一特征進行加權融合,得到第三目標特征圖,包括:根據(jù)每個第一特征對應的第一參數(shù)以及第二參數(shù),確定每個第一特征的權重,其中,第一參數(shù)用于表征第一特征的表達能力,第二參數(shù)用于表征第一特征對識別任務的貢獻程度;根據(jù)每個第一特征的權重,對第一特征進行加權融合,得到第三目標特征圖。
6、可選地,第一參數(shù)至少包括:信息熵;第二參數(shù)至少包括:互信息,其中,互信息用于表征深度學習模型所輸出的特征圖與預設任務標簽之間的相關性。
7、可選地,利用第三目標特征圖對深度學習模型進行訓練,得到目標裝備識別模型,包括:利用回歸網絡對中心點的預測函數(shù),預測第三目標特征圖中目標裝備的中心點的坐標;利用回歸網絡對尺寸的預測函數(shù),預測第三目標特征圖中目標裝備的尺寸;根據(jù)預測得到的目標裝備的中心點的坐標以及目標裝備的尺寸,計算目標裝備的位置和邊界框,以得到模型輸出結果;計算預測得到的目標裝備的中心點的坐標與真實中心點的坐標之間的第一誤差,計算預測得到的目標裝備的尺寸與真實尺寸之間的第二誤差;對第一誤差和第二誤差進行加權求和,得到損失函數(shù);利用第三目標特征圖對深度學習模型進行訓練,在損失函數(shù)滿足預設要求的情況下,得到目標裝備識別模型。
8、可選地,對圖像幀進行卷積操作并進行批量歸一化處理,得到第一目標特征圖之前,方法還包括:使用中值濾波或高斯濾波去除圖像幀中的噪聲;將圖像幀中的像素值歸一化到[0,1]范圍內,并將圖像幀的尺寸調整至模型輸入要求的目標尺寸;對圖像幀進行隨機裁剪,并對圖像幀進行隨機角度的旋轉。
9、根據(jù)本申請實施例的再一方面,還提供了一種目標裝備的識別方法,包括:獲取待識別圖像,其中,待識別圖像中包括:目標對象;利用目標裝備識別模型識別待識別圖像中的目標對象是否佩戴目標裝備,其中,目標裝備識別模型為通過上述模型訓練方法訓練得到的。
10、根據(jù)本申請實施例的再一方面,還提供了一種模型訓練裝置,包括:獲取模塊,用于獲取視頻流中的多個圖像幀,其中,每個圖像幀中包括:佩戴目標裝備的目標對象;第一處理模塊,用于對圖像幀進行卷積操作,并對卷積操作得到的特征進行批量歸一化處理,得到第一目標特征圖;第二處理模塊,用于利用不同尺度的卷積核對第一目標特征圖進行卷積操作,并將不同尺度的卷積核的輸出特征圖進行融合,得到卷積層輸出的n層的第二目標特征圖,其中,n為大于1的正整數(shù);融合模塊,用于對n層的第二目標特征圖中每層的第二目標特征圖進行多尺度特征融合,得到每層的第二目標特征圖對應的第一特征,對第一特征進行加權融合,得到第三目標特征圖;訓練模塊,用于利用第三目標特征圖對深度學習模型進行訓練,得到目標裝備識別模型,其中,目標裝備識別模型用于識別目標對象是否佩戴目標裝備。
11、根據(jù)本申請實施例的再一方面,還提供了一種非易失性存儲介質,存儲介質包括存儲的程序,其中,程序運行時控制存儲介質所在的設備執(zhí)行以上的模型訓練方法。
12、根據(jù)本申請實施例的再一方面,還提供了一種電子設備,包括:存儲器和處理器,處理器用于運行存儲在存儲器中的程序,其中,程序運行時執(zhí)行以上的模型訓練方法。
13、根據(jù)本申請實施例的再一方面,還提供了一種計算機程序,其中,所述計算機程序被處理器執(zhí)行時實現(xiàn)以上的模型訓練方法。
14、根據(jù)本申請實施例的再一方面,還提供了一種計算機程序產品,計算機程序產品包括非易失性計算機可讀存儲介質,其中,非易失性計算機可讀存儲介質存儲計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)以上的模型訓練方法。
15、在本申請實施例中,采用獲取視頻流中的多個圖像幀,其中,每個圖像幀中包括:佩戴目標裝備的目標對象;對圖像幀進行卷積操作,并對卷積操作得到的特征進行批量歸一化處理,得到第一目標特征圖;利用不同尺度的卷積核對第一目標特征圖進行卷積操作,并將不同尺度的卷積核的輸出特征圖進行融合,得到卷積層輸出的n層的第二目標特征圖,其中,n為大于1的正整數(shù);對n層的第二目標特征圖中每層的第二目標特征圖進行多尺度特征融合,得到每層的第二目標特征圖對應的第一特征,對第一特征進行加權融合,得到第三目標特征圖;利用第三目標特征圖對深度學習模型進行訓練,得到目標裝備識本文檔來自技高網...
【技術保護點】
1.一種模型訓練方法,其特征在于,包括:
2.根據(jù)權利要求1所述的方法,其特征在于,對所述圖像幀進行卷積操作,并對卷積操作得到的特征進行批量歸一化處理,得到第一目標特征圖,包括:
3.根據(jù)權利要求1所述的方法,其特征在于,對n層的第二目標特征圖中每層的第二目標特征圖進行多尺度特征融合,得到每層的第二目標特征圖對應的第一特征,包括:
4.根據(jù)權利要求1或3所述的方法,其特征在于,對所述第一特征進行加權融合,得到第三目標特征圖,包括:
5.根據(jù)權利要求4所述的方法,其特征在于,所述第一參數(shù)至少包括:信息熵;所述第二參數(shù)至少包括:互信息,其中,所述互信息用于表征深度學習模型所輸出的特征圖與預設任務標簽之間的相關性。
6.根據(jù)權利要求1所述的方法,其特征在于,利用所述第三目標特征圖對深度學習模型進行訓練,得到目標裝備識別模型,包括:
7.根據(jù)權利要求1所述的方法,其特征在于,對所述圖像幀進行卷積操作并進行批量歸一化處理,得到第一目標特征圖之前,所述方法還包括:
8.一種目標裝備的識別方法,其特征在于,包括
9.一種模型訓練裝置,其特征在于,包括:
10.一種非易失性存儲介質,其特征在于,所述非易失性存儲介質包括存儲的程序,其中,在所述程序運行時控制所述非易失性存儲介質所在設備執(zhí)行權利要求1至7中任意一項所述的模型訓練方法。
11.一種電子設備,其特征在于,包括:存儲器和處理器,所述處理器用于運行存儲在所述存儲器中的程序,其中,所述程序運行時執(zhí)行權利要求1至7中任意一項所述的模型訓練方法。
12.一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1至7中任意一項所述的模型訓練方法。
...【技術特征摘要】
1.一種模型訓練方法,其特征在于,包括:
2.根據(jù)權利要求1所述的方法,其特征在于,對所述圖像幀進行卷積操作,并對卷積操作得到的特征進行批量歸一化處理,得到第一目標特征圖,包括:
3.根據(jù)權利要求1所述的方法,其特征在于,對n層的第二目標特征圖中每層的第二目標特征圖進行多尺度特征融合,得到每層的第二目標特征圖對應的第一特征,包括:
4.根據(jù)權利要求1或3所述的方法,其特征在于,對所述第一特征進行加權融合,得到第三目標特征圖,包括:
5.根據(jù)權利要求4所述的方法,其特征在于,所述第一參數(shù)至少包括:信息熵;所述第二參數(shù)至少包括:互信息,其中,所述互信息用于表征深度學習模型所輸出的特征圖與預設任務標簽之間的相關性。
6.根據(jù)權利要求1所述的方法,其特征在于,利用所述第三目標特征圖對深度學習模型進行訓練,得到目標裝備識別模...
【專利技術屬性】
技術研發(fā)人員:俞浩,蔡特金,顧延鴿,季昕,陳華,
申請(專利權)人:中國電信股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。