System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本公開涉及計算機視覺,尤其涉及一種行人重識別模型的訓練方法、裝置、電子設(shè)備及存儲介質(zhì)。
技術(shù)介紹
1、行人重識別是計算機視覺領(lǐng)域的一個重要分支,旨在識別不同攝像頭視角下的同一行人,這一技術(shù)廣泛應用于安全監(jiān)控、智能交通、人機交互等領(lǐng)域。當前行人重識別模型已經(jīng)趨于成熟,但是帶有遮擋的行人重識別依然具有很大挑戰(zhàn)。現(xiàn)有的方法是依靠大量數(shù)據(jù)或是數(shù)據(jù)增強的方法模擬遮擋,從而提升魯棒性。但是當前數(shù)據(jù)集遮擋圖片數(shù)量少,遮擋質(zhì)量不一,這可以導致模型在訓練過程中難以充分學習到遮擋情況下的特征表示。數(shù)據(jù)增強的方法依靠手工設(shè)計的增強塊,如旋轉(zhuǎn)、裁剪等,得到的增強塊雖然可以模擬一些遮擋情況,但可能無法完全覆蓋實際應用中的所有遮擋場景,此外,手工設(shè)計的增強塊可能過于簡單或過于復雜,導致無法從中學習到有效的特征表示,由于神經(jīng)網(wǎng)絡(luò)具有強大的學習能力,它可能會學習到數(shù)據(jù)增強方法中的模式,而不是學習到真正的遮擋特征,導致模型在面對新的遮擋情況時表現(xiàn)不佳,從而降低了模型的魯棒性。
技術(shù)實現(xiàn)思路
1、有鑒于此,本公開實施例提供了一種行人重識別模型的訓練方法、裝置、電子設(shè)備及存儲介質(zhì),以解決現(xiàn)有技術(shù)中行人重識別模型在處理帶有遮擋的行人圖像準確率較低的問題。
2、本公開實施例的第一方面,提供了一種行人重識別模型的訓練方法,包括:
3、獲取行人重識別訓練集,行人重識別訓練集包括多個訓練圖像;
4、將各個訓練圖像輸入學生模型的特征嵌入層,對各個訓練圖像進行特征提取,得到各個訓練圖像的多個子圖像
5、將各個訓練圖像的各個子圖像的第一初始局部特征向量輸入學生模型的特征增強層,對各個訓練圖像的各個子圖像的第一初始局部特征向量分別進行隨機強度遮擋,得到各個訓練圖像的各個子圖像的增強特征向量;
6、將各個訓練圖像的多個子圖像的增強特征向量、各個訓練圖像的第一初始類別特征向量輸入學生模型的特征預測網(wǎng)絡(luò),得到各個訓練圖像的第一特征向量和各個訓練圖像的各個子圖像的預測遮擋強度;
7、將各個訓練圖像輸入教師模型,對各個訓練圖像進行重識別的特征處理,得到各個訓練圖像的第二特征向量;
8、利用教師模型輸出的各個訓練圖像的第二特征向量監(jiān)督學生模型輸出的各個訓練圖像的第一特征向量,得到第一損失值,以及利用各個訓練圖像的各個子圖像的第一初始局部特征向量的隨機遮擋強度監(jiān)督各個訓練圖像的各個子圖像的預測遮擋強度,得到第二損失值,并根據(jù)第一損失值和第二損失值更新學生模型的參數(shù),根據(jù)學生模型更新教師模型的參數(shù),將訓練完成的教師模型確定為行人重識別模型。
9、本公開實施例的第二方面,提供了一種行人重識別模型的訓練裝置,包括:
10、獲取模塊,被配置為獲取行人重識別訓練集,行人重識別訓練集包括多個訓練圖像;
11、特征提取模塊,被配置為將各個訓練圖像輸入學生模型的特征嵌入層,對各個訓練圖像進行特征提取,得到各個訓練圖像的多個子圖像的第一初始局部特征向量和各個訓練圖像的第一初始類別特征向量;
12、特征增強模塊,被配置為將各個訓練圖像的各個子圖像的第一初始局部特征向量輸入學生模型的特征增強層,對各個訓練圖像的各個子圖像的第一初始局部特征向量分別進行隨機強度遮擋,得到各個訓練圖像的各個子圖像的增強特征向量;
13、特征預測模塊,被配置為將各個訓練圖像的多個子圖像的增強特征向量、各個訓練圖像的第一初始類別特征向量輸入學生模型的特征預測網(wǎng)絡(luò),得到各個訓練圖像的第一特征向量和各個訓練圖像的各個子圖像的預測遮擋強度;
14、教師模型特征處理模塊,被配置為將各個訓練圖像輸入教師模型,對各個訓練圖像進行重識別的特征處理,得到各個訓練圖像的第二特征向量;
15、更新模塊,被配置為利用教師模型輸出的各個訓練圖像的第二特征向量監(jiān)督學生模型輸出的各個訓練圖像的第一特征向量,得到第一損失值,以及利用各個訓練圖像的各個子圖像的第一初始局部特征向量的隨機遮擋強度監(jiān)督各個訓練圖像的各個子圖像的預測遮擋強度,得到第二損失值,并根據(jù)第一損失值和第二損失值更新學生模型的參數(shù),根據(jù)學生模型更新教師模型的參數(shù),將訓練完成的教師模型確定為行人重識別模型。
16、本公開實施例的第三方面,提供了一種電子設(shè)備,包括存儲器、處理器以及存儲在存儲器中并且可在處理器上運行的計算機程序,該處理器執(zhí)行計算機程序時實現(xiàn)上述方法的步驟。
17、本公開實施例的第四方面,提供了一種可讀存儲介質(zhì),該可讀存儲介質(zhì)存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)上述方法的步驟。
18、本公開實施例與現(xiàn)有技術(shù)相比存在的有益效果是:通過知識蒸餾的方式訓練教師模型和學生模型,將行人重識別訓練集輸入學生模型,對各個訓練圖像進行特征提取,初步提取圖像的特征信息,為后續(xù)的特征增強和預測提供基礎(chǔ),得到各個訓練圖像的多個子圖像的第一初始局部特征向量和各個訓練圖像的第一初始類別特征向量。將各個訓練圖像的各個子圖像的第一初始局部特征向量輸入特征增強層,進行隨機強度遮擋,模擬遮擋情況,增強模型對遮擋的魯棒性,得到各個訓練圖像的各個子圖像的增強特征向量。將各個訓練圖像的各個子圖像的增強特征向量、各個訓練圖像的第一初始類別特征向量輸入學生模型的特征預測網(wǎng)絡(luò),通過預測遮擋強度,可以學習到如何在遮擋情況下提取有用的特征,并整合局部和全局信息,得到各個訓練圖像的第一特征向量和各個訓練圖像的各個子圖像的預測遮擋強度。將訓練圖像輸入教師模型,得到各個訓練圖像的第二特征向量,通過教師模型提供穩(wěn)定的指導信號,幫助學生模型學習更魯棒的特征表示。利用教師模型輸出的第二特征向量監(jiān)督學生模型輸出的第一特征向量,得到第一損失值,利用預測遮擋強度監(jiān)督實際遮擋強度,得到第二損失值,并根據(jù)第一損失值和第二損失值更新學生模型的參數(shù),根據(jù)學生模型更新教師模型的參數(shù),通過教師-學生模型的知識蒸餾,提高模型的性能和魯棒性,將訓練完成的教師模型確定為最終的行人重識別模型。本公開提出的方法通過隨機強度遮擋和特征預測網(wǎng)絡(luò),可以學習到更加復雜和多樣的遮擋情況,提高模型的魯棒性,同時教師-學生模型的知識蒸餾過程有助于學習到更加泛化和魯棒的特征表示,解決現(xiàn)有技術(shù)中行人重識別模型在處理帶有遮擋的行人圖像準確率較低的問題,提高了行人重識別模型在遮擋情況下的表現(xiàn),增強行人重識別模型的魯棒性和泛化能力。
本文檔來自技高網(wǎng)...【技術(shù)保護點】
1.一種行人重識別模型的訓練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對各個所述訓練圖像進行特征提取,得到各個訓練圖像的多個子圖像的第一初始局部特征向量和各個訓練圖像的第一初始類別特征向量,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對各個所述訓練圖像的各個子圖像的第一初始局部特征向量分別進行隨機強度遮擋,得到各個訓練圖像的各個子圖像的增強特征向量,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將各個所述訓練圖像的多個子圖像的增強特征向量、各個所述訓練圖像的第一初始類別特征向量輸入學生模型的特征預測網(wǎng)絡(luò),得到各個訓練圖像的第一特征向量和各個訓練圖像的各個子圖像的預測遮擋強度,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述第一損失值和所述第二損失值更新所述學生模型的參數(shù),根據(jù)所述學生模型更新教師模型的參數(shù),包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對各個所述訓練圖像進行重識別的特征處理,得到各個訓練圖像的第二特征向量,包括:
7.根據(jù)權(quán)
8.一種行人重識別模型的訓練裝置,其特征在于,包括:
9.一種電子設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并且可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權(quán)利要求1至7中任一項所述方法的步驟。
10.一種可讀存儲介質(zhì),所述可讀存儲介質(zhì)存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7中任一項所述方法的步驟。
...【技術(shù)特征摘要】
1.一種行人重識別模型的訓練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對各個所述訓練圖像進行特征提取,得到各個訓練圖像的多個子圖像的第一初始局部特征向量和各個訓練圖像的第一初始類別特征向量,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對各個所述訓練圖像的各個子圖像的第一初始局部特征向量分別進行隨機強度遮擋,得到各個訓練圖像的各個子圖像的增強特征向量,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將各個所述訓練圖像的多個子圖像的增強特征向量、各個所述訓練圖像的第一初始類別特征向量輸入學生模型的特征預測網(wǎng)絡(luò),得到各個訓練圖像的第一特征向量和各個訓練圖像的各個子圖像的預測遮擋強度,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述第一損失值和所...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:周靖宇,
申請(專利權(quán))人:北京龍智數(shù)科科技服務有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。