本申請公開了一種模型訓(xùn)練方法、裝置及目標(biāo)配件的識別方法。其中,該方法包括:獲取歷史圖像;調(diào)整歷史圖像中采樣點的位置和權(quán)重,并根據(jù)調(diào)整結(jié)果對歷史圖像進(jìn)行特征提取,得到第一目標(biāo)特征圖;對第一目標(biāo)特征圖進(jìn)行多通道特征融合,得到不同層次的第二目標(biāo)特征圖;利用區(qū)域注意力機(jī)制對不同層次的第二目標(biāo)特征圖進(jìn)行特征融合處理,得到第三目標(biāo)特征圖;利用第三目標(biāo)特征圖對深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到目標(biāo)配件識別模型,其中,目標(biāo)配件識別模型用于識別目標(biāo)對象是否佩戴目標(biāo)配件。本申請解決了相關(guān)目標(biāo)配件識別模型的識別精度較低的技術(shù)問題。
【技術(shù)實現(xiàn)步驟摘要】
本申請涉及計算機(jī)視覺應(yīng)用,具體而言,涉及一種模型訓(xùn)練方法、裝置及目標(biāo)配件的識別方法。
技術(shù)介紹
1、在現(xiàn)代工業(yè)和餐飲環(huán)境中,工廠安全帽和廚房廚師帽的佩戴情況對人員的安全和衛(wèi)生至關(guān)重要。然而,相關(guān)監(jiān)控方式通常依賴于人工監(jiān)督,容易出現(xiàn)疏漏,且效率低下。隨著計算機(jī)視覺和深度學(xué)習(xí)技術(shù)的發(fā)展,自動化的佩戴檢測方案逐漸成為一種可行的替代方案。
2、現(xiàn)有方案通常采用深度學(xué)習(xí)的目標(biāo)檢測算法來實現(xiàn)對工廠安全帽和廚房廚師帽的佩戴檢測。常見的算法包括yolo系列(you?only?look?once)、ssd(single?shotmultibox?detector)和faster?r-cnn(faster?region?convolutional?neural?network)等。這些算法通常基于卷積神經(jīng)網(wǎng)絡(luò)(cnn)作為特征提取主干網(wǎng)絡(luò),通過訓(xùn)練好的模型對輸入圖像進(jìn)行目標(biāo)檢測,從而識別是否正確佩戴安全帽或廚師帽。
3、在這些現(xiàn)有技術(shù)方案中,會使用已標(biāo)注的數(shù)據(jù)集進(jìn)行訓(xùn)練,以使模型能夠識別佩戴情況。訓(xùn)練過程中,模型需要大量的標(biāo)注數(shù)據(jù)和計算資源,以提高其檢測精度和魯棒性。訓(xùn)練完成后,模型可以在實時視頻流或靜態(tài)圖像中檢測佩戴情況,并輸出檢測結(jié)果。盡管這些技術(shù)在一定程度上能夠?qū)崿F(xiàn)自動化檢測,但在實際應(yīng)用中仍然面臨以下技術(shù)問題:由于工廠和廚房的環(huán)境復(fù)雜,背景干擾嚴(yán)重,相關(guān)技術(shù)方案在檢測時可能存在誤檢測或漏檢測的情況。
4、針對上述的問題,目前尚未提出有效的解決方案。
技術(shù)實現(xiàn)思路
1、本申請實施例提供了一種模型訓(xùn)練方法、裝置及目標(biāo)配件的識別方法,以至少解決相關(guān)目標(biāo)配件識別模型的識別精度較低的技術(shù)問題。
2、根據(jù)本申請實施例的一個方面,提供了一種模型訓(xùn)練方法,包括:獲取歷史圖像,其中,歷史圖像中包括:佩戴目標(biāo)配件的目標(biāo)對象;調(diào)整歷史圖像中采樣點的位置和權(quán)重,并根據(jù)調(diào)整結(jié)果對歷史圖像進(jìn)行特征提取,得到第一目標(biāo)特征圖;對第一目標(biāo)特征圖進(jìn)行多通道特征融合,得到不同層次的第二目標(biāo)特征圖;利用區(qū)域注意力機(jī)制對不同層次的第二目標(biāo)特征圖進(jìn)行特征融合處理,得到第三目標(biāo)特征圖;利用第三目標(biāo)特征圖對深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到目標(biāo)配件識別模型,其中,目標(biāo)配件識別模型用于識別目標(biāo)對象是否佩戴目標(biāo)配件。
3、可選地,調(diào)整歷史圖像中采樣點的位置和權(quán)重,并根據(jù)調(diào)整結(jié)果對歷史圖像進(jìn)行特征提取,得到第一目標(biāo)特征圖,包括:根據(jù)歷史圖像的局部特征自適應(yīng)調(diào)整采樣點的位置;根據(jù)自適應(yīng)權(quán)重函數(shù),為不同位置的采樣點賦予不同的權(quán)重:根據(jù)調(diào)整的采樣點的位置以及不同位置的采樣點對應(yīng)的權(quán)重,對歷史圖像進(jìn)行特征提取,得到第一目標(biāo)特征圖。
4、可選地,根據(jù)歷史圖像的局部特征自適應(yīng)調(diào)整采樣點的位置,包括:將采樣點在目標(biāo)位置的局部特征信息輸入神經(jīng)網(wǎng)絡(luò),得到神經(jīng)網(wǎng)絡(luò)輸出的采樣點在目標(biāo)位置上的水平方向偏移量以及垂直方向偏移量;根據(jù)采樣點在目標(biāo)位置上的水平方向偏移量以及垂直方向偏移量,調(diào)整采樣點的位置。
5、可選地,對第一目標(biāo)特征圖進(jìn)行多通道特征融合,得到不同層次的第二目標(biāo)特征圖,包括:對第一目標(biāo)特征圖進(jìn)行降維處理,得到第一特征圖,其中,第一目標(biāo)特征圖中包括多個通道;對第一特征圖進(jìn)行加權(quán)融合,得到第二特征圖;對第二特征圖進(jìn)行非線性激活和正則化處理,得到第三特征圖;利用1×1的卷積核或深度可分離卷積核對第三特征圖進(jìn)行特征處理,得到第二目標(biāo)特征圖。
6、可選地,利用區(qū)域注意力機(jī)制對不同層次的第二目標(biāo)特征圖進(jìn)行特征融合處理,得到第三目標(biāo)特征圖,包括:根據(jù)第i層的第二目標(biāo)特征圖中的每個區(qū)域的重要性系數(shù),計算第i層的第二目標(biāo)特征圖中的每個區(qū)域的注意力權(quán)重,其中,i為不大于n的正整數(shù),n為第二目標(biāo)特征圖的層次數(shù)量;根據(jù)第i層的第二目標(biāo)特征圖中的每個區(qū)域的注意力權(quán)重,對第i層的第二目標(biāo)特征圖中的每個區(qū)域進(jìn)行加權(quán)求和,得到第i層的第四特征圖;對每層的第四特征圖進(jìn)行融合處理,得到第三目標(biāo)特征圖。
7、可選地,對每層的第四特征圖進(jìn)行融合處理,得到第三目標(biāo)特征圖之后,方法還包括:對第j層的第二目標(biāo)特征圖進(jìn)行邊緣檢測和邊界增強處理,得到第j層的第五特征圖,其中,j為不大于n的正整數(shù);對每層的第五特征圖進(jìn)行加權(quán)融合處理。
8、可選地,利用區(qū)域注意力機(jī)制對不同層次的第二目標(biāo)特征圖進(jìn)行特征融合處理,得到第三目標(biāo)特征圖之后,方法還包括:將第k層的第三目標(biāo)特征圖與第k-1層的第三目標(biāo)特征圖進(jìn)行融合,得到第一聚合結(jié)果,其中,u為不大于m的正整數(shù),m為第三目標(biāo)特征圖的層次數(shù)量;對第一聚合結(jié)果中每個通道的特征進(jìn)行獨立卷積操作,并通過1×1的卷積核對不同通道的特征進(jìn)行融合。
9、根據(jù)本申請實施例的再一方面,還提供了一種目標(biāo)配件的識別方法,包括:獲取待識別圖像,其中,待識別圖像中包括:目標(biāo)對象;利用目標(biāo)配件識別模型識別待識別圖像中的目標(biāo)對象是否佩戴目標(biāo)配件,其中,目標(biāo)配件識別模型為通過上述模型訓(xùn)練方法訓(xùn)練得到的。
10、根據(jù)本申請實施例的再一方面,還提供了一種模型訓(xùn)練裝置,包括:獲取模塊,用于獲取歷史圖像,其中,歷史圖像中包括:佩戴目標(biāo)配件的目標(biāo)對象;調(diào)整模塊,用于調(diào)整歷史圖像中采樣點的位置和權(quán)重,并根據(jù)調(diào)整結(jié)果對歷史圖像進(jìn)行特征提取,得到第一目標(biāo)特征圖;第一融合模塊,用于對第一目標(biāo)特征圖進(jìn)行多通道特征融合,得到不同層次的第二目標(biāo)特征圖;第二融合模塊,用于利用區(qū)域注意力機(jī)制對不同層次的第二目標(biāo)特征圖進(jìn)行特征融合處理,得到第三目標(biāo)特征圖;訓(xùn)練模塊,用于利用第三目標(biāo)特征圖對深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到目標(biāo)配件識別模型,其中,目標(biāo)配件識別模型用于識別目標(biāo)對象是否佩戴目標(biāo)配件。
11、根據(jù)本申請實施例的再一方面,還提供了一種非易失性存儲介質(zhì),存儲介質(zhì)包括存儲的程序,其中,程序運行時控制存儲介質(zhì)所在的設(shè)備執(zhí)行以上的模型訓(xùn)練方法。
12、根據(jù)本申請實施例的再一方面,還提供了一種電子設(shè)備,包括:存儲器和處理器,處理器用于運行存儲在存儲器中的程序,其中,程序運行時執(zhí)行以上的模型訓(xùn)練方法。
13、根據(jù)本申請實施例的再一方面,還提供了一種計算機(jī)程序,其中,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)以上的模型訓(xùn)練方法。
14、根據(jù)本申請實施例的再一方面,還提供了一種計算機(jī)程序產(chǎn)品,計算機(jī)程序產(chǎn)品包括非易失性計算機(jī)可讀存儲介質(zhì),其中,非易失性計算機(jī)可讀存儲介質(zhì)存儲計算機(jī)程序,計算機(jī)程序被處理器執(zhí)行時實現(xiàn)以上的模型訓(xùn)練方法。
15、在本申請實施例中,采用獲取歷史圖像,其中,歷史圖像中包括:佩戴目標(biāo)配件的目標(biāo)對象;調(diào)整歷史圖像中采樣點的位置和權(quán)重,并根據(jù)調(diào)整結(jié)果對歷史圖像進(jìn)行特征提取,得到第一目標(biāo)特征圖;對第一目標(biāo)特征圖進(jìn)行多通道特征融合,得到不同層次的第二目標(biāo)特征圖;利用區(qū)域注意力機(jī)制對不同層次的第二目標(biāo)特征圖進(jìn)行特征融合處理,得到第三目標(biāo)特征圖;利用第三目標(biāo)特征圖對深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到目標(biāo)配件識別模型,其中,目標(biāo)配件識別模型用于識別目標(biāo)對象是否佩戴目標(biāo)配件的方式,達(dá)到了將不同尺度本文檔來自技高網(wǎng)
...
【技術(shù)保護(hù)點】
1.一種模型訓(xùn)練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,調(diào)整所述歷史圖像中采樣點的位置和權(quán)重,并根據(jù)調(diào)整結(jié)果對所述歷史圖像進(jìn)行特征提取,得到第一目標(biāo)特征圖,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)歷史圖像的局部特征自適應(yīng)調(diào)整采樣點的位置,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對所述第一目標(biāo)特征圖進(jìn)行多通道特征融合,得到不同層次的第二目標(biāo)特征圖,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用區(qū)域注意力機(jī)制對不同層次的所述第二目標(biāo)特征圖進(jìn)行特征融合處理,得到第三目標(biāo)特征圖,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,對每層的所述第四特征圖進(jìn)行融合處理,得到第三目標(biāo)特征圖之后,所述方法還包括:對第j層的所述第二目標(biāo)特征圖進(jìn)行邊緣檢測和邊界增強處理,得到第j層的第五特征圖,其中,j為不大于n的正整數(shù);對每層的所述第五特征圖進(jìn)行加權(quán)融合處理。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用區(qū)域注意力機(jī)制對不同層次的所述第二目標(biāo)特征圖進(jìn)行特征融合處理,得到第三目標(biāo)特征圖之后,所述方法還包括:
8.一種目標(biāo)配件的識別方法,其特征在于,包括:
9.一種模型訓(xùn)練裝置,其特征在于,包括:
10.一種非易失性存儲介質(zhì),其特征在于,所述非易失性存儲介質(zhì)包括存儲的程序,其中,在所述程序運行時控制所述非易失性存儲介質(zhì)所在設(shè)備執(zhí)行權(quán)利要求1至7中任意一項所述的模型訓(xùn)練方法。
11.一種電子設(shè)備,其特征在于,包括:存儲器和處理器,所述處理器用于運行存儲在所述存儲器中的程序,其中,所述程序運行時執(zhí)行權(quán)利要求1至7中任意一項所述的模型訓(xùn)練方法。
12.一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至7中任意一項所述的模型訓(xùn)練方法。
...
【技術(shù)特征摘要】
1.一種模型訓(xùn)練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,調(diào)整所述歷史圖像中采樣點的位置和權(quán)重,并根據(jù)調(diào)整結(jié)果對所述歷史圖像進(jìn)行特征提取,得到第一目標(biāo)特征圖,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)歷史圖像的局部特征自適應(yīng)調(diào)整采樣點的位置,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對所述第一目標(biāo)特征圖進(jìn)行多通道特征融合,得到不同層次的第二目標(biāo)特征圖,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,利用區(qū)域注意力機(jī)制對不同層次的所述第二目標(biāo)特征圖進(jìn)行特征融合處理,得到第三目標(biāo)特征圖,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,對每層的所述第四特征圖進(jìn)行融合處理,得到第三目標(biāo)特征圖之后,所述方法還包括:對第j層的所述第二目標(biāo)特征圖進(jìn)行邊緣檢測和邊界增強處理,得到第j層的第五特征圖,其中,j為不大于n的正整數(shù);對...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:武永強,周偉鵬,左宇濤,俞浩,段永浩,
申請(專利權(quán))人:中國電信股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。