System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及計算機視覺領域,具體涉及一種目標行為檢測模型構建方法、系統、設備和存儲介質。
技術介紹
1、目標檢測是計算機視覺中的經典問題之一,也是基于視覺的模式識別應用的一個重要研究方向。它需要對任意畫面進行搜索,對畫面中存在的目標進行有效的標注以及外接矩形框提取。由于需要對畫面中呈現出多樣性姿態的目標進行有效檢出,因此需要目標的特征表示具有極強的表達能力和判別力。而傳統的基于圖像局部統計特性表達的手工設計特征難以區分目標的多樣性、復雜性,其難以在一般性的目標檢測問題上達到較好的效果。
2、目前,基于深度學習的目標行為檢測廣泛采用yolov8算法,通過采集并標注目標行為圖像來構建數據集,并在監控視頻中識別目標行為。現有技術在yolov8模型的neck部分引入cbam注意力機制,以提高對目標信息的關注度,但該方法在模型結構改進和對小目標檢測方面存在不足。此外,現有流程主要關注單一目標的檢測,缺乏結合人體姿態信息的輔助判別,導致目標行為的識別準確率不高。
技術實現思路
1、本專利技術的主要目的是提供一種目標行為檢測模型構建方法、系統、設備和存儲介質,該目標行為檢測模型構建方法通過訓練數據集的構建與標注,利用主干網絡提取初步特征圖,結合多尺度注意力網絡與特征增強網絡深化特征的表達與整合,以及檢測網絡對目標行為的精準識別和權重確定,實現了一個高效、靈活且魯棒性強的檢測系統,適用于需要精確識別復雜場景中特定行為的多種應用場合。
2、為了實現上述目的,本申請實施例提供
3、根據本申請實施例的第一方面,提供了一種目標行為檢測模型構建方法,所述方法包括:
4、基于目標行為構建訓練數據集,所述訓練數據集包括標注行為類別的圖片;
5、將所述訓練數據集輸入主干網絡,得到初步特征圖;
6、根據所述初步特征圖利用多尺度注意力網絡和特征增強網絡,得到目標特征圖;
7、利用檢測網絡基于所述目標特征圖檢測出目標行為,并確定目標權重。
8、可選地,所述根據所述初步特征圖利用多尺度注意力網絡和特征增強網絡,得到目標特征圖,包括:
9、將所述初步特征圖輸入所述多尺度注意力網絡,得到全局特征圖和局部特征圖;
10、將所述全局特征圖和局部特征圖輸入所述特征增強網絡,得到增強特征圖;
11、將所述增強特征圖輸入所述多尺度注意力網絡,得到所述目標特征圖。
12、可選地,所述將所述初步特征圖輸入所述多尺度注意力網絡,得到全局特征信息,包括:
13、對所述初步特征圖進行序列化處理,得到序列數據;
14、基于四個長短期記憶網絡在四個不同的方向分別處理所述序列數據,得到所述四個方向上的全局上下文信息;
15、整合所述四個方向的全局上下文信息,得到每個像素的全局特征向量;
16、采用卷積算子計算每個像素的注意力權重向量;
17、基于所述每個像素的注意力權重向量構造二維矩陣;
18、基于所有像素的二維矩陣對所述初步特征圖進行加權平均處理,得到所述全局特征圖。
19、可選地,所述將所述初步特征圖輸入所述多尺度注意力網絡,得到局部特征信息,包括:
20、將所述初步特征圖的通道數轉換為局部維度的通道數;
21、基于激活函數計算每個像素的局部注意力權重向量;
22、基于所有像素的局部注意力權重向量對所述初步特征圖進行加權處理,得到布局特征圖。
23、可選地,所述將所述全局特征圖和局部特征圖輸入所述特征增強網絡,得到增強特征圖,包括:
24、將所述全局特征圖和局部特征圖輸入所述特征增強網絡,進行第一次上采樣;
25、將所述第一次上采樣后的所述全局特征圖和局部特征圖與所述主干網絡中對應層輸出的相同維度的特征圖進行拼接,得到拼接后的特征圖;
26、對所述拼接后的特征圖進行第二次上采樣,并將所述第二次上采樣得到的特征圖與所述主干網絡中另一層輸出的特征圖進行拼接,得到所述增強特征圖。
27、可選地,所述將所述增強特征圖輸入所述多尺度注意力網絡,得到所述目標特征圖,包括:
28、將所述增強特征圖輸入所述多尺度注意力網絡,利用所述多尺度注意力網絡中的局部注意力機制和全局注意力機制,得到融合特征圖;
29、將所述融合特征圖通過卷積層進行處理,并將所述卷積層輸出的特征與所述初步特征圖進行拼接,得到拼接后的特征;
30、對拼接后的特征進行特征轉換和特征增強處理,得到關鍵特征圖;
31、將所述關鍵特征圖輸入所述多尺度注意力網絡,重復以上步驟直到滿足設定條件停止,輸出所述目標特征圖。
32、可選地,所述將所述訓練數據集輸入主干網絡,得到初步特征圖,包括:
33、將所述訓練數據集輸入主干網絡,通過深度可分離卷積模塊進行深度可分離卷積操作,得到初始特征圖;
34、將所述初始特征圖通過特征轉換模塊進行特征轉換,得到轉換特征圖;
35、將所述轉換特征圖再次通過所述深度可分離卷積模塊和所述特征轉換模塊進行處理,得到池化特征圖;
36、將所述池化特征圖進行池化操作,得到所述初步特征圖。
37、根據本申請實施例的第二方面,提供了一種目標行為檢測模型構建系統,所述系統包括:
38、訓練集構建模塊,用于基于目標行為構建訓練數據集,所述訓練數據集包括標注行為類別的圖片;
39、主干網絡模塊,用于將所述訓練數據集輸入主干網絡,得到初步特征圖;
40、目標特征模塊,用于根據所述初步特征圖利用多尺度注意力網絡和特征增強網絡,得到目標特征圖;
41、訓練模塊,用于利用檢測網絡基于所述目標特征圖檢測出目標行為,并確定目標權重。
42、根據本申請實施例的第三方面,提供了一種電子設備,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器運行所述計算機程序時執行以實現上述第一方面所述的方法。
43、根據本申請實施例的第四方面,提供了一種計算機可讀存儲介質,其上存儲有計算機可讀指令,所述計算機可讀指令可被處理器執行以實現上述第一方面所述的方法。
44、綜上所述,本申請實施例提供了一種目標行為檢測模型構建方法、系統、設備和存儲介質,通過基于目標行為構建訓練數據集,所述訓練數據集包括標注行為類別的圖片;將所述訓練數據集輸入主干網絡,得到初步特征圖;根據所述初步特征圖利用多尺度注意力網絡和特征增強網絡,得到目標特征圖;利用檢測網絡基于所述目標特征圖檢測出目標行為,并確定目標權重該目標行為檢測模型構建方法通過訓練數據集的構建與標注,利用主干網絡提取初步特征圖,結合多尺度注意力網絡與特征增強網絡深化特征的表達與整合,以及檢測網絡對目標行為的精準識別和權重確定,實現了一個高效、靈活且魯棒本文檔來自技高網...
【技術保護點】
1.一種目標行為檢測模型構建方法,其特征在于,所述方法包括:
2.如權利要求1所述的方法,其特征在于,所述根據所述初步特征圖利用多尺度注意力網絡和特征增強網絡,得到目標特征圖,包括:
3.如權利要求2所述的方法,其特征在于,所述將所述初步特征圖輸入所述多尺度注意力網絡,得到全局特征信息,包括:
4.如權利要求2所述的方法,其特征在于,所述將所述初步特征圖輸入所述多尺度注意力網絡,得到局部特征信息,包括:
5.如權利要求2所述的方法,其特征在于,所述將所述全局特征圖和局部特征圖輸入所述特征增強網絡,得到增強特征圖,包括:
6.如權利要求2所述的方法,其特征在于,所述將所述增強特征圖輸入所述多尺度注意力網絡,得到所述目標特征圖,包括:
7.如權利要求1所述的方法,其特征在于,所述將所述訓練數據集輸入主干網絡,得到初步特征圖,包括:
8.一種目標行為檢測模型構建系統,其特征在于,所述系統包括:
9.一種電子設備,包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特
10.一種計算機可讀存儲介質,其特征在于,其上存儲有計算機可讀指令,所述計算機可讀指令可被處理器執行以實現如權利要求1-7任一項所述的方法。
...【技術特征摘要】
1.一種目標行為檢測模型構建方法,其特征在于,所述方法包括:
2.如權利要求1所述的方法,其特征在于,所述根據所述初步特征圖利用多尺度注意力網絡和特征增強網絡,得到目標特征圖,包括:
3.如權利要求2所述的方法,其特征在于,所述將所述初步特征圖輸入所述多尺度注意力網絡,得到全局特征信息,包括:
4.如權利要求2所述的方法,其特征在于,所述將所述初步特征圖輸入所述多尺度注意力網絡,得到局部特征信息,包括:
5.如權利要求2所述的方法,其特征在于,所述將所述全局特征圖和局部特征圖輸入所述特征增強網絡,得到增強特征圖,包括:
6.如權利要求2所述的方法,其...
【專利技術屬性】
技術研發人員:章政,謝艷玲,李明,
申請(專利權)人:北京大學南昌創新研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。