System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 国产精品va在线观看无码,国产免费AV片无码永久免费,亚洲AV无码一区二区三区鸳鸯影院
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法及系統(tǒng)技術(shù)方案

    技術(shù)編號:44047736 閱讀:8 留言:0更新日期:2025-01-15 01:27
    本發(fā)明專利技術(shù)屬于圖像識別領(lǐng)域,提出了一種基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法及系統(tǒng),通過設(shè)計一種多模態(tài)群體行為識別網(wǎng)絡(luò),包括圖像分支子網(wǎng)絡(luò)、文本分支子網(wǎng)絡(luò)和關(guān)鍵點分支子網(wǎng)絡(luò),分別進行多模態(tài)特征處理,以避免通過單一模態(tài)信息進行識別時,由于群體間的交互行為和復(fù)雜的交互環(huán)境的因素,造成識別精度較低的問題,進一步符合實際檢修情況,提高了整體識別的精度,又通過輕量化設(shè)計,提高了識別的效率,再進行群體之間和群體與交互目標之間的關(guān)系和交互增強,進一步的提高了識別的精度,避免了因為遮擋重疊造成的識別障礙,本發(fā)明專利技術(shù)提高了群體目標交互行為的識別準確性和效率。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)屬于圖像識別領(lǐng)域,特別涉及一種基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法及系統(tǒng)


    技術(shù)介紹

    1、隨著鐵路產(chǎn)業(yè)的快速發(fā)展,鐵路檢修的需求度和重要性也逐漸提高,因為鐵路檢修過程中進行檢修作業(yè)的工作人員眾多,且需要相互配合完成復(fù)雜的檢修流程,所以對于檢修工作和檢修作業(yè)的工作人員的監(jiān)督監(jiān)測就尤為重要,其中,特別是對于檢修過程中的安全性監(jiān)測,是鐵路檢修過程中的重要一環(huán)。

    2、現(xiàn)有技術(shù)中,對鐵路檢修過程進行監(jiān)測往往是采用人工巡查和視頻監(jiān)控結(jié)合的方法,但是人工巡查和監(jiān)控的成本過大,且效率不高,無法全面監(jiān)控,所以計算機視覺技術(shù)成為了重要的監(jiān)測識別手段,但是現(xiàn)有的計算機視覺技術(shù)受限于硬件設(shè)備條件和復(fù)雜檢修環(huán)境的多種因素,無法滿足鐵路檢修過程的監(jiān)測要求,特別是檢修過程中工作人員眾多且工作人員之間會進行復(fù)雜的交互配合,導(dǎo)致工作人員與交互的工作人員之間及工作人員與檢修交互對象之間出現(xiàn)重疊、遮擋,大大增加了監(jiān)測識別的難度,極大地影響了識別的準確性。

    3、因此,如何設(shè)計一種識別方法,避免復(fù)雜環(huán)境下,眾多檢修工作人員交互行為的影響,成為了亟待解決的問題。


    技術(shù)實現(xiàn)思路

    1、基于此,本專利技術(shù)提出的一種基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法及系統(tǒng),通過設(shè)計一種多模態(tài)群體行為識別網(wǎng)絡(luò),包括圖像分支子網(wǎng)絡(luò)、文本分支子網(wǎng)絡(luò)和關(guān)鍵點分支子網(wǎng)絡(luò),分別進行多模態(tài)特征處理,以避免通過單一模態(tài)信息進行識別時,由于群體間的交互行為和復(fù)雜的交互環(huán)境的因素,造成識別精度較低的問題,進一步符合實際檢修情況,提高了整體識別的精度,又通過輕量化設(shè)計,提高了識別的效率,再進行群體之間和群體與交互目標之間的關(guān)系和交互增強,進一步的提高了識別的精度,避免了因為遮擋重疊造成的識別障礙,本專利技術(shù)提高了群體目標交互行為的識別準確性和效率。

    2、本專利技術(shù)提出的一種基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,包括:

    3、實時采集目標視頻圖像并進行預(yù)處理,將預(yù)處理后的所述目標視頻圖像輸入多模態(tài)群體行為識別網(wǎng)絡(luò),所述多模態(tài)群體行為識別網(wǎng)絡(luò)包括圖像分支子網(wǎng)絡(luò)、文本分支子網(wǎng)絡(luò)和關(guān)鍵點分支子網(wǎng)絡(luò),所述圖像分支子網(wǎng)絡(luò)、文本分支子網(wǎng)絡(luò)和關(guān)鍵點分支子網(wǎng)絡(luò)之間的網(wǎng)絡(luò)結(jié)構(gòu)為相互并行結(jié)構(gòu);

    4、所述圖像分支子網(wǎng)絡(luò)根據(jù)輕量化圖像特征處理模塊對所述目標視頻圖像進行特征提取,獲取基礎(chǔ)目標群體圖像特征,再根據(jù)時空雙流交互的群體關(guān)系增強模塊進行特征關(guān)系增強,以獲取關(guān)系增強圖像特征;

    5、所述文本分支子網(wǎng)絡(luò)根據(jù)預(yù)設(shè)動作標簽獲取動作文本特征,再根據(jù)輕量化注意力增強模塊對所述基礎(chǔ)目標群體圖像特征進行注意力增強操作,以獲取注意力增強圖像特征,根據(jù)知識蒸餾算法對所述動作文本特征和所述注意力增強圖像特征進行信息交互處理,以獲取交互文本特征,再根據(jù)群體關(guān)系調(diào)參模塊對所述交互文本特征進行特征關(guān)系增強和調(diào)參操作,以獲取關(guān)系增強文本特征,所述群體關(guān)系調(diào)參模塊包括關(guān)系增強子模塊和調(diào)參子模塊,所述關(guān)系增強子模塊與所述群體關(guān)系增強模塊的參數(shù)共享;

    6、所述關(guān)鍵點分支子網(wǎng)絡(luò)對所述目標視頻圖像進行關(guān)鍵點特征提取,以獲取關(guān)鍵點特征,再根據(jù)交互模塊對所述關(guān)鍵點特征進行交互增強,以獲取交互增強關(guān)鍵點特征;

    7、根據(jù)所述關(guān)系增強圖像特征、所述關(guān)系增強文本特征和所述交互增強關(guān)鍵點特征,進行群體行為識別,以獲取最終分類結(jié)果。

    8、綜上,根據(jù)上述基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,通過設(shè)計一種多模態(tài)群體行為識別網(wǎng)絡(luò),包括圖像分支子網(wǎng)絡(luò)、文本分支子網(wǎng)絡(luò)和關(guān)鍵點分支子網(wǎng)絡(luò),分別進行多模態(tài)特征處理,以避免通過單一模態(tài)信息進行識別時,由于群體間的交互行為和復(fù)雜的交互環(huán)境的因素,造成識別精度較低的問題,進一步符合實際檢修情況,提高了整體識別的精度,又通過輕量化設(shè)計,提高了識別的效率,再進行群體之間和群體與交互目標之間的關(guān)系和交互增強,進一步的提高了識別的精度,避免了因為遮擋重疊造成的識別障礙,本專利技術(shù)提高了群體目標交互行為的識別準確性和效率。具體為實時采集目標視頻圖像并進行預(yù)處理,將預(yù)處理后的所述目標視頻圖像輸入多模態(tài)群體行為識別網(wǎng)絡(luò),所述多模態(tài)群體行為識別網(wǎng)絡(luò)包括圖像分支子網(wǎng)絡(luò)、文本分支子網(wǎng)絡(luò)和關(guān)鍵點分支子網(wǎng)絡(luò),所述圖像分支子網(wǎng)絡(luò)、文本分支子網(wǎng)絡(luò)和關(guān)鍵點分支子網(wǎng)絡(luò)之間的網(wǎng)絡(luò)結(jié)構(gòu)為相互并行結(jié)構(gòu),結(jié)合了多模態(tài)信息,豐富了識別的特征,進一步的提高了識別的準確性,所述圖像分支子網(wǎng)絡(luò)根據(jù)輕量化圖像特征處理模塊對所述目標視頻圖像進行特征提取,獲取基礎(chǔ)目標群體圖像特征,再根據(jù)時空雙流交互的群體關(guān)系增強模塊進行特征關(guān)系增強,以獲取關(guān)系增強圖像特征,輕量化設(shè)計加快了處理速度,提高了整體識別效率,所述文本分支子網(wǎng)絡(luò)根據(jù)預(yù)設(shè)動作標簽獲取動作文本特征,再根據(jù)輕量化注意力增強模塊對所述基礎(chǔ)目標群體圖像特征進行注意力增強操作,以獲取注意力增強圖像特征,根據(jù)知識蒸餾算法對所述動作文本特征和所述注意力增強圖像特征進行信息交互處理,以獲取交互文本特征,再根據(jù)群體關(guān)系調(diào)參模塊對所述交互文本特征進行特征關(guān)系增強和調(diào)參操作,以獲取關(guān)系增強文本特征,所述群體關(guān)系調(diào)參模塊包括關(guān)系增強子模塊和調(diào)參子模塊,所述關(guān)系增強子模塊與所述群體關(guān)系增強模塊的參數(shù)共享,根據(jù)文本和圖像特征之間的信息交互傳遞,避免了重復(fù)處理,提高了處理速度,提高了識別效率,同時增強了群體目標之間的關(guān)系信息,避免了因目標群體之間的復(fù)雜關(guān)系造成的識別障礙,提高了識別的準確性,所述關(guān)鍵點分支子網(wǎng)絡(luò)對所述目標視頻圖像進行關(guān)鍵點特征提取,以獲取關(guān)鍵點特征,再根據(jù)交互模塊對所述關(guān)鍵點特征進行交互增強,以獲取交互增強關(guān)鍵點特征,增強了目標群體與交互對象之間的關(guān)系,進一步提高了識別的準確性,根據(jù)所述關(guān)系增強圖像特征、所述關(guān)系增強文本特征和所述交互增強關(guān)鍵點特征,進行群體行為識別,以獲取最終分類結(jié)果,本專利技術(shù)提高了群體目標交互行為的識別準確性和效率。

    9、進一步的,所述圖像分支子網(wǎng)絡(luò)根據(jù)輕量化圖像特征處理模塊對所述目標視頻圖像進行特征提取,獲取基礎(chǔ)目標群體圖像特征的步驟,具體包括:

    10、圖像分支子網(wǎng)絡(luò)包括輕量化圖像特征處理模塊,所述輕量化圖像特征處理模塊包括輕量化網(wǎng)絡(luò)層和邊界框特征對齊塊;

    11、所述輕量化網(wǎng)絡(luò)層中包括深度可分離卷積塊、倒殘差塊和擠壓激勵塊,以進行基礎(chǔ)特征提取,并根據(jù)空間縮放算法進行特征圖邊界框坐標調(diào)整,所述特征圖邊界框坐標調(diào)整的算法關(guān)系具體如下:

    12、,

    13、,

    14、所述邊界框特征對齊塊對調(diào)整后的邊界框坐標和提取的基礎(chǔ)特征進行對齊操作,以獲取基礎(chǔ)目標群體圖像特征。

    15、進一步的,所述再根據(jù)時空雙流交互的群體關(guān)系增強模塊進行特征關(guān)系增強,以獲取關(guān)系增強圖像特征的步驟,具體包括:

    16、圖像分支子網(wǎng)絡(luò)包括群體關(guān)系增強模塊,所述群體關(guān)系增強模塊包括空間-時間分支路徑和時間-空間分支路徑;

    17、所述空間-時間分支路徑中包括空間注意力殘差子模塊,所述空間注意力殘差子模塊包括空間注意力塊、多層感知塊和殘差分路;

    本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.一種基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述圖像分支子網(wǎng)絡(luò)根據(jù)輕量化圖像特征處理模塊對所述目標視頻圖像進行特征提取,獲取基礎(chǔ)目標群體圖像特征的步驟,具體包括:

    3.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述再根據(jù)時空雙流交互的群體關(guān)系增強模塊進行特征關(guān)系增強,以獲取關(guān)系增強圖像特征的步驟,具體包括:

    4.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述文本分支子網(wǎng)絡(luò)根據(jù)預(yù)設(shè)動作標簽獲取動作文本特征,再根據(jù)輕量化注意力增強模塊對所述基礎(chǔ)目標群體圖像特征進行注意力增強操作,以獲取注意力增強圖像特征的步驟,具體包括:

    5.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述根據(jù)知識蒸餾算法對所述動作文本特征和所述注意力增強圖像特征進行信息交互處理,以獲取交互文本特征,再根據(jù)群體關(guān)系調(diào)參模塊對所述交互文本特征進行特征關(guān)系增強和調(diào)參操作,以獲取關(guān)系增強文本特征的步驟,具體包括:

    6.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述關(guān)鍵點分支子網(wǎng)絡(luò)對所述目標視頻圖像進行關(guān)鍵點特征提取,以獲取關(guān)鍵點特征的步驟,具體包括:

    7.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述再根據(jù)交互模塊對所述關(guān)鍵點特征進行交互增強,以獲取交互增強關(guān)鍵點特征的步驟,具體包括:

    8.一種基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,包括:

    9.一種存儲介質(zhì),其特征在于,所述存儲介質(zhì)存儲一個或多個程序,該程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-7任一項所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法。

    10.一種計算機設(shè)備,其特征在于,所述計算機設(shè)備包括存儲器和處理器,其中:

    ...

    【技術(shù)特征摘要】

    1.一種基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述圖像分支子網(wǎng)絡(luò)根據(jù)輕量化圖像特征處理模塊對所述目標視頻圖像進行特征提取,獲取基礎(chǔ)目標群體圖像特征的步驟,具體包括:

    3.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述再根據(jù)時空雙流交互的群體關(guān)系增強模塊進行特征關(guān)系增強,以獲取關(guān)系增強圖像特征的步驟,具體包括:

    4.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述文本分支子網(wǎng)絡(luò)根據(jù)預(yù)設(shè)動作標簽獲取動作文本特征,再根據(jù)輕量化注意力增強模塊對所述基礎(chǔ)目標群體圖像特征進行注意力增強操作,以獲取注意力增強圖像特征的步驟,具體包括:

    5.根據(jù)權(quán)利要求1所述的基于多模態(tài)群體行為識別技術(shù)的交互行為識別方法,其特征在于,所述根據(jù)知識蒸餾算法對所述動作文本特征和所述注...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:涂宏斌許坤林羅會源彭圓圓陶丹李啟翔馬偉龍劉暢羅家駿高爾涵何城
    申請(專利權(quán))人:華東交通大學(xué)
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲V无码一区二区三区四区观看| 人妻无码一区二区三区四区| aⅴ一区二区三区无卡无码| 亚洲欧洲无码一区二区三区| 亚洲日韩AV无码一区二区三区人| 最新亚洲春色Av无码专区| 无码任你躁久久久久久| 亚洲人成国产精品无码| 亚洲AV人无码激艳猛片| 亚洲AV无码专区国产乱码电影| 国产亚洲AV无码AV男人的天堂| 无码aⅴ精品一区二区三区浪潮| 亚洲日韩精品无码专区加勒比☆| 久久久精品人妻无码专区不卡| 亚洲综合av永久无码精品一区二区| 亚洲AV无码之国产精品| 无码精品人妻一区二区三区免费看| 久久久久亚洲av无码专区蜜芽| 少妇人妻偷人精品无码AV| MM1313亚洲精品无码久久| 亚洲AV无码国产丝袜在线观看| 无码专区人妻系列日韩精品少妇| 久久AV高潮AV无码AV| 毛片无码一区二区三区a片视频| 精品欧洲av无码一区二区三区| 亚洲欧洲无码AV不卡在线| 精品无码人妻夜人多侵犯18| 精品久久久久久无码国产| 一本无码人妻在中文字幕免费| 一本天堂ⅴ无码亚洲道久久| 国产午夜激无码av毛片| 精品亚洲AV无码一区二区三区| 亚洲Av无码乱码在线znlu| 亚洲中文字幕久久精品无码A| 久久亚洲精品无码| 日韩欧精品无码视频无删节| 特黄熟妇丰满人妻无码| 久久久久久精品无码人妻| 亚洲日韩国产二区无码| 人妻少妇无码视频在线| 丰满爆乳无码一区二区三区|