System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及計(jì)算機(jī)視覺領(lǐng)域和人工智能檢測技術(shù),特別是涉及一種基于卷積塊注意力機(jī)制和顯式視覺中心的小型船舶檢測方法。
技術(shù)介紹
1、在計(jì)算機(jī)視覺領(lǐng)域,目標(biāo)檢測有大量成熟的解決方案如mobilenet、faster?r-cnn以及you?only?look?once(yolo)系列等,其中yolo系列由于其結(jié)構(gòu)簡單便于部署,以及其在檢測精度和推理速度上的平衡性能,在工業(yè)現(xiàn)場中被大量應(yīng)用以實(shí)現(xiàn)針對特定對象的目標(biāo)檢測任務(wù)。一般的,yolo網(wǎng)絡(luò)由三部分組成,其中骨干網(wǎng)絡(luò)對傳入圖像進(jìn)行下采樣,生成擁有語義特征的特征圖;特征金字塔網(wǎng)絡(luò)對特征圖進(jìn)行重采樣,融合低維特征圖的圖像信息以獲取更好的檢測效果;檢測頭接收特征金字塔中不同維度和分辨率的特征圖,完成訓(xùn)練過程中損失函數(shù)的計(jì)算和測試過程中的檢測結(jié)果輸出,包括檢測對象的位置和類別。但在面向小目標(biāo)檢測的任務(wù)中,yolo系列存在困境,當(dāng)模型參數(shù)量較低時(shí),在高檢測精度要求下的檢測準(zhǔn)確率會(huì)嚴(yán)重下降,而高參數(shù)量模型又存在應(yīng)用場景限制,在硬件條件有限的情況下存在部署困難、推理速度慢等問題。
2、近年來,基于注意力機(jī)制的特征提取被認(rèn)為是捕獲像素間關(guān)系的有效方法,其中自注意力機(jī)制被廣泛應(yīng)用于自然語言處理領(lǐng)域以捕獲全文字符間關(guān)系。但在計(jì)算機(jī)視覺領(lǐng)域,自注意力機(jī)制會(huì)為推理過程帶來難以接受的大型矩陣運(yùn)算,因此針對計(jì)算機(jī)視覺領(lǐng)域的注意力機(jī)制嘗試以低推理成本實(shí)現(xiàn)像素間關(guān)系的提取,這一領(lǐng)域的經(jīng)典工作包括senet和cbam(卷積塊注意力機(jī)制)。然而在實(shí)踐應(yīng)用中,注意力機(jī)制通常被級聯(lián)于某一模塊的輸出端,模型的計(jì)算
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)現(xiàn)有技術(shù)存在的問題,本專利技術(shù)公開了一種基于卷積塊注意力機(jī)制和顯式視覺中心的小型船舶檢測方法,具體包括如下步驟:
2、獲取水面船舶圖像;
3、構(gòu)建骨干網(wǎng)絡(luò)模型,其中該骨干網(wǎng)絡(luò)模型包括卷積塊、具備卷積塊注意力機(jī)制的結(jié)合卷積塊以及特征金字塔網(wǎng)絡(luò)模塊;
4、將所述水面船舶圖像輸入至骨干網(wǎng)絡(luò)中進(jìn)行特征提取,其中所述結(jié)合卷積塊對水面船舶圖像進(jìn)行特征圖處理,通過梯度路徑分離出水面船舶圖像低通道數(shù)的特征圖并在該特征圖上提取卷積塊注意力,將其與未處理的低通道數(shù)特征圖融合,得到語義信息輸出特征圖;
5、通過特征金字塔網(wǎng)絡(luò)模塊對特征圖進(jìn)行基于點(diǎn)采樣的可學(xué)習(xí)上采樣操作,基于特征圖偏移量進(jìn)行上采樣操作獲得高解析度特征圖,再對高解析度特征圖進(jìn)行顯式視覺中心后處理捕獲像素間長距離依賴關(guān)系并還原邊緣信息獲得最終特征圖;
6、對最終特征圖再次進(jìn)行拼接和下采樣,生成分辨率低、通道數(shù)高的深層特征圖,將深層特征圖和最終特征圖相結(jié)合進(jìn)行目標(biāo)檢測獲得小型船舶的中心點(diǎn)坐標(biāo)、檢測框的寬度值與高度值、以及目標(biāo)所屬類別及置信度信息。
7、進(jìn)一步的,所述結(jié)合卷積塊對水面船舶圖像進(jìn)行特征圖處理時(shí):將卷積塊注意力機(jī)制分別在圖像的空間和通道兩個(gè)維度進(jìn)行注意力提取:
8、ca(·)=σ(pconv(avgpoolc(·)+maxpoolc(·)))
9、sa(·)=σ(conv7×7(concat(avgpoolhw(·),maxpoolhw(·))))
10、
11、其中avgpool和maxpool分別代表平均池化和最大池化操作,pconv為點(diǎn)卷積操作,σ為sigmoid激活函數(shù),為兩個(gè)向量之間的元素級乘法運(yùn)算;卷積塊在特征圖輸入瓶頸前將特征圖分為通道數(shù)相等的兩部分,只有其中一部分會(huì)經(jīng)過瓶頸處理,另一部分直接參與拼接操作,對于參與瓶頸處理的部分標(biāo)記為xin2;
12、xout=pconv(concat(xin1,cbam(bottleneck(xin2))))
13、其中bottleneck代表瓶頸操作,在經(jīng)過cbam的注意力處理后xin1與xin2的信息梯度差異增加,從而進(jìn)行注意力提取。
14、進(jìn)一步的,對特征圖進(jìn)行基于點(diǎn)采樣的可學(xué)習(xí)上采樣操作時(shí):對于形狀為(b,c,h,w)的輸入特征圖xin,在偏移值生成分支中通過像素混淆將特征圖維度變?yōu)?b,c/s2,sh,sw),分別傳入兩個(gè)點(diǎn)卷積,將通道維度變換為2g;
15、
16、其中ps代表像素混淆操作,一個(gè)點(diǎn)卷積操作經(jīng)過sigmoid激活函數(shù)后再進(jìn)行元素乘法運(yùn)算;
17、對于得到的特征圖,進(jìn)行像素反混淆后和基于雙線性插值的初始采樣值相加以阻止生成偏移值退化為近鄰插值,得到最終的特征圖偏移量offset(xin),整理獲得
18、
19、其中pu代表像素反混淆操作,init_pos為特征圖的雙線性插值初始采樣值;
20、將原始輸入特征圖xin在通道維度上進(jìn)行重組,得到形狀為(b,g,c/g,h,w)的特征圖,結(jié)合特征圖偏移量進(jìn)行網(wǎng)格采樣后得到上采樣特征圖:
21、xout=gsample(xin,pu(offset(xin)))
22、其中g(shù)sample代表網(wǎng)格采樣,上采樣策略保留特征圖中的語義信息以降低損失。
23、進(jìn)一步的,對高解析度特征圖進(jìn)行顯式視覺中心后處理時(shí):對于輸入特征圖xin,通過7×7卷積核、批次正則化和激活函數(shù)初步處理,將顯式視覺中心網(wǎng)絡(luò)分為兩部分:輕量級多層感知機(jī)和可學(xué)習(xí)視覺中心,分別捕獲像素間長距離依賴關(guān)系和還原邊緣信息;
24、輕量級多層感知機(jī)對輸入特征圖進(jìn)行層正則化和深度可分離卷積,在通道維度上進(jìn)行通道賦權(quán),進(jìn)行通道維度上的注意力提取,并將結(jié)果與正則化前的輸入特征圖進(jìn)行殘差連接;
25、
26、其中l(wèi)n為層正則化,dconv為深度可分離卷積,t1為一組向量,其與輸入特征圖xin進(jìn)行元素乘法,對再次進(jìn)行層正則化,傳入通道多層感知機(jī),提取不同通道之間像素的依賴關(guān)系,將結(jié)果進(jìn)行通道賦權(quán)和殘差連接,即得到輕量級多層感知機(jī)的輸出;
27、cmlp(·)=pconv2(gelu(pconv1(·)))
28、
29、其中g(shù)elu為gelu激活函數(shù),t2為通道多層感知機(jī)的輸出結(jié)果,進(jìn)行通道賦權(quán),從而獲得特征圖內(nèi)像素間的長距離依賴關(guān)系lmlp(xin);
30、可學(xué)習(xí)視覺中心對傳入特征圖進(jìn)行倒殘差連接和卷積處理后,通過可學(xué)習(xí)編碼字典b={b1,b2,…,bk}和賦權(quán)因子s={s1,s2,…,sk}進(jìn)行編碼操作,其中k為字典中編碼詞的數(shù)量;對于特征圖中每個(gè)通道數(shù)量為c的向量和編碼字典bk,通過賦權(quán)因子計(jì)算可得到位置相關(guān)信息后,將位置相關(guān)信息按編碼字典求和,進(jìn)行批次歸一化和激活函數(shù)處理,得到編碼字典對于特征圖全局的相對位置信息最后對k個(gè)相對位置信息求平均值,可得到完成編碼的特征值
31、編碼特征值e通過全連接層和sigmoid激活函數(shù)處理后,與可學(xué)習(xí)視覺中心的特征圖進(jìn)行元素乘法,再將結(jié)果和特征圖進(jìn)行殘差連接,還原特征圖中丟失的邊緣信息:本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于卷積塊注意力機(jī)制和顯式視覺中心的小型船舶檢測方法,其特征在于包括:
2.根據(jù)權(quán)利要求1所述的一種基于卷積塊注意力機(jī)制和顯式視覺中心的小型船舶檢測方法,其特征在于:所述結(jié)合卷積塊對水面船舶圖像進(jìn)行特征圖處理時(shí):將卷積塊注意力機(jī)制分別在圖像的空間和通道兩個(gè)維度進(jìn)行注意力提取:
3.根據(jù)權(quán)利要求1所述的一種基于卷積塊注意力機(jī)制和顯式視覺中心的小型船舶檢測方法,其特征在于:對特征圖進(jìn)行基于點(diǎn)采樣的可學(xué)習(xí)上采樣操作時(shí):對于形狀為(B,C,H,W)的輸入特征圖Xin,在偏移值生成分支中通過像素混淆將特征圖維度變?yōu)?B,C/s2,sH,sW),分別傳入兩個(gè)點(diǎn)卷積,將通道維度變換為2g;
4.根據(jù)權(quán)利要求1所述的一種基于卷積塊注意力機(jī)制和顯式視覺中心的小型船舶檢測方法,其特征在于:對高解析度特征圖進(jìn)行顯式視覺中心后處理時(shí):對于輸入特征圖Xin,通過7×7卷積核、批次正則化和激活函數(shù)初步處理,將顯式視覺中心網(wǎng)絡(luò)分為兩部分:輕量級多層感知機(jī)和可學(xué)習(xí)視覺中心,分別捕獲像素間長距離依賴關(guān)系和還原邊緣信息;
【技術(shù)特征摘要】
1.一種基于卷積塊注意力機(jī)制和顯式視覺中心的小型船舶檢測方法,其特征在于包括:
2.根據(jù)權(quán)利要求1所述的一種基于卷積塊注意力機(jī)制和顯式視覺中心的小型船舶檢測方法,其特征在于:所述結(jié)合卷積塊對水面船舶圖像進(jìn)行特征圖處理時(shí):將卷積塊注意力機(jī)制分別在圖像的空間和通道兩個(gè)維度進(jìn)行注意力提取:
3.根據(jù)權(quán)利要求1所述的一種基于卷積塊注意力機(jī)制和顯式視覺中心的小型船舶檢測方法,其特征在于:對特征圖進(jìn)行基于點(diǎn)采樣的可學(xué)習(xí)上采樣操作時(shí):對于形狀為(b,c,h,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:尹清波,高天淳,張宇正,申麗然,
申請(專利權(quán))人:大連海事大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。