System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于一種圖像處理方法,尤其涉及一種自動動物圖像摳圖方法。
技術介紹
1、動物摳圖
技術介紹
,作為圖像處理中的一個重要領域,指的是從圖片中準確地分離出動物主體,并移除或更換背景。在現代社會中,動物深受人們喜愛,無論是家養的萌寵,還是動物園里的猛禽,都帶給人們實足的意義。同時人們對于動物圖像的編輯需求也越來越大,動物圖像摳圖技術不僅僅是圖像編輯和合成的工具,更在生物學研究、環境保護、文化傳播和人工智能應用等領域具有廣泛的應用前景。特別是在生態學和動物行為研究中,通過對動物圖像的精確摳圖,可以有效進行非侵入式監測,為保護瀕危物種、研究動物行為以及進行生態環境評估提供重要數據支持。
2、然而,由于動物在自然環境中與背景的相似性、形態的多樣性及圖像中的復雜光照、遮擋等問題,傳統的圖像摳圖技術往往面臨較大的挑戰。許多動物的顏色和背景顏色相近,邊緣過渡復雜,導致傳統的基于顏色、邊緣或區域分割的摳圖方法效果不佳。特別是對于具有毛發、羽毛等細節紋理的動物,傳統的算法常常無法準確地提取出細致的邊緣信息。通過對動物圖像摳圖技術的深入研究,例如,深度學習方法,如卷積神經網絡(cnn),已在圖像分割中取得了顯著進展。盡管基于卷積神經網絡(cnn)的方法可以獲得很好的摳圖效果,但前提條件是要有修剪或涂鴉的三分圖,這使得它們不太可能用于自動應用。隨著時代的快速發展,同時出現了自動摳圖模型,然而現有的自動摳圖模型大多都是針對人像摳圖,人像摳圖大都針對于其主要關注頭發、面部、衣物等細節,并且大多數場景中背景與目標的對比度較高更易處理,而對于處
3、因此,對于開發專門針對自動動物圖像的摳圖技術,解決動物在自然環境中與背景的相似性、形態的多樣性提升動物整體識別,以及動物細節紋理如何更加精細的摳圖,提高動物摳圖的精準率,是我們需要進一步解決的問題。
技術實現思路
1、針對上述問題,本專利技術提出了一種自動動物圖像摳圖方法。該方法采用共享編碼多解碼結構,用戶只需要輸入動物圖像便可實現端到端自動動物摳圖。
2、一種自動動物圖像摳圖方法,包括以下步驟:
3、步驟s1:構建動物圖像數據集,動物圖像數據集包括若干動物圖像;
4、步驟s2:構建動物圖像摳圖模型,模型包括移動窗口編碼模塊、全局語義分支模塊,細節特征分支模塊和分支融合模塊;導入步驟s1中的數據集的動物圖像至移動窗口編碼模塊中,獲取不同尺度的編碼特征;其中,編碼特征包括依次提取的第1特征、第2特征、第3特征、第4特征和第5特征;
5、步驟s3:將步驟s2中的第5特征導入全局語義分支模塊,獲取全局語義特征;
6、步驟s4:將步驟s2中的編碼特征中的第2特征、第3特征、第4特征和第5特征導入細節特征分支模塊,獲取細節語義特征;
7、步驟s5:將全局語義特征和細節語義特征導入至分支融合模塊,進行特征融合獲取融合特征,也即預測的動物透明度遮罩圖;
8、步驟s6:構建損失函數并通過最小化損失以優化模型。
9、進一步的,步驟s1具體為:
10、獲取am-2k數據集的圖像作為前景以及獲取bg-20k數據集的圖像作為背景,將前景和背景合成動物圖像以構建動物圖像數據集;表示:
11、;
12、其中,表示動物圖像,r表示像素索引,f表示前景,b表示背景,表示像素屬于前景的概率,范圍為0到1;,,,分別表示像素索引r的合成像素值,前景像素值,背景像素值和前景像素透明度值。
13、進一步的,步驟s2中的移動窗口編碼模塊由swin?transformer網絡構成,包括依次串聯的五個組件,第一組件為圖像塊嵌入模塊,第二、第三、第四和第五組件基礎結構相同,均由至少一組swin?transformer塊和圖像塊合并模塊堆疊而成,將這五個組件依次標注為a1、a2、a3、a4和a5;
14、其中,a2,a3和a5由1個swin?transformer塊和1個圖像塊合并模塊堆疊1次而成,而第四組件a4則由1個swin?transformer塊和1個圖像塊合并模塊堆疊3次而成;
15、步驟s2具體為:
16、步驟s21:對輸入的動物圖像進行統一裁剪獲取固定尺寸的動物圖像,接著對固定尺寸的動物圖像進行數據增強操作,其中數據增強操作包括裁剪和/或翻轉,從而完成動物圖像的預處理;
17、步驟s22:將預處理后的動物圖像輸入到移動窗口編碼模塊的第一組件a1中初步提取動物圖像的第一特征;具體為:
18、使用三個連續的3×3卷積層和relu激活函數,增加通道數,逐步提取復雜的特征,然后使用兩層最大池化層以降低空間分辨率,減少計算量,同時保留全局特性,最后通過layernorm操作對特征進行層歸一化,確保后續處理的穩定性,最終得到第一特征;具體公式為:
19、;
20、;
21、其中,表示預處理后的動物圖像,為多層卷積的集合,也即三個連續的3×3卷積,表示卷積層數,為多層卷積的偏置的集合,為多層卷積的偏置的層數,為二維卷積操作,為非線性激活函數,為最大池化操作,為層歸一化操作;
22、步驟s23:將第一特征輸入至第二組件a2中,第二組件a2輸出第二特征,然后第二組件a2的輸出作為第三組件a3的輸入,依次類推提取特征;
23、swin?transformer塊和圖像塊合并模塊處理輸入特征的過程具體為:
24、輸入的第i特征后首先經過swin?transformer塊,在swin?transformer塊中對輸入特征進行層歸一化,接著進行窗口劃分獲取窗口特征,而后經過窗口多頭自注意力獲取注意力特征,之后通過殘差連接將注意力特征與輸入的第i特征相加并通過多層感知機進行層歸一化,將多層感知機的輸出與層歸一化的結果相加,獲取結果特征,最后通過圖像塊合并模塊對結果特征進行降采樣,最終獲得第i+1特征,具體公式為:
25、;
26、;
27、;
28、;
29、;
30、其中,,為第i特征,b為批量大小,h為特征圖的高度,w為特征圖的寬度,c為通道數,表示實數集,p為窗口特征,表示注意力特征,表示結果特征;表示查詢向量,表示鍵向量的轉置,表示維度,b表示偏置項,表示圖像分割操作,表示歸一化函數,表示窗口多頭注意力機制,為自注意力,表示層歸一化,表示多層感知機,表示降采樣操作,表示第i+1特征,、、、和共同構成編碼特征。
31、進一步的,步驟s3中的全局語義分支模塊包括若干串聯的全局語義解碼塊,具體地,全局語義解碼塊包含四個依次串聯的語義多卷積解碼塊t1,t2,t3,t4和語義單解碼塊t5,其中,在語義多卷積解碼塊后串聯有多維注本文檔來自技高網...
【技術保護點】
1.一種自動動物圖像摳圖方法,其特征在于,包括以下步驟:
2.如權利要求1所述的一種自動動物圖像摳圖方法,其特征在于,步驟S1具體為:
3.如權利要求2所述的一種自動動物圖像摳圖方法,其特征在于,
4.如權利要求3所述的一種自動動物圖像摳圖方法,其特征在于,步驟S3中的全局語義分支模塊包括若干串聯的全局語義解碼塊,具體地,全局語義解碼塊包含四個依次串聯的語義多卷積解碼塊T1,T2,T3,T4和語義單解碼塊T5,其中,在語義多卷積解碼塊后串聯有多維注意力增強模塊;語義多卷積解碼塊由依次串聯的3個3×3卷積層、3個歸一化層,?三個ReLU層和一個上采樣層組成;多維注意力增強模塊由兩個分支組成,第一個分支包括依次串聯的一個卷積塊和通道注意力塊,第二個分支包括串聯的特征分割塊和空間注意力塊;語義單解碼塊T5由串聯的1個3×3卷積層和一個上采樣層組成;
5.如權利要求4所述的一種自動動物圖像摳圖方法,其特征在于,步驟S5中的細節特征分支模塊包括自適應特征融合模塊和細節特征解碼塊,細節特征解碼塊包含四個依次串聯的細節多卷積解碼塊F5,F4,F3
6.如權利要求4所述的一種自動動物圖像摳圖方法,其特征在于,
...【技術特征摘要】
1.一種自動動物圖像摳圖方法,其特征在于,包括以下步驟:
2.如權利要求1所述的一種自動動物圖像摳圖方法,其特征在于,步驟s1具體為:
3.如權利要求2所述的一種自動動物圖像摳圖方法,其特征在于,
4.如權利要求3所述的一種自動動物圖像摳圖方法,其特征在于,步驟s3中的全局語義分支模塊包括若干串聯的全局語義解碼塊,具體地,全局語義解碼塊包含四個依次串聯的語義多卷積解碼塊t1,t2,t3,t4和語義單解碼塊t5,其中,在語義多卷積解碼塊后串聯有多維注意力增強模塊;語義多卷積解碼塊由依次串聯的3個3×3卷積層、3個歸一化層,?三個relu層和一個上采樣層組成;多維注意力增強模塊由兩個分支組成,第一個分支包括依次串聯的一個卷積塊和通道注意力塊,第二...
【專利技術屬性】
技術研發人員:曾紀國,劉云駿,王賀,劉春揚,郭凡,楊波,
申請(專利權)人:江西師范大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。