System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 无码成人AAAAA毛片,妖精色AV无码国产在线看,久久天堂av综合色无码专区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種自動動物圖像摳圖方法技術

    技術編號:44493291 閱讀:4 留言:0更新日期:2025-03-04 17:59
    本發明專利技術提出了一種自動動物圖像摳圖方法,首先將動物圖片輸入至移動窗口編碼模塊獲取不同尺度的特征;將獲得的編碼特征通過自適應特征融合模塊,結合細節特征分支模塊,在上采樣的過程中融合多尺度信息,掌握動物圖像更豐富的細節信息,獲得細節特征圖;第三部分,將獲得編碼特征輸入全局語義分支模塊,在中間加入多維注意力增強模塊,引導網絡聚焦目標區域,壓制無關信息,獲得全局語義特征,最后通過分支融合模塊將全局語義特征和細節語義特征結合獲得最終的摳圖結果。本發明專利技術利用自適應特征融合模塊豐富了動物紋理的細節,強化精細處理能力,利用多維注意力壓制無關信息,增強背景過渡,提高識別動物目標主體,從而實現了動物摳圖的精準效果。

    【技術實現步驟摘要】

    本專利技術屬于一種圖像處理方法,尤其涉及一種自動動物圖像摳圖方法


    技術介紹

    1、動物摳圖
    技術介紹
    ,作為圖像處理中的一個重要領域,指的是從圖片中準確地分離出動物主體,并移除或更換背景。在現代社會中,動物深受人們喜愛,無論是家養的萌寵,還是動物園里的猛禽,都帶給人們實足的意義。同時人們對于動物圖像的編輯需求也越來越大,動物圖像摳圖技術不僅僅是圖像編輯和合成的工具,更在生物學研究、環境保護、文化傳播和人工智能應用等領域具有廣泛的應用前景。特別是在生態學和動物行為研究中,通過對動物圖像的精確摳圖,可以有效進行非侵入式監測,為保護瀕危物種、研究動物行為以及進行生態環境評估提供重要數據支持。

    2、然而,由于動物在自然環境中與背景的相似性、形態的多樣性及圖像中的復雜光照、遮擋等問題,傳統的圖像摳圖技術往往面臨較大的挑戰。許多動物的顏色和背景顏色相近,邊緣過渡復雜,導致傳統的基于顏色、邊緣或區域分割的摳圖方法效果不佳。特別是對于具有毛發、羽毛等細節紋理的動物,傳統的算法常常無法準確地提取出細致的邊緣信息。通過對動物圖像摳圖技術的深入研究,例如,深度學習方法,如卷積神經網絡(cnn),已在圖像分割中取得了顯著進展。盡管基于卷積神經網絡(cnn)的方法可以獲得很好的摳圖效果,但前提條件是要有修剪或涂鴉的三分圖,這使得它們不太可能用于自動應用。隨著時代的快速發展,同時出現了自動摳圖模型,然而現有的自動摳圖模型大多都是針對人像摳圖,人像摳圖大都針對于其主要關注頭發、面部、衣物等細節,并且大多數場景中背景與目標的對比度較高更易處理,而對于處理動物復雜的環境背景過度從而對動物整體的識別較差,以及對于動物自然攜帶細節的紋理,如皮膚、毛發、鱗片、爪子、耳朵等部位處理難以勝任,從而對于動物的自動摳圖效果不理想。

    3、因此,對于開發專門針對自動動物圖像的摳圖技術,解決動物在自然環境中與背景的相似性、形態的多樣性提升動物整體識別,以及動物細節紋理如何更加精細的摳圖,提高動物摳圖的精準率,是我們需要進一步解決的問題。


    技術實現思路

    1、針對上述問題,本專利技術提出了一種自動動物圖像摳圖方法。該方法采用共享編碼多解碼結構,用戶只需要輸入動物圖像便可實現端到端自動動物摳圖。

    2、一種自動動物圖像摳圖方法,包括以下步驟:

    3、步驟s1:構建動物圖像數據集,動物圖像數據集包括若干動物圖像;

    4、步驟s2:構建動物圖像摳圖模型,模型包括移動窗口編碼模塊、全局語義分支模塊,細節特征分支模塊和分支融合模塊;導入步驟s1中的數據集的動物圖像至移動窗口編碼模塊中,獲取不同尺度的編碼特征;其中,編碼特征包括依次提取的第1特征、第2特征、第3特征、第4特征和第5特征;

    5、步驟s3:將步驟s2中的第5特征導入全局語義分支模塊,獲取全局語義特征;

    6、步驟s4:將步驟s2中的編碼特征中的第2特征、第3特征、第4特征和第5特征導入細節特征分支模塊,獲取細節語義特征;

    7、步驟s5:將全局語義特征和細節語義特征導入至分支融合模塊,進行特征融合獲取融合特征,也即預測的動物透明度遮罩圖;

    8、步驟s6:構建損失函數并通過最小化損失以優化模型。

    9、進一步的,步驟s1具體為:

    10、獲取am-2k數據集的圖像作為前景以及獲取bg-20k數據集的圖像作為背景,將前景和背景合成動物圖像以構建動物圖像數據集;表示:

    11、;

    12、其中,表示動物圖像,r表示像素索引,f表示前景,b表示背景,表示像素屬于前景的概率,范圍為0到1;,,,分別表示像素索引r的合成像素值,前景像素值,背景像素值和前景像素透明度值。

    13、進一步的,步驟s2中的移動窗口編碼模塊由swin?transformer網絡構成,包括依次串聯的五個組件,第一組件為圖像塊嵌入模塊,第二、第三、第四和第五組件基礎結構相同,均由至少一組swin?transformer塊和圖像塊合并模塊堆疊而成,將這五個組件依次標注為a1、a2、a3、a4和a5;

    14、其中,a2,a3和a5由1個swin?transformer塊和1個圖像塊合并模塊堆疊1次而成,而第四組件a4則由1個swin?transformer塊和1個圖像塊合并模塊堆疊3次而成;

    15、步驟s2具體為:

    16、步驟s21:對輸入的動物圖像進行統一裁剪獲取固定尺寸的動物圖像,接著對固定尺寸的動物圖像進行數據增強操作,其中數據增強操作包括裁剪和/或翻轉,從而完成動物圖像的預處理;

    17、步驟s22:將預處理后的動物圖像輸入到移動窗口編碼模塊的第一組件a1中初步提取動物圖像的第一特征;具體為:

    18、使用三個連續的3×3卷積層和relu激活函數,增加通道數,逐步提取復雜的特征,然后使用兩層最大池化層以降低空間分辨率,減少計算量,同時保留全局特性,最后通過layernorm操作對特征進行層歸一化,確保后續處理的穩定性,最終得到第一特征;具體公式為:

    19、;

    20、;

    21、其中,表示預處理后的動物圖像,為多層卷積的集合,也即三個連續的3×3卷積,表示卷積層數,為多層卷積的偏置的集合,為多層卷積的偏置的層數,為二維卷積操作,為非線性激活函數,為最大池化操作,為層歸一化操作;

    22、步驟s23:將第一特征輸入至第二組件a2中,第二組件a2輸出第二特征,然后第二組件a2的輸出作為第三組件a3的輸入,依次類推提取特征;

    23、swin?transformer塊和圖像塊合并模塊處理輸入特征的過程具體為:

    24、輸入的第i特征后首先經過swin?transformer塊,在swin?transformer塊中對輸入特征進行層歸一化,接著進行窗口劃分獲取窗口特征,而后經過窗口多頭自注意力獲取注意力特征,之后通過殘差連接將注意力特征與輸入的第i特征相加并通過多層感知機進行層歸一化,將多層感知機的輸出與層歸一化的結果相加,獲取結果特征,最后通過圖像塊合并模塊對結果特征進行降采樣,最終獲得第i+1特征,具體公式為:

    25、;

    26、;

    27、;

    28、;

    29、;

    30、其中,,為第i特征,b為批量大小,h為特征圖的高度,w為特征圖的寬度,c為通道數,表示實數集,p為窗口特征,表示注意力特征,表示結果特征;表示查詢向量,表示鍵向量的轉置,表示維度,b表示偏置項,表示圖像分割操作,表示歸一化函數,表示窗口多頭注意力機制,為自注意力,表示層歸一化,表示多層感知機,表示降采樣操作,表示第i+1特征,、、、和共同構成編碼特征。

    31、進一步的,步驟s3中的全局語義分支模塊包括若干串聯的全局語義解碼塊,具體地,全局語義解碼塊包含四個依次串聯的語義多卷積解碼塊t1,t2,t3,t4和語義單解碼塊t5,其中,在語義多卷積解碼塊后串聯有多維注本文檔來自技高網...

    【技術保護點】

    1.一種自動動物圖像摳圖方法,其特征在于,包括以下步驟:

    2.如權利要求1所述的一種自動動物圖像摳圖方法,其特征在于,步驟S1具體為:

    3.如權利要求2所述的一種自動動物圖像摳圖方法,其特征在于,

    4.如權利要求3所述的一種自動動物圖像摳圖方法,其特征在于,步驟S3中的全局語義分支模塊包括若干串聯的全局語義解碼塊,具體地,全局語義解碼塊包含四個依次串聯的語義多卷積解碼塊T1,T2,T3,T4和語義單解碼塊T5,其中,在語義多卷積解碼塊后串聯有多維注意力增強模塊;語義多卷積解碼塊由依次串聯的3個3×3卷積層、3個歸一化層,?三個ReLU層和一個上采樣層組成;多維注意力增強模塊由兩個分支組成,第一個分支包括依次串聯的一個卷積塊和通道注意力塊,第二個分支包括串聯的特征分割塊和空間注意力塊;語義單解碼塊T5由串聯的1個3×3卷積層和一個上采樣層組成;

    5.如權利要求4所述的一種自動動物圖像摳圖方法,其特征在于,步驟S5中的細節特征分支模塊包括自適應特征融合模塊和細節特征解碼塊,細節特征解碼塊包含四個依次串聯的細節多卷積解碼塊F5,F4,F3,F2和細節單解碼塊F1,其中,細節多卷積解碼塊包括依次串聯的2個深度可分離卷積層、1個3×3卷積層,1個批量歸一化層,1個ReLU層和一個上采樣層組成;自適應特征融合模塊包括依次串聯的高效區域注意力模塊,高效通道加權模塊以及空間注意力模塊;細節單解碼塊F5由串聯的1個3×3卷積層和一個上采樣層組成;

    6.如權利要求4所述的一種自動動物圖像摳圖方法,其特征在于,

    ...

    【技術特征摘要】

    1.一種自動動物圖像摳圖方法,其特征在于,包括以下步驟:

    2.如權利要求1所述的一種自動動物圖像摳圖方法,其特征在于,步驟s1具體為:

    3.如權利要求2所述的一種自動動物圖像摳圖方法,其特征在于,

    4.如權利要求3所述的一種自動動物圖像摳圖方法,其特征在于,步驟s3中的全局語義分支模塊包括若干串聯的全局語義解碼塊,具體地,全局語義解碼塊包含四個依次串聯的語義多卷積解碼塊t1,t2,t3,t4和語義單解碼塊t5,其中,在語義多卷積解碼塊后串聯有多維注意力增強模塊;語義多卷積解碼塊由依次串聯的3個3×3卷積層、3個歸一化層,?三個relu層和一個上采樣層組成;多維注意力增強模塊由兩個分支組成,第一個分支包括依次串聯的一個卷積塊和通道注意力塊,第二...

    【專利技術屬性】
    技術研發人員:曾紀國劉云駿王賀劉春揚郭凡楊波
    申請(專利權)人:江西師范大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲av成本人无码网站| 亚洲中文无码永久免| 亚洲午夜AV无码专区在线播放| 日韩精品人妻系列无码av东京 | av潮喷大喷水系列无码| 在线A级毛片无码免费真人| 亚洲AV日韩AV永久无码绿巨人| 国产人成无码视频在线观看| 日韩精品无码一区二区中文字幕 | 亚洲无码日韩精品第一页| 亚洲av无码片在线观看| 亚洲伊人成无码综合网| 无码人妻丰满熟妇区BBBBXXXX| 亚洲情XO亚洲色XO无码| 亚洲国产成人精品无码久久久久久综合 | 影院无码人妻精品一区二区 | 免费a级毛片无码av| 综合无码一区二区三区四区五区| 久久无码av三级| 久久无码AV中文出轨人妻| 无码人妻丰满熟妇区毛片| 亚洲av无码一区二区三区天堂 | 国产精品白浆在线观看无码专区| 亚洲AV无码乱码在线观看代蜜桃| 亚洲AV无码一区二区三区系列| yy111111少妇影院里无码| 夜夜精品无码一区二区三区| 精品久久久久久久无码久中文字幕| 2024你懂的网站无码内射| 久久久久亚洲AV片无码| 无码国内精品人妻少妇蜜桃视频| 亚洲精品无码AV人在线播放| 亚洲色无码专区在线观看| 欧洲精品无码一区二区三区在线播放| 免费无码成人AV片在线在线播放| 亚洲AV无码一区二区三区鸳鸯影院 | 日韩精品无码免费专区网站| 日韩av无码中文无码电影| 国产网红主播无码精品| 日韩av无码中文无码电影| 久久精品aⅴ无码中文字字幕|