System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于圖像壓縮,具體涉及基于邊界感知分割網絡的圖像壓縮方法及系統。
技術介紹
1、傳統的圖像壓縮方法主要包括基于變換編碼的方法(如jpeg)、基于預測編碼的方法(如jpeg2000)以及基于向量量化的方法等。這些方法在一定程度上實現對圖像數據的壓縮,但在保持圖像質量和細節方面存在一定的局限性。對于一些包含豐富細節和復雜場景的數據,傳統的壓縮方法無法滿足目標區域高質量可視化的需求。
2、近年來,深度學習技術的快速發展為圖像壓縮領域帶來了新的機遇,特別是卷積神經網絡(cnn)的應用,使得圖像語義信息得到更好的提取和學習,從而能夠準確地分割圖像中的不同區域,為后續的壓縮和圖像處理提供更有利的輸入,保證圖像的細節和質量。
3、然而,在一些領域,產生的圖像數據體量龐大,傳輸和存儲這些數據需要消耗大量的帶寬和存儲資源,如何對海量的圖像數據進行高效壓縮和優化處理成為了需要解決的問題。
技術實現思路
1、專利技術目的:為了解決上述問題,本專利技術提供了基于邊界感知分割網絡的圖像壓縮方法及系統。
2、技術方案:基于邊界感知分割網絡的圖像壓縮方法,其特征在于,包括以下步驟:
3、圖像數據預處理:獲取待壓縮的圖像數據,并對所述圖像數據中的目標進行標注;其中,所述圖像數據中包括:目標的圖像數據,以及非目標的圖像數據;
4、圖像數據分割:利用邊界感知分割網絡對所述圖像數據進行分割處理,得到分割掩膜;其中,所述邊界感知分割網絡至少包括編碼器-
5、圖像數據壓縮:將所述分割掩膜劃分為n×n的像素塊,對所述像素塊進行變換處理,得到n×n的浮點數矩陣;對非目標的圖像數據所對應的浮點數矩陣進行量化處理,并對量化后的頻域系數進行編碼處理;
6、圖像數據解壓縮:將完成編碼的圖像數據傳輸至遠程控制端,對編碼的圖像數據進行解壓,得到解壓縮圖像數據;
7、圖像數據增強:利用邊緣檢測增強網絡對解壓縮圖像數據中的目標進行圖像增強。
8、進一步地,利用邊界感知分割網絡對所述圖像數據進行分割處理,包括以下步驟:
9、將所述圖像數據輸入至編碼器-解碼器網絡中,并輸出獲取每個圖像數據的預測分割概率圖;
10、基于所述殘差細化網絡,對所述預測分割概率圖進行細化,得到細化后的預測分割概率圖;對細化后的預測分割概率圖,得到分割掩膜;
11、利用混合損失函數對預測分割概率圖、以及細化后的預測分割概率圖進行損失計算;
12、其中,所述混合損失函數為:
13、
14、其中,α、β、λ∈[0,1]且0≤α、β、λ≤1;
15、focal表示二值交叉熵、ssim表示結構相似性指數、iou表示交并比;表示第k個圖像的二值交叉熵損失函數;表示第k個圖像的結構相似性損失函數;表示第k個圖像的交并比損失函數;
16、α、β、λ為權重系數;k是第k個邊輸出的損失。
17、進一步地,所述量化處理采用以下量化公式:
18、
19、其中,bi,j為量化后的矩陣,round()為取整函數,gi,j為圖像塊亮度分量的矩陣,qi,j為量化系數矩陣。
20、進一步地,所述編碼器-解碼器網絡包括編碼器、以及與所述編碼器對稱的解碼器;
21、所述編碼器包括一個輸入卷積層和六個基礎的殘差模塊;輸入卷積層和前四個殘差模塊采用resnet-34結構;輸入卷積層采用64個卷積濾波器,卷積核大小為3×3,步長為1;在第四個殘差模塊之后增加了兩個卷積模塊,這兩個卷積模塊均由3個基礎的殘差模塊組成,并連接一個非重疊的卷積核大小為2×2的最大池化層;
22、在編碼器和解碼器之間設置有橋連模塊,所述橋連模塊由3個3×3大小的空洞卷積組成,每個空洞卷積層都連接著批量歸一化函數和relu激活函數;
23、所述編碼器中每個模塊由三個卷積層組成,每個卷積層跟隨批量歸一化函數和relu激活函數;每個模塊的輸入來源于前一模塊和編碼器中對應模塊的上采樣輸出的特征圖級聯而成;每個解碼器階段的最后一層由groundtruth監督;橋連卷積和每個解碼器模塊的多通道輸出經過一個普通的3×3卷積,然后進行雙線性上采樣和sigmoid函數處理。
24、進一步地,所述殘差細化網絡采用殘差編碼器-解碼器架構;所述殘差編碼器-解碼器架構包含一個輸入層、一個殘差編碼器、一個殘差解碼器和一個輸出層;殘差編碼器和殘差解碼器都具有四個階段,每個階段只有一個卷積層,每個卷積層都有64個大小為3×3的濾波器;每個卷積層跟隨bn和relu激活函數,殘差編碼器使用非重疊最大池化進行下采樣,殘差解碼器使用雙線性插值用于進行上采樣,殘差細化網絡的輸出則為basnet的最終生成的分割結果。
25、進一步地,所述圖像數據壓縮還包括以下步驟:
26、將所述分割掩膜中每個像素被標記為不同的區域;將分割掩膜圖像從左至右、從上至下依次按照像素劃分為n×n的圖像塊;
27、將n×n的圖像塊從rgb數據轉化為ycbcr格式的數據,每一個圖像塊形成m個n×n的圖像塊的矩陣;
28、通過離散余弦變換將圖像塊從空域轉換到頻域,提取圖像塊中的頻率系數;
29、經過顏色空間轉換和離散余弦變換轉換,每一個n×n的圖像塊都變成了m個n×n的浮點數矩陣,分別表示y、cr、cb的數據。
30、進一步地,所述圖像數據解壓縮還包括以下步驟:
31、對編碼的圖像數據進行解碼,獲取量化系數和huffman編碼;根據量化系數進行逆量化,恢復頻域系數;對逆量化后的頻域系數進行離散余弦變換逆離散余弦變換,將頻域系數轉換回空域;最后將逆離散余弦變換變換后的圖像塊進行色彩空間轉換,并將所有轉換后的圖像塊拼接成完整的解壓縮圖像。
32、進一步地,利用邊緣檢測增強網絡對解壓縮圖像數據中的目標進行圖像增強,包括以下步驟:
33、邊緣檢測增強網絡的網絡結構由3種block塊組成:block1、block2、block3;每個block塊由兩個卷積層組成;其中,block1通過跳躍連接block2,經過求和運算送入block3;block2輸出的位置跳躍連接block3,最終block的輸出為(block3+block2)/2,這三個階段的輸出送入usnet網絡中進行處理;其中,usnet網絡包括:usnet1、usnet2、usnet3;
34、usnet網絡輸出邊緣映射預測圖,預測圖的寬度和高度,與輸入圖相同;usnet1由1個conv層和1個deconv層組成,usnet2具有與usnet1相同的架構,usnet3有兩個conv層和兩個deconv層;將usnet網絡的輸出送至邊緣融合網絡進行融合合并;
35、邊緣融合網絡使用cnn合并骨干網絡中不同層級生成的邊緣預測圖;所述邊緣融合本文檔來自技高網...
【技術保護點】
1.基于邊界感知分割網絡的圖像壓縮方法,其特征在于,包括以下步驟:
2.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,利用邊界感知分割網絡對所述圖像數據進行分割處理,包括以下步驟:
3.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,所述量化處理采用以下量化公式:
4.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,所述編碼器-解碼器網絡包括編碼器、以及與所述編碼器對稱的解碼器;
5.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,所述殘差細化網絡采用殘差編碼器-解碼器架構;
6.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,所述圖像數據壓縮還包括以下步驟:
7.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,所述圖像數據解壓縮還包括以下步驟:
8.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,利用邊緣檢測增強網絡對解壓縮圖像數據中的目標進行圖像增強,包括以下步驟:<
...【技術特征摘要】
1.基于邊界感知分割網絡的圖像壓縮方法,其特征在于,包括以下步驟:
2.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,利用邊界感知分割網絡對所述圖像數據進行分割處理,包括以下步驟:
3.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,所述量化處理采用以下量化公式:
4.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,所述編碼器-解碼器網絡包括編碼器、以及與所述編碼器對稱的解碼器;
5.如權利要求1所述的基于邊界感知分割網絡的圖像壓縮方法,其特征在于,所述殘差細化網絡...
【專利技術屬性】
技術研發人員:李凱,萬姣,胡美慧,向志威,陳立志,陳濤,景康,曹進平,楊恒翔,趙忠浩,馬斌,沈佳,米爾阿力木江·吐爾洪,孫若寒,
申請(專利權)人:國網新疆電力有限公司信息通信公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。