System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及人工智能,特別是涉及一種圖像處理方法、設備、存儲介質及計算機程序產品。
技術介紹
1、圖像處理技術是人工智能技術的一個重要分支,通過視覺編碼器對輸入圖像進行圖像特征編碼后輸入模型進行計算,或聯合多模態特征進行計算,實現人工智能技術的視覺處理。
2、目前人工智能模型處理復雜的視覺任務時受到分辨率限制,即視覺編碼器有其分辨率上限,故模型常被設計為處理固定尺寸的輸入圖像,這限制了模型從圖像中提取細節的能力,導致重要信息的丟失。為保證對原始圖像的細節處理,目前常用的方法是將原始圖像分割成多個適應視覺編碼器的分辨率的子圖進行處理。
3、在分割原始圖像時,如何確定分割方式,影響著模型計算量增加的多少以及圖像處理質量。
4、在圖像處理任務中如何確定對原始圖像的合適的分割方式,以從質量和效率角度保證人工智能的圖像處理任務的處理性能,是本領域技術人員需要解決的技術問題。
技術實現思路
1、本專利技術的目的是提供一種圖像處理方法、設備、存儲介質及計算機程序產品,用于從質量和效率角度保證人工智能的圖像處理任務的處理性能。
2、為解決上述技術問題,本專利技術提供一種圖像處理方法,包括:
3、獲取待處理圖像;
4、根據所述待處理圖像的分辨率、目標模型的視覺編碼器的分辨率、第一優化條件和第二優化條件,對所述待處理圖像進行分割處理,得到所述待處理圖像對應的多個第一子圖;
5、將所述第一子圖的分辨率處理為所述視覺編碼
6、將各所述第二子圖輸入所述視覺編碼器進行編碼后輸入所述目標模型,得到圖像處理結果;
7、其中,所述第一優化條件為縮小所述第一子圖的長寬比與所述第二子圖的長寬比的偏差的優化條件,所述第二優化條件為約束各所述第二子圖的面積和與所述待處理圖像的面積的差值的優化條件。
8、一方面,根據所述待處理圖像的分辨率、目標模型的視覺編碼器的分辨率、第一優化條件和第二優化條件,對所述待處理圖像進行分割處理,得到所述待處理圖像對應的多個第一子圖,包括:
9、根據所述待處理圖像的分辨率、所述視覺編碼器的分辨率、所述第一優化條件和所述第二優化條件,確定得到對所述待處理圖像在長維度分割子圖的第一數量和對所述待處理圖像在寬維度分割子圖的第二數量;
10、根據所述第一數量和所述第二數量對所述待處理圖像進行無覆蓋的均勻分割處理,得到所述待處理圖像對應的多個所述第一子圖。
11、另一方面,根據所述待處理圖像的分辨率、所述視覺編碼器的分辨率、所述第一優化條件和所述第二優化條件,確定得到對所述待處理圖像在長維度分割子圖的第一數量和對所述待處理圖像在寬維度分割子圖的第二數量,包括:
12、根據所述待處理圖像的分辨率和所述視覺編碼器的分辨率確定子圖數量;
13、根據所述子圖數量確定所述第一數量和所述第二數量的組合,以使同組內所述第一數量和所述第二數量的乘積為所述子圖數量;
14、通過所述第一優化條件和所述第二優化條件,自所述第一數量和所述第二數量的組合中篩選出實際的所述第一數量和實際的所述第二數量;
15、根據所述第一數量和所述第二數量對所述待處理圖像進行無覆蓋的均勻分割處理,得到所述待處理圖像對應的多個所述第一子圖,包括:
16、根據實際的所述第一數量和實際的所述第二數量對所述待處理圖像進行無覆蓋的均勻分割處理,得到所述待處理圖像對應的多個所述第一子圖。
17、另一方面,所述第一優化條件通過優化目標函數表示;所述優化目標函數的優化目標為最小化所述第一子圖的長寬比與所述第二子圖的長寬比的偏差。
18、另一方面,所述優化目標函數為最大化分割打分函數的函數值;
19、所述分割打分函數為第一對數與第二對數的差值的絕對值的相反數;所述第一對數的真數的分子部分為所述待處理圖像的寬度與所述第二數量的乘積,所述第一對數的真數的分母部分為所述待處理圖像的長度與所述第一數量的乘積;所述第二對數的真數為所述第二子圖的寬度與所述第二子圖的長度的比值。
20、另一方面,所述第二優化條件為:各所述第二子圖的面積和減去所述待處理圖像的面積的差值與所述待處理圖像的面積的比值小于第一閾值;
21、根據所述待處理圖像的分辨率、所述視覺編碼器的分辨率、所述第一優化條件和所述第二優化條件,計算得到對所述待處理圖像在長維度分割子圖的第一數量和對所述待處理圖像在寬維度分割子圖的第二數量,包括:
22、根據所述優化目標函數和所述第二優化條件進行優化計算,得到所述第一數量和所述第二數量。
23、另一方面,將各所述第二子圖輸入所述視覺編碼器進行編碼后輸入所述目標模型,得到圖像處理結果,包括:
24、將所述待處理圖像的分辨率處理為所述視覺編碼器的分辨率,得到第一圖像;
25、將所述第一圖像輸入所述視覺編碼器,得到第一視覺特征編碼;
26、將所述第二子圖輸入所述視覺編碼器,得到第二視覺特征編碼;
27、將所述第一視覺特征編碼和所述第二視覺特征編碼進行特征聚合處理后,得到聚合視覺特征;
28、將所述聚合視覺特征輸入所述目標模型,得到所述圖像處理結果。
29、另一方面,根據所述待處理圖像的分辨率、目標模型的視覺編碼器的分辨率、第一優化條件和第二優化條件,對所述待處理圖像進行分割處理,得到所述待處理圖像對應的多個第一子圖,包括:
30、根據所述待處理圖像的分辨率、所述視覺編碼器的分辨率、所述第一優化條件和所述第二優化條件,對所述待處理圖像進行多輪分割處理,得到多組不同尺度的所述第一子圖;
31、將各所述第二子圖輸入所述視覺編碼器進行編碼后輸入所述目標模型,得到圖像處理結果,包括:
32、分別將各尺度的所述第一子圖對應的所述第二子圖輸入所述視覺編碼器,得到各尺度的所述第二子圖對應的所述第二視覺特征編碼;
33、將所述第一視覺特征編碼和所述第二視覺特征編碼進行特征聚合處理后,得到聚合視覺特征,包括:
34、將所述第一圖像和各尺度的所述第二子圖中相鄰尺度的圖像對應的視覺特征編碼進行特征聚合處理,將得到的特征聚合結果進行拼接處理后,得到所述聚合視覺特征。
35、另一方面,對所述待處理圖像進行多次分割處理的輪數根據所述待處理圖像的分辨率確定。
36、另一方面,將所述第一視覺特征編碼和所述第二視覺特征編碼進行特征聚合處理后,得到聚合視覺特征,包括:
37、分別將第一視覺特征編碼和所述第二視覺特征編碼進行壓縮處理,得到壓縮后的所述第一視覺特征編碼和壓縮后的所述第二視覺特征編碼;
38、將壓縮后的所述第一視覺特征編碼和壓縮后的所述第二視覺特征編碼進行聚合處理,得到所述聚合視覺特征。
39、另一方面,將所述第一視覺特征編碼和所述第二本文檔來自技高網...
【技術保護點】
1.一種圖像處理方法,其特征在于,包括:
2.根據權利要求1所述的圖像處理方法,其特征在于,根據所述待處理圖像的分辨率、目標模型的視覺編碼器的分辨率、第一優化條件和第二優化條件,對所述待處理圖像進行分割處理,得到所述待處理圖像對應的多個第一子圖,包括:
3.根據權利要求2所述的圖像處理方法,其特征在于,根據所述待處理圖像的分辨率、所述視覺編碼器的分辨率、所述第一優化條件和所述第二優化條件,確定得到對所述待處理圖像在長維度分割子圖的第一數量和對所述待處理圖像在寬維度分割子圖的第二數量,包括:
4.根據權利要求2所述的圖像處理方法,其特征在于,所述第一優化條件通過優化目標函數表示;所述優化目標函數的優化目標為最小化所述第一子圖的長寬比與所述第二子圖的長寬比的偏差。
5.根據權利要求4所述的圖像處理方法,其特征在于,所述優化目標函數為最大化分割打分函數的函數值;
6.根據權利要求4所述的圖像處理方法,其特征在于,所述第二優化條件為:各所述第二子圖的面積和減去所述待處理圖像的面積的差值與所述待處理圖像的面積的比值小于第一閾值;<
...【技術特征摘要】
1.一種圖像處理方法,其特征在于,包括:
2.根據權利要求1所述的圖像處理方法,其特征在于,根據所述待處理圖像的分辨率、目標模型的視覺編碼器的分辨率、第一優化條件和第二優化條件,對所述待處理圖像進行分割處理,得到所述待處理圖像對應的多個第一子圖,包括:
3.根據權利要求2所述的圖像處理方法,其特征在于,根據所述待處理圖像的分辨率、所述視覺編碼器的分辨率、所述第一優化條件和所述第二優化條件,確定得到對所述待處理圖像在長維度分割子圖的第一數量和對所述待處理圖像在寬維度分割子圖的第二數量,包括:
4.根據權利要求2所述的圖像處理方法,其特征在于,所述第一優化條件通過優化目標函數表示;所述優化目標函數的優化目標為最小化所述第一子圖的長寬比與所述第二子圖的長寬比的偏差。
5.根據權利要求4所述的圖像處理方法,其特征在于,所述優化目標函數為最大化分割打分函數的函數值;
6.根據權利要求4所述的圖像處理方法,其特征在于,所述第二優化條件為:各所述第二子圖的面積和減去所述待處理圖像的面積的差值與所述待處理圖像的面積的比值小于第一閾值;
7.根據權利要求1所述的圖像處理方法,其特征在于,將各所述第二子圖輸入所述視覺編碼器進行編碼后輸入所述目標模型,得到圖像處理結果,包括:
8.根據權利要求7所述的圖像處理方法,其特征在于,根據所述待處理圖像的分辨率、目標模型的視覺編碼器的分辨率、第一優化條件和...
【專利技術屬性】
技術研發人員:申強,王申領,吳韶華,羅建剛,趙旭東,
申請(專利權)人:蘇州元腦智能科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。