System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及圖像處理,具體而言,涉及一種圖像處理方法、裝置、電子設備及存儲介質。
技術介紹
1、由于交通特殊場景的圖像難以收集且難以標注,導致訓練的下游目標檢測模型在檢測任務中的效果不佳。因此,如何生成優質的交通場景內容圖像為下游模型的訓練提供訓練數據變得尤為重要。
2、目前,大多通過采集數據庫中的已有交通場景背景圖像,通過人工標注的方式,得到訓練樣本數據。
3、但是,標注過程嚴重依賴于人工,成本較高且準確性較差,從而導致下游模型的檢測效果受到影響。
技術實現思路
1、本申請的目的在于,針對上述現有技術中的不足,提供一種圖像處理方法、裝置、電子設備及存儲介質,通過合成圖像代替人工標注,減少人力耗時,提升下游模型檢測的準確性。
2、為實現上述目的,本申請實施例采用的技術方案如下:
3、第一方面,本申請實施例提供了一種圖像處理方法,包括:
4、從獲取的各初始圖像中提取至少一個前景對象圖像;
5、根據采集的各場景背景圖像,確定各場景背景圖像對應的場景深度信息;
6、根據所述各場景背景圖像,確定各場景背景圖像中的目標區域;
7、根據所述各場景背景圖像對應的場景深度信息以及所述各場景背景圖像中的目標區域,將至少一個前景對象圖像嵌入至少一個場景背景圖像中,生成多個合成圖像。
8、可選地,所述從獲取的各初始圖像中提取至少一個前景對象圖像,包括:
9、搜集多個初始圖像,各初始圖像中
10、根據各初始圖像以及各初始圖像對應的至少一個前景對象描述信息,采用大語言視覺模型,從各初始圖像中提取各前景對象描述信息對應的各前景對象圖像。
11、可選地,所述根據各初始圖像以及各初始圖像對應的至少一個前景對象描述信息,采用大語言視覺模型,從各初始圖像中提取各前景對象描述信息對應的各前景對象圖像,包括:
12、由所述大語言視覺模型分別對初始圖像以及初始圖像對應的目標前景對象描述信息進行編碼,生成融合編碼信息;
13、對所述融合編碼信息進行分割解碼,從所述初始圖像中提取出所述目標前景對象描述信息對應的目標前景對象的二值掩碼圖,并對所述二值掩碼圖進行轉換,得到所述目標前景對象的邊界框;
14、根據所述目標前景對象的邊界框,提取得到目標前景對象圖像。
15、可選地,所述根據采集的各場景背景圖像,確定各場景背景圖像對應的場景深度信息,包括:
16、分別采用深度估計模型以及分割模型,對場景背景圖像進行編碼,得到場景背景圖像的特征圖;
17、對所述場景背景圖像的特征圖進行解碼,得到所述場景背景圖像的深度圖;
18、根據所述深度圖,確定所述場景背景圖像的深度信息。
19、可選地,所述根據所述各場景背景圖像,確定各場景背景圖像中的目標區域,包括:
20、根據場景背景圖像,生成場景背景圖像中的路面掩膜圖像;
21、根據所述路面掩膜圖像,確定所述場景背景圖像中的可嵌入區域;
22、根據所述可嵌入區域的邊界信息以及所述場景背景圖像的寬度信息,確定區域比例信息;所述區域比例信息用于表征待選的目標區域占所述可嵌入區域的比例;
23、根據所述區域比例信息以及所述可嵌入區域的邊界信息,確定區域分割位置,基于所述區域分割位置,對所述可嵌入區域進行分割,得到所述目標區域。
24、可選地,所述根據所述路面掩膜圖像,確定所述場景背景圖像中的可嵌入區域,包括:
25、根據所述路面掩膜圖像,分別確定路面靠近所述場景背景圖像的底邊的第一距離以及路面靠近所述場景背景圖像的頂邊的第二距離;
26、根據所述第一距離以及所述路面掩膜圖像的邊界,確定第一邊界線;
27、根據所述第二距離以及所述路面掩膜圖像的邊界,確定第二邊界線;
28、根據所述第一邊界線、所述第二邊界線以及所述路面掩膜圖像的圖像區域,分別確定第三邊界線和第四邊界線;
29、由所述第一邊界線、所述第二邊界線、所述第三邊界線以及所述第四邊界線,構成所述可嵌入區域。
30、可選地,所述根據所述可嵌入區域的邊界信息以及所述場景背景圖像的寬度信息,確定區域比例信息,包括:
31、根據所述可嵌入區域的所述第一邊界線的端點坐標信息、所述第二邊界線的端點坐標信息以及所述場景背景圖像的寬度信息,確定所述區域比例信息。
32、可選地,所述根據所述區域比例信息以及所述可嵌入區域的邊界信息,確定區域分割位置,基于所述區域分割位置,對所述可嵌入區域進行分割,得到所述目標區域之前,還包括:
33、若所述區域比例信息大于預設閾值,則對所述區域比例信息進行調整,得到調整后的區域比例信息。
34、可選地,所述根據所述區域比例信息以及所述可嵌入區域的邊界信息,確定區域分割位置,包括:
35、根據所述可嵌入區域的所述第一邊界線的端點坐標信息、所述第二邊界線的端點坐標信息、所述區域比例信息,確定所述區域分割位置。
36、可選地,所述根據所述各場景背景圖像對應的場景深度信息以及所述各場景背景圖像中的目標區域,將至少一個前景對象圖像嵌入至少一個場景背景圖像中,生成多個合成圖像,包括:
37、從目標場景背景圖像中的目標區域中確定目標嵌入位置;所述目標嵌入位置為所述目標區域中的任意位置;
38、根據所述目標場景背景圖像對應的場景深度信息,確定所述目標嵌入位置的深度信息;
39、根據所述目標嵌入位置的深度信息以及深度信息與圖像嵌入尺寸之間的映射關系,確定待嵌入所述目標場景背景圖像中所述目標嵌入位置上的目標前景對象圖像尺寸;
40、按照所述圖像尺寸,將所述目標前景對象圖像嵌入所述目標場景背景圖像中的所述目標嵌入位置上,生成一個合成圖像。
41、可選地,所述將至少一個前景對象圖像嵌入至少一個場景背景圖像中,生成多個合成圖像,包括:
42、將各前景對象圖像中的一個或多個嵌入當前場景背景圖像中,生成所述當前場景背景圖像對應的至少一個合成圖像,所述當前場景背景圖像為任意一個場景背景圖像;
43、根據各場景背景圖像對應的至少一個合成圖像,得到所述多個合成圖像。
44、可選地,所述將至少一個前景對象圖像嵌入至少一個場景背景圖像中,生成多個合成圖像,包括:
45、若當前已嵌入目標場景背景圖像中的前景對象圖像數量未超過預設的嵌入數量上限,則根據當前已嵌入的各前景對象圖像的嵌入位置,將當前待嵌入的前景對象圖像嵌入至所述目標場景背景圖像中,生成當前一個合成圖像。
46、可選地,所述生成多個合成圖像之后,還包括:
47、采用預先訓練的圖像和諧化模型,對各合成圖像中的不協調區域進行修復,得到優化后的合成圖像。
<本文檔來自技高網...【技術保護點】
1.一種圖像處理方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述從獲取的各初始圖像中提取至少一個前景對象圖像,包括:
3.根據權利要求2所述的方法,其特征在于,所述根據各初始圖像以及各初始圖像對應的至少一個前景對象描述信息,采用大語言視覺模型,從各初始圖像中提取各前景對象描述信息對應的各前景對象圖像,包括:
4.根據權利要求1所述的方法,其特征在于,所述根據采集的各場景背景圖像,確定各場景背景圖像對應的場景深度信息,包括:
5.根據權利要求1所述的方法,其特征在于,所述根據所述各場景背景圖像,確定各場景背景圖像中的目標區域,包括:
6.根據權利要求5所述的方法,其特征在于,所述根據所述路面掩膜圖像,確定所述場景背景圖像中的可嵌入區域,包括:
7.根據權利要求6所述的方法,其特征在于,所述根據所述可嵌入區域的邊界信息以及所述場景背景圖像的寬度信息,確定區域比例信息,包括:
8.根據權利要求5所述的方法,其特征在于,所述根據所述區域比例信息以及所述可嵌入區域的邊界信息,確定區域
9.根據權利要求6所述的方法,其特征在于,所述根據所述區域比例信息以及所述可嵌入區域的邊界信息,確定區域分割位置,包括:
10.根據權利要求1所述的方法,其特征在于,所述根據所述各場景背景圖像對應的場景深度信息以及所述各場景背景圖像中的目標區域,將至少一個前景對象圖像嵌入至少一個場景背景圖像中,生成多個合成圖像,包括:
11.根據權利要求1所述的方法,其特征在于,所述將至少一個前景對象圖像嵌入至少一個場景背景圖像中,生成多個合成圖像,包括:
12.根據權利要求1所述的方法,其特征在于,所述將至少一個前景對象圖像嵌入至少一個場景背景圖像中,生成多個合成圖像,包括:
13.根據權利要求1-12任一項所述的方法,其特征在于,所述生成多個合成圖像之后,還包括:
14.根據權利要求13所述的方法,其特征在于,所述圖像和諧化模型的訓練過程包括:
15.一種圖像處理裝置,其特征在于,包括:獲取模塊、確定模塊、嵌入模塊;
16.一種電子設備,其特征在于,包括:處理器、存儲介質和總線,所述存儲介質存儲有所述處理器可執行的程序指令,當電子設備運行時,所述處理器與所述存儲介質之間通過總線通信,所述處理器執行所述程序指令,以實現如權利要求1至14任一項所述的圖像處理方法。
17.一種計算機可讀存儲介質,其特征在于,所述存儲介質上存儲有計算機程序,所述計算機程序被處理器運行時以實現如權利要求1至14任一項所述的圖像處理方法。
...【技術特征摘要】
1.一種圖像處理方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述從獲取的各初始圖像中提取至少一個前景對象圖像,包括:
3.根據權利要求2所述的方法,其特征在于,所述根據各初始圖像以及各初始圖像對應的至少一個前景對象描述信息,采用大語言視覺模型,從各初始圖像中提取各前景對象描述信息對應的各前景對象圖像,包括:
4.根據權利要求1所述的方法,其特征在于,所述根據采集的各場景背景圖像,確定各場景背景圖像對應的場景深度信息,包括:
5.根據權利要求1所述的方法,其特征在于,所述根據所述各場景背景圖像,確定各場景背景圖像中的目標區域,包括:
6.根據權利要求5所述的方法,其特征在于,所述根據所述路面掩膜圖像,確定所述場景背景圖像中的可嵌入區域,包括:
7.根據權利要求6所述的方法,其特征在于,所述根據所述可嵌入區域的邊界信息以及所述場景背景圖像的寬度信息,確定區域比例信息,包括:
8.根據權利要求5所述的方法,其特征在于,所述根據所述區域比例信息以及所述可嵌入區域的邊界信息,確定區域分割位置,基于所述區域分割位置,對所述可嵌入區域進行分割,得到所述目標區域之前,還包括:
9.根據權利要求6所述的方法,其特征在于,所述根據所述區域比例信息以及所述可嵌入區域的邊界信息,確定區域分割位...
【專利技術屬性】
技術研發人員:周俊杰,吳勁峰,彭晨旭,張巧煥,陳瑞生,
申請(專利權)人:浙江中控信息產業股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。