System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機領域,尤其涉及邊界框確定方法及相關設備。
技術介紹
1、隨著手機技術的高速發展,用戶不再需要通過掃描機等設備,將紙字版的文檔轉換為電子版。用戶可以通過手機將需要的文檔掃描成電子版。
2、在掃描文檔時,需要基于文檔的邊界框進行掃描,以確保文檔中的內容掃描完整,并且不會掃描到文檔以外的內容。在實際應用時,環境中可能存在多個文檔,或者背景的線條較多,導致手機無法確定出需要進行識別的文檔的邊界框。用戶只能手動選擇需要進行識別的文檔的邊界框,以使得手機可以對文檔進行識別。
技術實現思路
1、本申請提供了一種邊界框確定方法及相關設備,實現自動識別待掃描文檔對應的邊界框,并且使得識別出的邊界框更加準確。
2、第一方面,本申請的一些實施例提供了一種邊界框確定方法。該邊界框確定方法可以包括:確定待掃描圖像中的待掃描文檔對應的至少兩個候選邊界框;基于候選邊界框的四個角度、候選邊界框的四條邊、以及候選邊界框對邊的延長線的夾角,確定候選邊界框對應的候選框置信度;將候選框置信度最高的候選邊界框確定為目標邊界框,目標邊界框用于輔助掃描待掃描文檔。
3、通過上述方法,由候選邊界框的四個角度、候選邊界框的四條邊以及候選邊界框對邊的延長線的夾角共同確定候選框置信度,使得確定的候選框置信度更準確,從而通過該候選框置信度確定出的目標邊界框,可以實現自動識別待掃描文檔對應的邊界框,并且使得識別出的邊界框更加準確。
4、在一種可能實現中,基于候選邊界框的四個角
5、通過上述方法,由候選邊界框的四個角度、候選邊界框的四條邊以及候選邊界框對邊的延長線的夾角確定出六個與候選邊界框相關的置信度,由該六個與候選邊界框相關的置信度可以準確地確定出候選框置信度。
6、在一種可能的實現中,候選邊界框對應的候選框置信度為候選邊界框四個角的置信度、候選邊界框占屏比的置信度、候選邊界框對邊比的置信度、候選邊界框鄰邊比的置信度、候選邊界框中心位置的置信度以及候選邊界框對邊角度的置信度之和。
7、通過上述方法,候選邊界框對應的候選框置信度為六個置信度之和,可以更高效,快捷地通過六個置信度確定該候選框置信度。
8、在一種可能的實現中,確定待掃描圖像中的待掃描文檔對應的至少兩個候選邊界框,包括:從待掃描圖像中確定出多條第一直線;以位于第一方位的任意一條第一直線為初始直線,按照預設的遍歷順序,依次遍歷位于除第一方位以外的其余方位上的第一直線,以確定待掃描圖像中的待掃描文檔對應的至少兩個候選邊界框;其中,第一方位為上、下、左、右四個方位中的任意一個方向。
9、通過上述方法,可以確保不會遺漏第一直線,遍歷所有的第一直線。更加可以準確地確定出所有待掃描圖像中的待掃描文檔對應的候選邊界框。
10、在一種可能的實現中,第一直線所位于的方位為第一直線相對于待掃描圖像的橫向中軸線或縱向中軸線的方位。
11、通過上述方法,使得確定出的待掃描圖像中的待掃描文檔對應的候選邊界框的尺寸更接近待掃描圖像。確定出的待掃描圖像中的待掃描文檔對應的候選邊界框更加準確。
12、在一種可能的實現中,候選邊界框的任意一個角的位置坐標位于預設的坐標范圍內,且候選邊界框的任意一個角的角度位于預設的角度范圍內。
13、通過上述方法,通過預設的位置坐標,確保確定出候選邊界框位于屏幕內。并且通過預設的角度范圍,確定該候選邊界框更符合待掃描文檔的形狀。
14、在一種可能的實現中,從待掃描圖像中確定出多條第一直線,包括:將待掃描圖像輸入邊緣掃描模型,以得到多條第二直線;將待掃描圖像輸入直線檢測模型,以得到多條第三直線;基于多條第二直線和多條第三直線,確定多條第一直線。
15、通過上述方法,將待掃描圖像分別輸入兩種模型中,由兩種模型得到的直線,一同確定第一直線,使得確定出的第一直線更準確,且更完整。
16、在一種可能的實現中,將待掃描圖像輸入邊緣掃描模型,以得到多條第二直線,包括:將待掃描圖像輸入邊緣檢測模型,得到邊緣檢測模型輸出的第四直線;將滿足合并條件的第四直線進行合并,得到多條第二直線,合并條件為任意兩條直線的夾角小于第一閾值,或者任意兩條直線的中點距離小于第二閾值;將待掃描圖像輸入直線檢測模型,以得到多條第三直線,包括:將待掃描圖像輸入直線檢測模型,得到直線檢測模型輸出的第五直線;將滿足合并條件的第五直線進行合并,得到多條第三直線。
17、通過上述方法,用兩種模型得到的直線進行交叉篩選,過濾掉與候選邊界框不相關的直線,從而準確地確定出第一直線。
18、在一種可能的實現中,將待掃描圖像分別輸入邊緣檢測模型和直線檢測模型,以得到多條第二直線和多條第三直線,包括:將待掃描圖像輸入邊緣檢測模型,得到邊緣檢測模型輸出的第四直線;將滿足合并條件的第四直線進行合并,得到多條第二直線;將待掃描圖像輸入直線檢測模型,得到直線檢測模型輸出的第五直線;將滿足合并條件的第五直線進行合并,得到多條第三直線;合并條件為任意兩條直線的夾角小于第一閾值,或者任意兩條直線的中點距離小于第二閾值。
19、通過上述方法,將距離相近的直線進行合并,減少得到的第二直線和第三直線的數量,提高后續處理的效率。
20、第二方面,本申請提供了一種電子設備。該電子設備包括:一個或多個處理器,以及一個或多個存儲器;該一個或多個存儲器與該一個或多個處理器耦合,該存儲器用于存儲計算機程序代碼,該計算機程序代碼包括計算機指令,該一個或多個處理器調用該計算機指令以使得該電子設備執行如第一方面或第一方面的任意一種實現方式所描述的方法。
21、第三方面,本申請提供一種計算機存儲介質。該計算機存儲介質包括計算機指令,當該計算機指令在電子設備上運行時,使得該電子設備執行如第一方面或第一方面的任意一種實現方式所描述的方法。
22、第四方面,本申請實施例提供一種芯片。該芯片可以應用于電子設備,該芯片包括一個或多個處理器,該處理器用于調用計算機指令以使得該電子設備執行如第一方面或第一方面的任意一種實現方式所描述的方法。
23、第五方面,本申請提供一種計算機程序或計算機程序產品,包括代碼或指令,當代碼或指令在計算機上運行時,使得計算機執行如上述第一方面所述的方法。
...【技術保護點】
1.一種邊界框確定方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述基于所述候選邊界框的四個角度、所述候選邊界框的四條邊、以及所述候選邊界框對邊的延長線的夾角,確定所述候選邊界框對應的候選框置信度,包括:
3.根據權利要求2所述的方法,其特征在于,所述候選邊界框對應的候選框置信度為所述候選邊界框四個角的置信度、所述候選邊界框占屏比的置信度、所述候選邊界框對邊比的置信度、所述候選邊界框鄰邊比的置信度、所述候選邊界框中心位置的置信度以及所述候選邊界框對邊角度的置信度之和。
4.根據權利要求1-3中任意一項所述的方法,其特征在于,所述確定待掃描圖像中的待掃描文檔對應的至少兩個候選邊界框,包括:
5.根據權利要求4所述的方法,其特征在于,所述第一直線所位于的方位為所述第一直線相對于所述待掃描圖像的橫向中軸線或縱向中軸線的方位。
6.根據權利要求1-5中任意一項所述的方法,其特征在于,所述候選邊界框的任意一個角的位置坐標位于預設的坐標范圍內,且所述候選邊界框的任意一個角的角度位于預設的角度范圍內。
...【技術特征摘要】
1.一種邊界框確定方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述基于所述候選邊界框的四個角度、所述候選邊界框的四條邊、以及所述候選邊界框對邊的延長線的夾角,確定所述候選邊界框對應的候選框置信度,包括:
3.根據權利要求2所述的方法,其特征在于,所述候選邊界框對應的候選框置信度為所述候選邊界框四個角的置信度、所述候選邊界框占屏比的置信度、所述候選邊界框對邊比的置信度、所述候選邊界框鄰邊比的置信度、所述候選邊界框中心位置的置信度以及所述候選邊界框對邊角度的置信度之和。
4.根據權利要求1-3中任意一項所述的方法,其特征在于,所述確定待掃描圖像中的待掃描文檔對應的至少兩個候選邊界框,包括:
5.根據權利要求4所述的方法,其特征在于,所述第一直線所位于的方位為所述第一直線相對于所述待掃描圖像的橫向中軸線或縱向中軸線的方位。
6.根據權利要求1-5中任意一項所述的方法,其特征在于,...
【專利技術屬性】
技術研發人員:張馳,孫斌,劉夢倩,宓振鵬,
申請(專利權)人:榮耀終端股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。