【技術實現步驟摘要】
本專利技術屬于場景圖像文本行定位領域,具體涉及一種基于二叉樹的文本行精確定位方法。
技術介紹
場景圖像中的文本行定位是一種在自然場景環境中拍攝的圖片中對文本行進行定位的技術。該技術針對多語種翻譯、基于內容的網絡搜索、視覺輔助以及無人駕駛等領域均有廣泛的應用。然而在文本行定位過程中,經常會發生文本行的過分割問題,即原本應被檢測為單獨一個文本行的區域,因為定位方法不夠魯棒或場景圖像中非文字噪音與文本行粘連等原因,而被分割成若干不完整的部分,從而造成很多誤檢,使得后續的文字識別效果較差。另外還有一種情況是為了避免文本行趨向欠分割,通常定位方法也會專門令文本行定位過分割化,這是因為文本行的欠分割很難被糾正,而過分割問題卻能夠通過后續的合并等操作對文本行定位進行重置和改善。為了解決文本行過分割的問題,領域內通常采用的方法是為所有文本行的組合方式構建起一個搜索空間,從中選擇出一條最優路徑作為重置后的文本行定位結果,例如集束搜索(beamsearch)方法。但這類方法存在以下缺陷:首先沒有考慮到文本行合并過程的特點,因此沒有構建符合這些特性的數據結構來表示搜索空間。現有的搜索空間通常是利用近乎全排序的方式來對文本行的所有組合方式進行遍歷,然后從中選出一條最優路徑。若有n個文本行,則時間復雜度高達O(n(n-1)/2)=O(n2);此外這些方法還缺乏高效的剪枝、融合策略。領域內文本行重定位方法通常是在搜索空間的每一層中對所有結點排序,然后設定一個固定閾值t作為搜索空間寬度,接著將每層中結點序號排到寬度值之外的結點全部剪去。這種設定固定閾值的剪枝、和并方法缺乏靈活性和合理 ...
【技術保護點】
一種基于二叉樹的文本行精確定位方法,其特征在于:包括以下步驟:步驟A:對于一副輸入的文本行區域被過度分割的自然場景圖像,為所有這些被過度分割的文本行建立搜索空間;其中,文本行被過度分割是指文本行定位過程中產生過多的行分割線,導致單個文本行過度分割成若干部分;行分割線用于標注文本行的邊界位置以同背景區域區分開來;得到用二叉樹表示的搜索空間;步驟B:對于一個用二叉樹表示的搜索空間,二叉樹的結點用邊界位置這個屬性來表示該結點指代的文本行區域組合的范圍,并在待合并位置處分成左、右兩個子結點;所有文本行區域的組合方式都以結點的形式被納入該搜索空間;然后通過模擬二叉樹后序遍歷的方式從搜索空間中構建路徑,其中每條路徑表示一種特定的文本行組合方式;本步驟的目標是從這些路徑中搜索出一條最優路徑來重置文本行的定位,以解決文本行過分割問題;步驟C:對于二叉樹搜索空間中某條路徑上包含的每個結點集,據結點集中父結點及左、右子結點的置信度比較結果在八種剪枝、合并策略中選擇一種合適的情況進行處理,最終得到解決過分割問題的最優路徑,該路徑對應著重置后的文本行精確定位結果。
【技術特征摘要】
1.一種基于二叉樹的文本行精確定位方法,其特征在于:包括以下步驟:步驟A:對于一副輸入的文本行區域被過度分割的自然場景圖像,為所有這些被過度分割的文本行建立搜索空間;其中,文本行被過度分割是指文本行定位過程中產生過多的行分割線,導致單個文本行過度分割成若干部分;行分割線用于標注文本行的邊界位置以同背景區域區分開來;得到用二叉樹表示的搜索空間;步驟B:對于一個用二叉樹表示的搜索空間,二叉樹的結點用邊界位置這個屬性來表示該結點指代的文本行區域組合的范圍,并在待合并位置處分成左、右兩個子結點;所有文本行區域的組合方式都以結點的形式被納入該搜索空間;然后通過模擬二叉樹后序遍歷的方式從搜索空間中構建路徑,其中每條路徑表示一種特定的文本行組合方式;本步驟的目標是從這些路徑中搜索出一條最優路徑來重置文本行的定位,以解決文本行過分割問題;步驟C:對于二叉樹搜索空間中某條路徑上包含的每個結點集,據結點集中父結點及左、右子結點的置信度比較結果在八種剪枝、合并策略中選擇一種合適的情況進行處理,最終得到解決過分割問題的最優路徑,該路徑對應著重置后的文本行精確定位結果。2.根據權利要求1所述的一種基于二叉樹的文本行精確定位方法,其特征在于:所述步驟A的具體步驟如下:步驟A01:輸入文本行被過度分割的自然場景圖像g,其中行分割線包含兩個屬性:位置l和置信度p,位置l指代行分割線位于輸入圖像g中第幾行,置信度p指代行分割線的梯度值,置信度越小則行分割線分離開來的兩文本區域間的差異也越小,故該行分割線越容易導致過分割問題;將二叉樹搜索空間中的結點同自然場景圖像g中的文本行區域一一對應,其中結點包含兩個屬性:邊界位置即結點的左邊界位置ll和右邊界位置lr對應著某一文本行組合的邊界分割線,故邊界位置定義了該文本行組合的范圍,待合并位置即結點的邊界位置內部,具有最大置信度pmax的行分割線的位置lm;步驟A02:在當前文本行范圍內構建父結點n...
【專利技術屬性】
技術研發人員:宋永紅,賀翔,張元林,
申請(專利權)人:西安交通大學,
類型:發明
國別省市:陜西;61
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。