• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于二叉樹的文本行精確定位方法技術

    技術編號:14766305 閱讀:88 留言:0更新日期:2017-03-08 10:45
    本發明專利技術公開一種基于二叉樹的文本行精確定位方法,1、對于一副輸入的文本行被過度分割的自然場景圖像,為被過度分割的文本行構建二叉樹搜索空間;2、在已構建好的二叉樹搜索空間中模擬后序遍歷的訪問方式來搜索路徑,其中每條路徑都是一個結點集,而最優路徑是對所有結點集來執行剪枝、融合操作后得到的結點集序列;3、剪枝、融合操作為:對于二叉樹搜索空間中某條路徑上包含的每個結點集,據結點集中父結點及左、右子結點的置信度比較結果,可在八種剪枝、合并策略中選擇一種合適的情況進行處理;最終得到解決過分割問題的最優路徑,該路徑對應著重置后的文本行精確定位結果;實現了場景圖像中的文本行精確定位。

    【技術實現步驟摘要】

    本專利技術屬于場景圖像文本行定位領域,具體涉及一種基于二叉樹的文本行精確定位方法
    技術介紹
    場景圖像中的文本行定位是一種在自然場景環境中拍攝的圖片中對文本行進行定位的技術。該技術針對多語種翻譯、基于內容的網絡搜索、視覺輔助以及無人駕駛等領域均有廣泛的應用。然而在文本行定位過程中,經常會發生文本行的過分割問題,即原本應被檢測為單獨一個文本行的區域,因為定位方法不夠魯棒或場景圖像中非文字噪音與文本行粘連等原因,而被分割成若干不完整的部分,從而造成很多誤檢,使得后續的文字識別效果較差。另外還有一種情況是為了避免文本行趨向欠分割,通常定位方法也會專門令文本行定位過分割化,這是因為文本行的欠分割很難被糾正,而過分割問題卻能夠通過后續的合并等操作對文本行定位進行重置和改善。為了解決文本行過分割的問題,領域內通常采用的方法是為所有文本行的組合方式構建起一個搜索空間,從中選擇出一條最優路徑作為重置后的文本行定位結果,例如集束搜索(beamsearch)方法。但這類方法存在以下缺陷:首先沒有考慮到文本行合并過程的特點,因此沒有構建符合這些特性的數據結構來表示搜索空間。現有的搜索空間通常是利用近乎全排序的方式來對文本行的所有組合方式進行遍歷,然后從中選出一條最優路徑。若有n個文本行,則時間復雜度高達O(n(n-1)/2)=O(n2);此外這些方法還缺乏高效的剪枝、融合策略。領域內文本行重定位方法通常是在搜索空間的每一層中對所有結點排序,然后設定一個固定閾值t作為搜索空間寬度,接著將每層中結點序號排到寬度值之外的結點全部剪去。這種設定固定閾值的剪枝、和并方法缺乏靈活性和合理性,無法高效在搜索空間中搜尋到最優路徑。
    技術實現思路
    本專利技術針對上述問題,提供了一種基于二叉樹的文本行精確定位方法,該方法首先為過分割的文本行構建二叉樹搜索空間,然后模擬后序遍歷訪問方式以Olog(n)的復雜度來搜索路徑,接著執行剪枝、合并操作來高效的得到解決過分割問題的最優路徑,該路徑對應著重置、優化后的文本行精確定位結果。為了達到上述目的,本專利技術采用如下技術方案:一種基于二叉樹的文本行精確定位方法,包括以下步驟:步驟A:對于一副輸入的文本行區域被過度分割的自然場景圖像,為所有這些被過度分割的文本行建立搜索空間;其中,文本行被過度分割是指文本行定位過程中產生過多的行分割線,導致單個文本行過度分割成若干部分;行分割線用于標注文本行的邊界位置以同背景區域區分開來;得到用二叉樹表示的搜索空間;步驟B:對于一個用二叉樹表示的搜索空間,二叉樹的結點用邊界位置這個屬性來表示該結點指代的文本行區域組合的范圍,并在待合并位置處分成左、右兩個子結點;所有文本行區域的組合方式都以結點的形式被納入該搜索空間;然后通過模擬二叉樹后序遍歷的方式從搜索空間中構建路徑,其中每條路徑表示一種特定的文本行組合方式;本步驟的目標是從這些路徑中搜索出一條最優路徑來重置文本行的定位,以解決文本行過分割問題;步驟C:對于二叉樹搜索空間中某條路徑上包含的每個結點集,據結點集中父結點及左、右子結點的置信度比較結果可在八種剪枝、合并策略中選擇一種合適的情況進行處理,最終得到解決過分割問題的最優路徑,該路徑對應著重置后的文本行精確定位結果。所述步驟A的具體步驟如下:步驟A01:輸入文本行被過度分割的自然場景圖像g,其中行分割線包含兩個屬性:位置l(指代行分割線位于輸入圖像g中第幾行),置信度p(指代行分割線的梯度值,置信度越小則行分割線分離開來的兩文本區域間的差異也越小,故該行分割線越容易導致過分割問題);將二叉樹搜索空間中的結點同g中的文本行區域一一對應,其中結點包含兩個屬性:邊界位置(結點的左邊界位置ll和右邊界位置lr對應著某一文本行組合的邊界分割線,故邊界位置定義了該文本行組合的范圍),待合并位置(結點的邊界位置內部,具有最大置信度pmax的行分割線的位置lm);步驟A02:在當前文本行范圍內構建父結點np,首先在所有行分割線中選出最外圍的首尾行分割線l1,lend的位置作為父結點的邊界位置ll,lr,由邊界位置可確定該父結點所對應的文本行區域組合的范圍;然后在此范圍內(不包含邊界位置)找到置信度最高pmax的行分割線的位置作為待合并位置lm;步驟A03:構建父結點np的左子結點nl和右子結點nr,用父結點np的待合并位置lm將父結點代表的文本行區域范圍分成左部分partl和右部分partr,分別用左子結點nl和右子結點nr來表示;其中左子結點nl的邊界位置ll*,lr*由父結點的左邊界位置ll及待合并位置lm構成,左子結點nl的待合并位置lm*由左部分partl中置信度最高的行分割線位置獲得;右子結點nr的邊界位置由父結點的待合并位置lm及右邊界位置lr構成,右子結點nr的待合并位置由右部分partr中置信度最高的行分割線位置獲得;步驟A04:將左子結點nl代表的文本行區域范圍作為當前文本行范圍,返回到步驟A02并遞歸地構建二叉樹搜索空間中的結點,直到構建到某一左子結點只存在邊界位置而不含待合并位置時,則令該結點為葉子節點nleaf(不可再分的文本行單位),并返回到該結點的父節點np處;步驟A05:將右子結點nr代表的文本行區域范圍作為當前文本行范圍,返回到步驟A02并遞歸地構建二叉樹搜索空間中的結點,直到構建到某一右子結點只存在邊界位置而不含待合并位置時,則令該結點為葉子節點nleaf(不可再分的文本行單位),并返回到該結點的父節點np處;步驟A06:通過上述步驟,自上而下、自左向右遞歸地構建二叉樹搜索空間,直到最右一個文本行單元作為葉子節點被納入該搜索空間,即建立起覆蓋了所有文本行組合方式的二叉樹搜索空間。所述步驟B具體步驟如下:步驟B01:對二叉樹搜索空間進行后序遍歷,得到對所有結點的訪問順序序列{n1,n2,...,nt本文檔來自技高網
    ...
    一種基于二叉樹的文本行精確定位方法

    【技術保護點】
    一種基于二叉樹的文本行精確定位方法,其特征在于:包括以下步驟:步驟A:對于一副輸入的文本行區域被過度分割的自然場景圖像,為所有這些被過度分割的文本行建立搜索空間;其中,文本行被過度分割是指文本行定位過程中產生過多的行分割線,導致單個文本行過度分割成若干部分;行分割線用于標注文本行的邊界位置以同背景區域區分開來;得到用二叉樹表示的搜索空間;步驟B:對于一個用二叉樹表示的搜索空間,二叉樹的結點用邊界位置這個屬性來表示該結點指代的文本行區域組合的范圍,并在待合并位置處分成左、右兩個子結點;所有文本行區域的組合方式都以結點的形式被納入該搜索空間;然后通過模擬二叉樹后序遍歷的方式從搜索空間中構建路徑,其中每條路徑表示一種特定的文本行組合方式;本步驟的目標是從這些路徑中搜索出一條最優路徑來重置文本行的定位,以解決文本行過分割問題;步驟C:對于二叉樹搜索空間中某條路徑上包含的每個結點集,據結點集中父結點及左、右子結點的置信度比較結果在八種剪枝、合并策略中選擇一種合適的情況進行處理,最終得到解決過分割問題的最優路徑,該路徑對應著重置后的文本行精確定位結果。

    【技術特征摘要】
    1.一種基于二叉樹的文本行精確定位方法,其特征在于:包括以下步驟:步驟A:對于一副輸入的文本行區域被過度分割的自然場景圖像,為所有這些被過度分割的文本行建立搜索空間;其中,文本行被過度分割是指文本行定位過程中產生過多的行分割線,導致單個文本行過度分割成若干部分;行分割線用于標注文本行的邊界位置以同背景區域區分開來;得到用二叉樹表示的搜索空間;步驟B:對于一個用二叉樹表示的搜索空間,二叉樹的結點用邊界位置這個屬性來表示該結點指代的文本行區域組合的范圍,并在待合并位置處分成左、右兩個子結點;所有文本行區域的組合方式都以結點的形式被納入該搜索空間;然后通過模擬二叉樹后序遍歷的方式從搜索空間中構建路徑,其中每條路徑表示一種特定的文本行組合方式;本步驟的目標是從這些路徑中搜索出一條最優路徑來重置文本行的定位,以解決文本行過分割問題;步驟C:對于二叉樹搜索空間中某條路徑上包含的每個結點集,據結點集中父結點及左、右子結點的置信度比較結果在八種剪枝、合并策略中選擇一種合適的情況進行處理,最終得到解決過分割問題的最優路徑,該路徑對應著重置后的文本行精確定位結果。2.根據權利要求1所述的一種基于二叉樹的文本行精確定位方法,其特征在于:所述步驟A的具體步驟如下:步驟A01:輸入文本行被過度分割的自然場景圖像g,其中行分割線包含兩個屬性:位置l和置信度p,位置l指代行分割線位于輸入圖像g中第幾行,置信度p指代行分割線的梯度值,置信度越小則行分割線分離開來的兩文本區域間的差異也越小,故該行分割線越容易導致過分割問題;將二叉樹搜索空間中的結點同自然場景圖像g中的文本行區域一一對應,其中結點包含兩個屬性:邊界位置即結點的左邊界位置ll和右邊界位置lr對應著某一文本行組合的邊界分割線,故邊界位置定義了該文本行組合的范圍,待合并位置即結點的邊界位置內部,具有最大置信度pmax的行分割線的位置lm;步驟A02:在當前文本行范圍內構建父結點n...

    【專利技術屬性】
    技術研發人員:宋永紅賀翔張元林
    申請(專利權)人:西安交通大學
    類型:發明
    國別省市:陜西;61

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码孕妇孕交在线观看| 中文字幕乱码无码人妻系列蜜桃| 亚洲AV无码一区二区三区DV| 亚洲国产日产无码精品| 无码人妻精一区二区三区| 无码精品久久久天天影视| 中文字幕乱码无码人妻系列蜜桃 | 日韩精品无码一区二区三区AV| 久久久无码精品亚洲日韩京东传媒| 亚洲国产AV无码一区二区三区| 小SAO货水好多真紧H无码视频| 免费无码AV电影在线观看| 亚洲AV无码精品国产成人| 久久AV无码精品人妻糸列| 久久久久亚洲av成人无码电影 | 亚洲精品无码专区2| 亚洲高清无码在线观看| 在线看片福利无码网址| 无码人妻少妇色欲AV一区二区| 国产精品无码MV在线观看| 国产精品无码不卡一区二区三区 | 免费无码看av的网站| 亚洲国产成人精品无码区在线秒播 | 精品无码中文视频在线观看| 少妇特殊按摩高潮惨叫无码| 久久精品无码专区免费青青 | 麻豆AV无码精品一区二区| 日本无码WWW在线视频观看| 少妇人妻无码精品视频| 国产AV一区二区三区无码野战| 天码av无码一区二区三区四区| 久久久无码精品人妻一区| 人妻少妇乱子伦无码视频专区| 国产自无码视频在线观看 | 国产成人无码午夜福利软件| 日韩精品无码永久免费网站| 国产人成无码视频在线观看| 国产综合无码一区二区色蜜蜜| 亚洲AV无码资源在线观看| 特级毛片内射www无码| 亚洲av永久无码精品网址|