【技術實現步驟摘要】
改進FANnet生成網絡的圖像字符編輯方法
本專利技術屬于圖像識別
,特別是涉及一種改進FANnet生成網絡的圖像字符編輯方法。
技術介紹
當今國際化社會,作為國際通用語言的英文字符出現在眾多公共場合;與英文字符具有相同幾何結構特征的拼音字符也很重要。當這些字符出現在圖像中,尤其圖像風格復雜時,難以直接對其進行編輯修改。字體風格遷移與文字生成是人工智能的一個重要研究領域。不論是實景圖還是電子效果圖,總包含有大量文字信息。這些文字信息可以幫助讀者更好理解圖像中的上下文語義和場景信息。與文本中修改編輯文字不同,當一幅圖像中的文字發生錯誤或需要修改時,直接在原圖中進行修改非常困難。例如,一幅圖像包含的有限文字中,可以提取的視覺信息數據不滿足生成模型所需條件;在不同自然場景下,圖像往往呈現出不同特征:亮度、對比度、陰影、透視形變和背景復雜度等。文字字體設計要求數據集內每一種文字的風格相同且具視覺一致性,建立這樣的數據集往往需要消耗大量的人力和物力。如何通過有限規模的字符集,使計算機自動生成與源字符具有相同物理結構和視覺效果的其他字符是當前的研究熱點。研究人員對圖像文字的研究主要集中于文字識別方向,2005年,楊志華等人提出一種基于經驗模式分解的漢字識別方法,通過對漢字常用筆畫精簡,做EMD分析,從而提出特征識別漢字。2011年,易劍等人提出一種基于顏色聚類和多幀融合的視頻文字識別方法,2017年,丁明宇等人提出一種將深度學習和OCR相融合的一種商品參數文字檢測方法。而針對文字生成研究領域,最先采用的是基于幾何特 ...
【技術保護點】
1.改進FANnet生成網絡的圖像字符編輯方法,其特征在于,所述方法包括以下步驟:/n(1)從圖像中選擇欲替換的源字母,并通過HC顯著性檢測算法和自定義閾值分割算法的自適應目標檢測模型提取源字母的二值圖;/n(2)通過FANnet生成網絡生成與源字符字體結構一致的目標字符二值圖。;/n(3)通過基于顏色復雜度的自適應局部顏色遷移模型對已得目標二值圖進行顏色遷移后將源字母替換為生成字母。/n
【技術特征摘要】
1.改進FANnet生成網絡的圖像字符編輯方法,其特征在于,所述方法包括以下步驟:
(1)從圖像中選擇欲替換的源字母,并通過HC顯著性檢測算法和自定義閾值分割算法的自適應目標檢測模型提取源字母的二值圖;
(2)通過FANnet生成網絡生成與源字符字體結構一致的目標字符二值圖。;
(3)通過基于顏色復雜度的自適應局部顏色遷移模型對已得目標二值圖進行顏色遷移后將源字母替換為生成字母。
2.根據權利要求1所述的字符編輯方法,其特征在于,步驟(1)中自適應目標檢測模型為:
Δ(T)=Sr(THC)-Sr(TB)(7)
式中,IHC代表原圖I經過HC算法處理后的的二值圖;IB代表區域Ω的二值圖,T代表區域Ω內的一個連通分量,Sr(.)代表對區域Ω經過源字母提取后的最小邊界框,BT為連通分量的最小邊界值;
源字母二值圖定義為:
圖像If包含選定區域Ω內所有的字母二值圖。IM代表原圖I經過MSER算法處理后得到的二值圖;⊙代表矩陣的元素積。
3.根據權利要求2所述的字符編輯方法,其特征在于,基于顏色直方圖對比度(HC)的目標檢測算法為:
首先,將區域Ω規則化為Ω’作為HC的輸入:
式中,map(.)分別代表區域Ω’;P代表區域Ω的四個定點坐標值,
在區域Ω’內有:
式中,R(.)表示顏色ci在區域Ω’內的顯著值;n為區域Ω’內所含的顏色總數,wj表示顏色cj的權重,Dis(ci,cj)表示顏色ci和cj在CIEL*a*b*空間內的顏色距離度量,具體表示為:
式中,num(.)表示cj在區域Ω’出現的次數;表示cj在CIEL*a*b*空間中第k個分量的值;
使用平滑操作將相似顏色的顯著值進行加權平均成為一個顏色集:
式中,表示顏色c與它相似值最高的k個顏色的距離度量,k取n的25%;
最后將顏色集的顯著值按照其在空間像素點的實際位置還原提取出區域Ω’中的顯著性目標,采用高斯濾波和像素值歸一化對結果圖進行平滑操作,減少噪聲,得到經過HC操作后的字母灰度圖后,采用OTSU算法對其進行二值化處理,得到二值掩碼圖IHC。
4.根據權利要求1所述的字符編輯方法,其特征在于,步驟(2)包括圖像預處理,采用填充操作使獲得相同橫縱比mθ×mθ,其中,mθ=max(hθ,wθ),hθ和wθ分別代表邊界框Bθ的長和寬;max(.)代表取二者較大值,即沿x軸和y軸分別用px和py填充生成規則化二值圖Iθ。其中,px和py滿足:
隨后,對Iθ進行縮放操作,使其維度為64×64。
5.根據權利要求4所述的字符編輯方法,其特征在于,字體自適應生成神經網絡含有兩個不同的輸入,分別是尺寸為64×64的源字母二值圖和目標字母的標簽,在網絡的編碼部分,輸入的源字母圖像通過濾波器分別為16、16和1的3個卷積層...
【專利技術屬性】
技術研發人員:劉尚旺,李名,劉國奇,袁培燕,孫林,
申請(專利權)人:河南師范大學,
類型:發明
國別省市:河南;41
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。