System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本申請涉及文檔處理,尤其涉及一種用于版式文檔的圖片增強(qiáng)方法和裝置、設(shè)備及介質(zhì)。
技術(shù)介紹
1、隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,pdf(portable?document?format,便攜式文檔格式)、caj(一種電子文檔格式,主要用于存儲和展示中國學(xué)術(shù)期刊的電子版內(nèi)容)在越來越多的行業(yè)與領(lǐng)域的各類專業(yè)文獻(xiàn)、工作資料、存檔材料等方方面面被應(yīng)用,以pdf、caj格式為載體的相關(guān)資源數(shù)量急劇增加。相對而來的便是,不同領(lǐng)域的文獻(xiàn)內(nèi)容類型多樣、版式復(fù)雜、生成加工來源復(fù)雜,導(dǎo)致掃描文件內(nèi)容模糊或是文檔中的圖片模糊問題,在pdf、caj文獻(xiàn)內(nèi)屢見不鮮,給閱讀者閱讀帶來極大的困擾。
2、隨著信息技術(shù)的不斷發(fā)展,各種圖片處理技術(shù)也在不斷發(fā)展迭代。市面上各種閱讀器也都或多或少的在產(chǎn)品之中加入對圖片的處理功能,讓用戶可以輕松流暢的閱讀一些復(fù)雜版式的內(nèi)容。ocr(optical?character?recognition,光學(xué)字符識別)技術(shù)便是其中的典型代表,通過ocr技術(shù)對文本進(jìn)行校正重排,能夠?qū)⒛:膾呙杓逦?,從不可閱讀變?yōu)榭砷喿x狀態(tài)。但是這種技術(shù)往往只應(yīng)用在掃描文件中;對于非掃描文件,往往只會通過ocr技術(shù)提供提取圖內(nèi)文本的功能,對于模糊的圖片本身是沒有任何處理的。并且ocr往往只對相對清晰的文本圖片具有較好的識別正確率。這當(dāng)然是可以解決大多數(shù)問題的,但是卻也有其局限與不適宜之處。當(dāng)用戶想要閱讀文獻(xiàn)內(nèi)的原圖時,或者保存圖片以作他用,圖片仍然是模糊不清,不宜閱讀的狀態(tài)。因此,如何將模糊圖片內(nèi)的文本變得清晰,以宜于讀者閱讀或用作ocr識別
技術(shù)實現(xiàn)思路
1、鑒于上述問題,提出了本申請以便提供一種克服上述問題或者至少部分地解決上述問題的一種用于版式文檔的圖片增強(qiáng)方法和裝置、設(shè)備及介質(zhì)。所述技術(shù)方案如下:
2、第一方面,提供了一種用于版式文檔的圖片增強(qiáng)方法,包括:
3、對版式文檔的原始圖片進(jìn)行初始化處理,得到原始圖片的二值圖像;
4、采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域;
5、對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng);
6、對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng);
7、結(jié)合對表格區(qū)域和文本區(qū)域進(jìn)行增強(qiáng)處理后,對增強(qiáng)處理后的圖像進(jìn)行去噪聲處理,輸出增強(qiáng)效果圖。
8、在一種可能的實現(xiàn)方式中,所述初始化處理包括灰度化和二值化。
9、在一種可能的實現(xiàn)方式中,所述預(yù)設(shè)的分割算法包括預(yù)設(shè)的邊緣檢測算法、投影算法、變換算法;采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域,包括:
10、使用預(yù)設(shè)的邊緣檢測算法來識別二值圖像中的邊緣,通過檢測梯度變化來突出二值圖像中的邊界;
11、通過預(yù)設(shè)的投影算法進(jìn)行水平和垂直投影,將二值圖像中的像素累計分布可視化,從而區(qū)分出表格列和文本行;
12、采用預(yù)設(shè)的變換算法檢測二值圖像中的直線結(jié)構(gòu),從而得到二值圖像的表格區(qū)域和文本區(qū)域。
13、在一種可能的實現(xiàn)方式中,對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng),包括:
14、對于表格區(qū)域,使用預(yù)設(shè)的增強(qiáng)邊緣濾波器來提取表格區(qū)域的邊緣信息,再與原始圖片疊加,以此增強(qiáng)表格線條,同時通過調(diào)整銳化程度突出細(xì)節(jié);以及應(yīng)用直方圖均衡化,調(diào)整局部對比度。
15、在一種可能的實現(xiàn)方式中,對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng),包括:
16、對于文本區(qū)域,使用雙邊濾波器對文本區(qū)域進(jìn)行平滑處理,去除背景噪聲,保留邊緣細(xì)節(jié);應(yīng)用局部自適應(yīng)增強(qiáng)策略,通過局部二值化,增強(qiáng)文字部分的清晰度,同時保持背景平滑;以及,根據(jù)文本區(qū)域中字號大小,應(yīng)用與字號大小匹配的增強(qiáng)策略。
17、在一種可能的實現(xiàn)方式中,根據(jù)文本區(qū)域中字號大小,應(yīng)用與字號大小匹配的增強(qiáng)策略,包括:
18、對于字號大小屬于第一大小區(qū)間的文本區(qū)域,應(yīng)用局部對比度增強(qiáng)方法,自適應(yīng)調(diào)整局部對比度;
19、對于字號大小屬于第二大小區(qū)間的文本區(qū)域,使用自適應(yīng)二值化,使得背景噪聲被抑制,而文字部分清晰顯示;并且,進(jìn)行多尺度細(xì)節(jié)增強(qiáng),通過提取和增強(qiáng)不同尺度下的細(xì)節(jié),既保留字體結(jié)構(gòu)又抑制背景雜質(zhì);
20、對于字號大小屬于第三大小區(qū)間的文本區(qū)域,采用精細(xì)化的邊緣檢測與增強(qiáng)方法來提取和強(qiáng)化文字邊緣。
21、在一種可能的實現(xiàn)方式中,對于字號大小屬于第一大小區(qū)間的文本區(qū)域,應(yīng)用局部對比度增強(qiáng)方法,自適應(yīng)調(diào)整局部對比度之后,所述方法還包括:
22、進(jìn)行銳化濾波增強(qiáng)邊緣處理,使文字更加突出。
23、第二方面,提供了一種用于版式文檔的圖片增強(qiáng)裝置,包括:
24、初始化處理單元,用于對版式文檔的原始圖片進(jìn)行初始化處理,得到原始圖片的二值圖像;
25、確定單元,用于采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域;
26、表格區(qū)域增強(qiáng)單元,用于對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng);
27、文本區(qū)域增強(qiáng)單元,用于對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng);
28、輸出單元,用于結(jié)合對表格區(qū)域和文本區(qū)域進(jìn)行增強(qiáng)處理后,對增強(qiáng)處理后的圖像進(jìn)行去噪聲處理,輸出增強(qiáng)效果圖。
29、在一種可能的實現(xiàn)方式中,所述初始化處理包括灰度化和二值化。
30、在一種可能的實現(xiàn)方式中,所述預(yù)設(shè)的分割算法包括預(yù)設(shè)的邊緣檢測算法、投影算法、變換算法;所述確定單元還用于:
31、使用預(yù)設(shè)的邊緣檢測算法來識別二值圖像中的邊緣,通過檢測梯度變化來突出二值圖像中的邊界;
32、通過預(yù)設(shè)的投影算法進(jìn)行水平和垂直投影,將二值圖像中的像素累計分布可視化,從而區(qū)分出表格列和文本行;
33、采用預(yù)設(shè)的變換算法檢測二值圖像中的直線結(jié)構(gòu),從而得到二值圖像的表格區(qū)域和文本區(qū)域。
34、在一種可能的實現(xiàn)方式中,所述表格區(qū)域增強(qiáng)單元還用于:
35、對于表格區(qū)域,使用預(yù)設(shè)的增強(qiáng)邊緣濾波器來提取表格區(qū)域的邊緣信息,再與原始圖片疊加,以此增強(qiáng)表格線條,同時通過調(diào)整銳化程度突出細(xì)節(jié);以及應(yīng)用直方圖均衡化,調(diào)整局部對比度。
36、在一種可能的實現(xiàn)方式中,所述文本區(qū)域增強(qiáng)單元還用于:
37、對于文本區(qū)域,使用雙邊濾波器對文本區(qū)域進(jìn)行平滑處理,去除背景噪聲,保留邊緣細(xì)節(jié);應(yīng)用局部自適應(yīng)增強(qiáng)策略,通過局部二值化,增強(qiáng)文字部分的清晰度,同時保持背景平滑;以及,根據(jù)文本區(qū)域中字號大小,應(yīng)用與字號大小匹配的增強(qiáng)策略。
38、在一本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種用于版式文檔的圖片增強(qiáng)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述初始化處理包括灰度化和二值化。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述預(yù)設(shè)的分割算法包括預(yù)設(shè)的邊緣檢測算法、投影算法、變換算法;采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域,包括:
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng),包括:
5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng),包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)文本區(qū)域中字號大小,應(yīng)用與字號大小匹配的增強(qiáng)策略,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,對于字號大小屬于第一大小區(qū)間的文本區(qū)域,應(yīng)用局部對比度增強(qiáng)方法,自適應(yīng)調(diào)整局部對比度之后,所述方法還包括:
8.一種用于版式文檔的圖片增強(qiáng)裝置,其特征在于,包括
9.一種電子設(shè)備,其特征在于,包括處理器和存儲器,其中,所述存儲器中存儲有計算機(jī)程序,所述處理器被配置為運(yùn)行所述計算機(jī)程序以執(zhí)行權(quán)利要求1至7中任一項所述的用于版式文檔的圖片增強(qiáng)方法。
10.一種存儲介質(zhì),其特征在于,所述存儲介質(zhì)中存儲有計算機(jī)程序,其中,所述計算機(jī)程序被配置為運(yùn)行時執(zhí)行權(quán)利要求1至7中任一項所述的用于版式文檔的圖片增強(qiáng)方法。
...【技術(shù)特征摘要】
1.一種用于版式文檔的圖片增強(qiáng)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述初始化處理包括灰度化和二值化。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述預(yù)設(shè)的分割算法包括預(yù)設(shè)的邊緣檢測算法、投影算法、變換算法;采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域,包括:
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng),包括:
5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng),包括:
6.根據(jù)權(quán)利要求5所...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:徐峰,樊振華,薛德軍,張斌,鄭萍,
申請(專利權(quán))人:同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。