System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 精品无码国产一区二区三区51安,久久无码专区国产精品发布,无码av最新无码av专区
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種用于版式文檔的圖片增強(qiáng)方法和裝置、設(shè)備及介質(zhì)制造方法及圖紙

    技術(shù)編號:44446473 閱讀:4 留言:0更新日期:2025-02-28 18:52
    本申請?zhí)峁┝艘环N用于版式文檔的圖片增強(qiáng)方法和裝置、設(shè)備及介質(zhì),涉及文檔處理技術(shù)領(lǐng)域。該方法基于內(nèi)容的局部增強(qiáng)策略,對文本、表格進(jìn)行不同的增強(qiáng)操作;以及基于幾何特征的增強(qiáng)參數(shù)優(yōu)化,強(qiáng)化文本區(qū)域的增強(qiáng)效果,這樣通過多級增強(qiáng)與融合對模糊的圖片進(jìn)行增強(qiáng),將圖片內(nèi)的文本數(shù)據(jù)清晰化,通過這種方法,讀者可以更加高效的閱讀獲取文獻(xiàn)內(nèi)模糊圖片上的有效數(shù)據(jù);本實施例在提升文本清晰度的同時保持了整體圖像的舒適觀感,避免了過度增強(qiáng)導(dǎo)致的視覺疲勞;并且,能夠更加全面的處理不同的圖像區(qū)域,具有更高的適應(yīng)性和靈活性。

    【技術(shù)實現(xiàn)步驟摘要】

    本申請涉及文檔處理,尤其涉及一種用于版式文檔的圖片增強(qiáng)方法和裝置、設(shè)備及介質(zhì)


    技術(shù)介紹

    1、隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,pdf(portable?document?format,便攜式文檔格式)、caj(一種電子文檔格式,主要用于存儲和展示中國學(xué)術(shù)期刊的電子版內(nèi)容)在越來越多的行業(yè)與領(lǐng)域的各類專業(yè)文獻(xiàn)、工作資料、存檔材料等方方面面被應(yīng)用,以pdf、caj格式為載體的相關(guān)資源數(shù)量急劇增加。相對而來的便是,不同領(lǐng)域的文獻(xiàn)內(nèi)容類型多樣、版式復(fù)雜、生成加工來源復(fù)雜,導(dǎo)致掃描文件內(nèi)容模糊或是文檔中的圖片模糊問題,在pdf、caj文獻(xiàn)內(nèi)屢見不鮮,給閱讀者閱讀帶來極大的困擾。

    2、隨著信息技術(shù)的不斷發(fā)展,各種圖片處理技術(shù)也在不斷發(fā)展迭代。市面上各種閱讀器也都或多或少的在產(chǎn)品之中加入對圖片的處理功能,讓用戶可以輕松流暢的閱讀一些復(fù)雜版式的內(nèi)容。ocr(optical?character?recognition,光學(xué)字符識別)技術(shù)便是其中的典型代表,通過ocr技術(shù)對文本進(jìn)行校正重排,能夠?qū)⒛:膾呙杓逦?,從不可閱讀變?yōu)榭砷喿x狀態(tài)。但是這種技術(shù)往往只應(yīng)用在掃描文件中;對于非掃描文件,往往只會通過ocr技術(shù)提供提取圖內(nèi)文本的功能,對于模糊的圖片本身是沒有任何處理的。并且ocr往往只對相對清晰的文本圖片具有較好的識別正確率。這當(dāng)然是可以解決大多數(shù)問題的,但是卻也有其局限與不適宜之處。當(dāng)用戶想要閱讀文獻(xiàn)內(nèi)的原圖時,或者保存圖片以作他用,圖片仍然是模糊不清,不宜閱讀的狀態(tài)。因此,如何將模糊圖片內(nèi)的文本變得清晰,以宜于讀者閱讀或用作ocr識別的原圖,成為亟待解決的技術(shù)問題。


    技術(shù)實現(xiàn)思路

    1、鑒于上述問題,提出了本申請以便提供一種克服上述問題或者至少部分地解決上述問題的一種用于版式文檔的圖片增強(qiáng)方法和裝置、設(shè)備及介質(zhì)。所述技術(shù)方案如下:

    2、第一方面,提供了一種用于版式文檔的圖片增強(qiáng)方法,包括:

    3、對版式文檔的原始圖片進(jìn)行初始化處理,得到原始圖片的二值圖像;

    4、采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域;

    5、對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng);

    6、對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng);

    7、結(jié)合對表格區(qū)域和文本區(qū)域進(jìn)行增強(qiáng)處理后,對增強(qiáng)處理后的圖像進(jìn)行去噪聲處理,輸出增強(qiáng)效果圖。

    8、在一種可能的實現(xiàn)方式中,所述初始化處理包括灰度化和二值化。

    9、在一種可能的實現(xiàn)方式中,所述預(yù)設(shè)的分割算法包括預(yù)設(shè)的邊緣檢測算法、投影算法、變換算法;采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域,包括:

    10、使用預(yù)設(shè)的邊緣檢測算法來識別二值圖像中的邊緣,通過檢測梯度變化來突出二值圖像中的邊界;

    11、通過預(yù)設(shè)的投影算法進(jìn)行水平和垂直投影,將二值圖像中的像素累計分布可視化,從而區(qū)分出表格列和文本行;

    12、采用預(yù)設(shè)的變換算法檢測二值圖像中的直線結(jié)構(gòu),從而得到二值圖像的表格區(qū)域和文本區(qū)域。

    13、在一種可能的實現(xiàn)方式中,對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng),包括:

    14、對于表格區(qū)域,使用預(yù)設(shè)的增強(qiáng)邊緣濾波器來提取表格區(qū)域的邊緣信息,再與原始圖片疊加,以此增強(qiáng)表格線條,同時通過調(diào)整銳化程度突出細(xì)節(jié);以及應(yīng)用直方圖均衡化,調(diào)整局部對比度。

    15、在一種可能的實現(xiàn)方式中,對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng),包括:

    16、對于文本區(qū)域,使用雙邊濾波器對文本區(qū)域進(jìn)行平滑處理,去除背景噪聲,保留邊緣細(xì)節(jié);應(yīng)用局部自適應(yīng)增強(qiáng)策略,通過局部二值化,增強(qiáng)文字部分的清晰度,同時保持背景平滑;以及,根據(jù)文本區(qū)域中字號大小,應(yīng)用與字號大小匹配的增強(qiáng)策略。

    17、在一種可能的實現(xiàn)方式中,根據(jù)文本區(qū)域中字號大小,應(yīng)用與字號大小匹配的增強(qiáng)策略,包括:

    18、對于字號大小屬于第一大小區(qū)間的文本區(qū)域,應(yīng)用局部對比度增強(qiáng)方法,自適應(yīng)調(diào)整局部對比度;

    19、對于字號大小屬于第二大小區(qū)間的文本區(qū)域,使用自適應(yīng)二值化,使得背景噪聲被抑制,而文字部分清晰顯示;并且,進(jìn)行多尺度細(xì)節(jié)增強(qiáng),通過提取和增強(qiáng)不同尺度下的細(xì)節(jié),既保留字體結(jié)構(gòu)又抑制背景雜質(zhì);

    20、對于字號大小屬于第三大小區(qū)間的文本區(qū)域,采用精細(xì)化的邊緣檢測與增強(qiáng)方法來提取和強(qiáng)化文字邊緣。

    21、在一種可能的實現(xiàn)方式中,對于字號大小屬于第一大小區(qū)間的文本區(qū)域,應(yīng)用局部對比度增強(qiáng)方法,自適應(yīng)調(diào)整局部對比度之后,所述方法還包括:

    22、進(jìn)行銳化濾波增強(qiáng)邊緣處理,使文字更加突出。

    23、第二方面,提供了一種用于版式文檔的圖片增強(qiáng)裝置,包括:

    24、初始化處理單元,用于對版式文檔的原始圖片進(jìn)行初始化處理,得到原始圖片的二值圖像;

    25、確定單元,用于采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域;

    26、表格區(qū)域增強(qiáng)單元,用于對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng);

    27、文本區(qū)域增強(qiáng)單元,用于對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng);

    28、輸出單元,用于結(jié)合對表格區(qū)域和文本區(qū)域進(jìn)行增強(qiáng)處理后,對增強(qiáng)處理后的圖像進(jìn)行去噪聲處理,輸出增強(qiáng)效果圖。

    29、在一種可能的實現(xiàn)方式中,所述初始化處理包括灰度化和二值化。

    30、在一種可能的實現(xiàn)方式中,所述預(yù)設(shè)的分割算法包括預(yù)設(shè)的邊緣檢測算法、投影算法、變換算法;所述確定單元還用于:

    31、使用預(yù)設(shè)的邊緣檢測算法來識別二值圖像中的邊緣,通過檢測梯度變化來突出二值圖像中的邊界;

    32、通過預(yù)設(shè)的投影算法進(jìn)行水平和垂直投影,將二值圖像中的像素累計分布可視化,從而區(qū)分出表格列和文本行;

    33、采用預(yù)設(shè)的變換算法檢測二值圖像中的直線結(jié)構(gòu),從而得到二值圖像的表格區(qū)域和文本區(qū)域。

    34、在一種可能的實現(xiàn)方式中,所述表格區(qū)域增強(qiáng)單元還用于:

    35、對于表格區(qū)域,使用預(yù)設(shè)的增強(qiáng)邊緣濾波器來提取表格區(qū)域的邊緣信息,再與原始圖片疊加,以此增強(qiáng)表格線條,同時通過調(diào)整銳化程度突出細(xì)節(jié);以及應(yīng)用直方圖均衡化,調(diào)整局部對比度。

    36、在一種可能的實現(xiàn)方式中,所述文本區(qū)域增強(qiáng)單元還用于:

    37、對于文本區(qū)域,使用雙邊濾波器對文本區(qū)域進(jìn)行平滑處理,去除背景噪聲,保留邊緣細(xì)節(jié);應(yīng)用局部自適應(yīng)增強(qiáng)策略,通過局部二值化,增強(qiáng)文字部分的清晰度,同時保持背景平滑;以及,根據(jù)文本區(qū)域中字號大小,應(yīng)用與字號大小匹配的增強(qiáng)策略。

    38、在一本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種用于版式文檔的圖片增強(qiáng)方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述初始化處理包括灰度化和二值化。

    3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述預(yù)設(shè)的分割算法包括預(yù)設(shè)的邊緣檢測算法、投影算法、變換算法;采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域,包括:

    4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng),包括:

    5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng),包括:

    6.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)文本區(qū)域中字號大小,應(yīng)用與字號大小匹配的增強(qiáng)策略,包括:

    7.根據(jù)權(quán)利要求6所述的方法,其特征在于,對于字號大小屬于第一大小區(qū)間的文本區(qū)域,應(yīng)用局部對比度增強(qiáng)方法,自適應(yīng)調(diào)整局部對比度之后,所述方法還包括:

    8.一種用于版式文檔的圖片增強(qiáng)裝置,其特征在于,包括

    9.一種電子設(shè)備,其特征在于,包括處理器和存儲器,其中,所述存儲器中存儲有計算機(jī)程序,所述處理器被配置為運(yùn)行所述計算機(jī)程序以執(zhí)行權(quán)利要求1至7中任一項所述的用于版式文檔的圖片增強(qiáng)方法。

    10.一種存儲介質(zhì),其特征在于,所述存儲介質(zhì)中存儲有計算機(jī)程序,其中,所述計算機(jī)程序被配置為運(yùn)行時執(zhí)行權(quán)利要求1至7中任一項所述的用于版式文檔的圖片增強(qiáng)方法。

    ...

    【技術(shù)特征摘要】

    1.一種用于版式文檔的圖片增強(qiáng)方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述初始化處理包括灰度化和二值化。

    3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述預(yù)設(shè)的分割算法包括預(yù)設(shè)的邊緣檢測算法、投影算法、變換算法;采用預(yù)設(shè)的分割算法確定二值圖像的表格區(qū)域和文本區(qū)域,包括:

    4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對于表格區(qū)域,采用基于表格內(nèi)容的局部增強(qiáng)策略對表格區(qū)域進(jìn)行局部增強(qiáng),包括:

    5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,對于文本區(qū)域,采用基于文本內(nèi)容的局部增強(qiáng)策略對文本區(qū)域進(jìn)行局部增強(qiáng),以及基于文本幾何特征的增強(qiáng)參數(shù)優(yōu)化策略對文本區(qū)域進(jìn)行增強(qiáng),包括:

    6.根據(jù)權(quán)利要求5所...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:徐峰樊振華薛德軍張斌鄭萍,
    申請(專利權(quán))人:同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司,
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲另类无码一区二区三区| 亚洲日韩乱码中文无码蜜桃 | 国产在线无码视频一区| 免费人妻av无码专区| 无码人妻一区二区三区在线视频| 日韩av片无码一区二区不卡电影| 亚洲日韩精品无码一区二区三区| 东京热一精品无码AV| 久久亚洲精品成人av无码网站| 午夜亚洲av永久无码精品| 久久精品无码一区二区无码| 亚洲美日韩Av中文字幕无码久久久妻妇| 日韩人妻无码一区二区三区久久| 久久久久久国产精品无码下载| 亚洲精品无码成人| 无码专区狠狠躁躁天天躁 | 亚洲日韩精品无码专区网址| 18禁超污无遮挡无码免费网站国产| 人妻丰满熟妞av无码区| 日韩成人无码中文字幕| 久久人妻少妇嫩草AV无码蜜桃| 亚洲国产精品无码第一区二区三区| 无码丰满少妇2在线观看| 久久老子午夜精品无码怎么打| 国产仑乱无码内谢| 潮喷无码正在播放| 18禁超污无遮挡无码免费网站| 亚洲高清无码在线观看| 高清无码一区二区在线观看吞精 | 亚洲AV中文无码乱人伦| 无码一区二区三区免费视频| 久久久久亚洲AV无码去区首| 亚洲精品无码一区二区| 亚洲AV无码一区二区三区牲色| 亚洲AV无码国产一区二区三区| 无码日韩人妻av一区免费| 成人免费无码大片A毛片抽搐| 无码人妻精品一二三区免费| 高清无码一区二区在线观看吞精| av无码一区二区三区| 中文字幕无码一区二区三区本日|