System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 免费人妻无码不卡中文字幕系,精品国精品无码自拍自在线,亚洲成AV人片在线播放无码
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種PDF文件目錄書簽生成方法及裝置制造方法及圖紙

    技術編號:44496150 閱讀:5 留言:0更新日期:2025-03-04 18:03
    本發明專利技術涉及文檔數據處理技術領域,公開了一種PDF文件目錄書簽生成方法及裝置,該方法包括:獲取PDF電子文件,對PDF電子文件中的目錄頁進行識別,得到目錄頁文字;提取目錄頁文字中的文字字段,對文字字段進行標識分級,得到組合處理后的文字字段;提取目錄頁文字中的印刷頁碼,基于印刷頁碼確定電子文件頁碼;將組合處理后的文字字段、印刷頁碼和電子文件頁碼進行組合,得到PDF文件目錄書簽。本發明專利技術實現了PDF文件目錄書簽的重建,利用PDF文件目錄書簽可以實現對章節的快速定位以及與文檔結構的了解,增強了閱讀體驗。

    【技術實現步驟摘要】

    本專利技術涉及文檔數據處理,具體涉及一種pdf文件目錄書簽生成方法及裝置。


    技術介紹

    1、pdf(portable?document?format,可攜帶文件格式)文件被廣泛使用,比如各種圖書、說明書。在閱讀pdf文件內容時,pdf文件的目錄書簽可以快速定位特定章節、了解文檔結構,增強閱讀體驗。

    2、pdf文件有以下兩大特征:由紙質文件掃描而成;紙質文件本身帶有目錄頁面,該目錄頁面已經帶有非常準確的目錄信息;但是,相關的pdf目錄生成方不能針對pdf文件的兩大特征在pdf文件中重建目錄書簽,導致紙質文件轉成的pdf文件的可讀性較差。


    技術實現思路

    1、有鑒于此,本專利技術提供了一種pdf文件目錄書簽生成方法及裝置,以解決相關的pdf目錄生成方不能針對pdf文件的兩大特征在pdf文件中重建目錄書簽的問題。

    2、第一方面,本專利技術提供了一種pdf文件目錄書簽生成方法,該方法包括:

    3、獲取pdf電子文件,對pdf電子文件中的目錄頁進行識別,得到目錄頁文字;

    4、提取目錄頁文字中的文字字段,對文字字段進行標識分級,得到組合處理后的文字字段;

    5、提取目錄頁文字中的印刷頁碼,基于印刷頁碼確定電子文件頁碼;

    6、將組合處理后的文字字段、印刷頁碼和電子文件頁碼進行組合,得到pdf文件目錄書簽。

    7、本實施例提供的一種pdf文件目錄書簽生成方法,通過對pdf電子文件中的目錄頁進行識別,得到目錄頁文字,提取目錄頁文字中的文字字段和印刷頁碼,進而對文字字段和印刷頁碼分別進行分析處理,將組合處理后的文字字段、印刷頁碼和電子文件頁碼進行組合,得到pdf文件目錄書簽,針對由紙質文件掃描轉成的pdf文件,利用pdf文件自身的特征,對原文檔中的目錄頁進行重建,形成的pdf文件目錄書簽更加準確,提高了pdf文件目錄書簽的生成效率,用戶可以實現對章節的快速定位以及與文檔結構的了解,增強了閱讀體驗。

    8、在一種可選的實施方式中,提取目錄頁文字中的文字字段,對文字字段進行標識分級,得到組合處理后的文字字段,包括:

    9、提取目錄頁文字中的文字字段,基于文字字段提取數字章節號;

    10、對數字章節號進行分級,得到文字字段的級別;

    11、基于文字字段的級別,在文字字段前添加前置空格,生成組合處理后的文字字段。

    12、本實施例提供的一種pdf文件目錄書簽生成方法,通過對數字章節號進行分級,得到文字字段的級別,進而根據文字字段的級別,在文字字段前添加前置空格,生成組合處理后的文字字段,使得pdf文件目錄書簽帶有分級結構,能夠幫助用戶快速定位特定章節,了解文檔結構,增強閱讀體驗。

    13、在一種可選的實施方式中,對數字章節號進行分級,得到文字字段的級別,包括:

    14、獲取判斷函數,利用判斷函數確定數字章節號中的句點數量,并基于句點數量確定文字字段的級別。

    15、在一種可選的實施方式中,提取目錄頁文字中的印刷頁碼,基于印刷頁碼確定電子文件頁碼,包括:

    16、獲取預設數值,基于印刷頁碼和預設數值確定電子文件頁碼。

    17、在一種可選的實施方式中,將組合處理后的文字字段、印刷頁碼和電子文件頁碼進行組合,得到pdf文件目錄書簽,包括:

    18、獲取目錄書簽文本格式,按照目錄書簽文本格式,將組合處理后的文字字段、印刷頁碼和電子文件頁碼進行組合,得到組合文本;

    19、將組合文本存儲為txt文件,并基于txt文件建立pdf文件目錄書簽。

    20、本實施例提供的一種pdf文件目錄書簽生成方法,通過將組合處理后的文字字段、印刷頁碼和電子文件頁碼組合形成的組合文本存儲為txt文件,進而基于txt文件建立pdf文件目錄書簽,實現了對pdf文件目錄書簽格式的規范處理,使得生成的pdf文件目錄書簽可直接應用于pdf文件。

    21、在一種可選的實施方式中,在提取目錄頁文字中的文字字段,對文字字段進行標識分級,得到組合處理后的文字字段之前,還包括:

    22、對目錄頁文字的進行雜質去除,得到凈化后的目錄頁文字。

    23、本實施例提供的一種pdf文件目錄書簽生成方法,通過去除目錄頁文字中的雜質,使得后續對pdf文件中文字字段和印刷頁碼的處理更加精確,實現了對pdf文件目錄書簽的準確重建。

    24、第二方面,本專利技術提供了一種pdf文件目錄書簽生成裝置,該裝置包括:

    25、識別模塊,用于獲取pdf電子文件,對pdf電子文件中的目錄頁進行識別,得到目錄頁文字;

    26、分級模塊,用于提取目錄頁文字中的文字字段,對文字字段進行標識分級,得到組合處理后的文字字段;

    27、確定模塊,用于提取目錄頁文字中的印刷頁碼,基于印刷頁碼確定電子文件頁碼;

    28、組合模塊,用于將組合處理后的文字字段、印刷頁碼和電子文件頁碼進行組合,得到pdf文件目錄書簽。

    29、第三方面,本專利技術提供了一種計算機設備,包括:存儲器和處理器,存儲器和處理器之間互相通信連接,存儲器中存儲有計算機指令,處理器通過執行計算機指令,從而執行上述第一方面或其對應的任一實施方式的pdf文件目錄書簽生成方法。

    30、第四方面,本專利技術提供了一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲有計算機指令,計算機指令用于使計算機執行上述第一方面或其對應的任一實施方式的pdf文件目錄書簽生成方法。

    31、第五方面,本專利技術提供了一種計算機程序產品,包括計算機指令,計算機指令用于使計算機執行上述第一方面或其對應的任一實施方式的pdf文件目錄書簽生成方法。

    本文檔來自技高網...

    【技術保護點】

    1.一種PDF文件目錄書簽生成方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的方法,其特征在于,所述提取所述目錄頁文字中的文字字段,對所述文字字段進行標識分級,得到組合處理后的文字字段,包括:

    3.根據權利要求2所述的方法,其特征在于,所述對所述數字章節號進行分級,得到文字字段的級別,包括:

    4.根據權利要求1所述的方法,其特征在于,所述提取所述目錄頁文字中的印刷頁碼,基于所述印刷頁碼確定電子文件頁碼,包括:

    5.根據權利要求1所述的方法,其特征在于,所述將所述組合處理后的文字字段、所述印刷頁碼和所述電子文件頁碼進行組合,得到PDF文件目錄書簽,包括:

    6.根據權利要求1所述的方法,其特征在于,在所述提取所述目錄頁文字中的文字字段,對所述文字字段進行標識分級,得到組合處理后的文字字段之前,還包括:

    7.一種PDF文件目錄書簽生成裝置,其特征在于,所述裝置包括:

    8.一種計算機設備,其特征在于,包括:

    9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機指令,所述計算機指令用于使計算機執行權利要求1至6中任一項所述的PDF文件目錄書簽生成方法。

    10.一種計算機程序產品,其特征在于,包括計算機指令,所述計算機指令用于使計算機執行權利要求1至6中任一項所述的PDF文件目錄書簽生成方法。

    ...

    【技術特征摘要】

    1.一種pdf文件目錄書簽生成方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的方法,其特征在于,所述提取所述目錄頁文字中的文字字段,對所述文字字段進行標識分級,得到組合處理后的文字字段,包括:

    3.根據權利要求2所述的方法,其特征在于,所述對所述數字章節號進行分級,得到文字字段的級別,包括:

    4.根據權利要求1所述的方法,其特征在于,所述提取所述目錄頁文字中的印刷頁碼,基于所述印刷頁碼確定電子文件頁碼,包括:

    5.根據權利要求1所述的方法,其特征在于,所述將所述組合處理后的文字字段、所述印刷頁碼和所述電子文件頁碼進行組合,得到pdf文件目錄書簽,包括:

    【專利技術屬性】
    技術研發人員:任東輝韓安鳳楊梅謝駿錦王正
    申請(專利權)人:上海勘測設計研究院有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 久久精品亚洲AV久久久无码| 日韩AV无码中文无码不卡电影| 久久亚洲中文无码咪咪爱| 亚洲av无码成人精品国产| 一级片无码中文字幕乱伦| 无码AV中文一区二区三区| 成人免费无码大片A毛片抽搐| 亚洲AV无码成人精品区天堂| 国产成人亚洲精品无码AV大片 | 熟妇无码乱子成人精品| 性色av极品无码专区亚洲| 亚洲AV无码一区二区三区DV| 惠民福利中文字幕人妻无码乱精品| 无码夫の前で人妻を犯す中字 | 久久久久亚洲AV无码专区桃色| 午夜无码国产理论在线| 亚洲永久无码3D动漫一区| 免费无码午夜福利片| 蜜臀AV无码一区二区三区| 婷婷四虎东京热无码群交双飞视频| 日韩av无码中文无码电影| 亚洲国产精品无码久久九九 | 国产精品无码成人午夜电影| 亚洲国产成人精品无码久久久久久综合| 亚洲最大中文字幕无码网站| 久久久久久精品无码人妻| 日韩人妻无码精品久久免费一| 亚洲国产精品无码专区影院| 国内精品无码一区二区三区| 日韩精品无码一区二区视频| 国产无码网页在线观看| 亚洲AV无码一区二三区 | 国产在线无码不卡影视影院 | 亚洲国产成人无码AV在线影院| 无码精品黑人一区二区三区| 日韩精品无码免费一区二区三区| 亚洲Av综合色区无码专区桃色 | 亚洲AV无码乱码精品国产| 国产精品无码一区二区三区在| 无码一区18禁3D| 一道久在线无码加勒比|