【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及信息
,尤其涉及一種基于專用詞不拆行處理方法和裝置。?
技術(shù)介紹
在文章排版中,一些特定詞語,即專用詞,比如:人名、國名、地名等,通常需要整體排在一行中,不能在行末進行拆分。這樣排版,可以提供良好的閱讀體驗,體現(xiàn)豐富的人文關(guān)懷。?目前,通常情況下是操作人員通過鼠標拖放或鍵盤操作選中文檔中的某個專用詞文本,通過菜單命令,將該專用詞文本的屬性設(shè)置為不可拆分屬性。然而,如果文檔過長,或者文章內(nèi)容發(fā)生變化需要重新設(shè)置,則手動設(shè)置過程極其繁瑣、浪費人力和時間,效率低下。?
技術(shù)實現(xiàn)思路
本專利技術(shù)提供一種基于專用詞不拆行處理方法和裝置,以提高對專用詞在同一行中不拆分的處理效率。?一方面,本專利技術(shù)提供一種專用詞不拆行處理方法,包括:?對文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹配,識別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個關(guān)鍵字以及每個所述關(guān)鍵字相匹配的至少一個專用詞;?根據(jù)所識別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文章段落的換行位置,以使設(shè)定類型的每個所述專用詞中包括的所有字符位于所述段落中的同一行。?另一方面,本專利技術(shù)還提供一種專用詞不拆行處理裝置,包括:?識別模塊,用于根據(jù)預先設(shè)置的專用詞索引表中的關(guān)鍵字,識別文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹?配,識別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個關(guān)鍵字以及每個所述關(guān)鍵字相匹配的至少一個專用詞;?調(diào) ...
【技術(shù)保護點】
一種專用詞不拆行處理方法,其特征在于,包括:對文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹配,識別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個關(guān)鍵字以及每個所述關(guān)鍵字相匹配的至少一個專用詞;根據(jù)所識別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文章段落的換行位置,以使設(shè)定類型的每個所述專用詞中包括的所有字符位于所述段落中的同一行。
【技術(shù)特征摘要】 【專利技術(shù)屬性】
1.一種專用詞不拆行處理方法,其特征在于,包括:
對文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字
的字符進行匹配,識別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個
關(guān)鍵字以及每個所述關(guān)鍵字相匹配的至少一個專用詞;
根據(jù)所識別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)
整所述文章段落的換行位置,以使設(shè)定類型的每個所述專用詞中包括的所有
字符位于所述段落中的同一行。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述專用詞索引表中還包
括:與所述專用詞相匹配的匹配項,所述匹配項包括:所述關(guān)鍵字對應的專
用詞項以及所述關(guān)鍵字在所述專用詞項中的匹配位置信息。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對文章段落換行位置
附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹配,識別出
包括關(guān)鍵字的專用詞之前,還包括:
依次遍歷設(shè)定的專用詞庫確定所述專用詞所屬的分類,所述專用詞庫中
包括專用詞分類、每個分類對應的優(yōu)先級別和是否拆行的忽略標識;每個所
述專用詞分類中包括至少一個專用詞項、每個所述專用詞項的優(yōu)先級別和是
否拆行的忽略標識;
根據(jù)所述專用詞庫中每個專用詞項中的相鄰2個字符,確定所述專用詞
項對應的關(guān)鍵字以及所述關(guān)鍵字在所述專用詞項中的匹配位置信息;
根據(jù)所述專用詞所屬的分類,對應的關(guān)鍵字以及所述關(guān)鍵字在所述專用
詞項中的匹配位置信息,建立所述專用詞索引表。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述專用詞庫中
每個專用詞項中的相鄰2個字符,確定所述專用詞項對應的關(guān)鍵字以及所述
關(guān)鍵字在所述專用詞項中的匹配位置信息之后,還包括:
對于同一關(guān)鍵字對應的多個所述專用詞項,根據(jù)各個所述專用詞項的:
文本長度,分類優(yōu)先級別,分類順序,詞優(yōu)先級別,詞順序,和匹配位置中
的一種或多種,確定該關(guān)鍵字對應的各所述專用詞項的匹配優(yōu)先級。
5.根據(jù)權(quán)利要求1-4任一項所述的方法,其特征在于,所述對文章段落
換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹
\t配,識別出包括關(guān)鍵字的專用詞,具體包括:
從段落中自動換行的第P個字符向前計算所述專用詞識別的起始位置
Ps;
從所述起始位置Ps開始向后,依次識別匹配出是否存在所述關(guān)鍵字中包
括的字符的專用詞,確定識別區(qū)間,直到識別位置大于P;所述識別區(qū)間包
括:所述段落起始字符位置、段落結(jié)束字符位置、識別出的專用詞。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述從段落中自動換行的
第P個字符向前計算所述專用詞識別的起始位置Ps,具體包括:
a1、設(shè)置所述起始位置Ps為所述自動換行位置P減1;
b1、構(gòu)建關(guān)鍵字[字符Ps,字符Ps+1],在所述專用詞索引表中,根據(jù)所
構(gòu)建的關(guān)鍵字查找對應的匹配項,若查找不到,則返回所述起始位置Ps;
c1、根據(jù)所構(gòu)建的關(guān)鍵字在對應的專用詞中的位置和專用詞的文本長度,
確定最大前綴字符個數(shù)L,在所述起始位置Ps開始向前遍歷字符,直到遍歷
到分隔位置或遍歷個數(shù)等于L;
d1、如果遍歷到所述分隔位置,則將所述起始位置Ps設(shè)置為分隔位置后
返回所述起始位置Ps;
e1、如果遍歷個數(shù)等于所述L,則將所述起始位置Ps設(shè)置為Ps減L+1
后轉(zhuǎn)入執(zhí)行所述b1。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述從所述起始位置Ps
開始向后,依次識別匹配出是否存在所述關(guān)鍵字中包括的字符專用詞,確定
識別區(qū)間,直到識別位置大于P,具體包括:
a2、設(shè)置當前識別位置為Pc為所述起始位置Ps;
b2、構(gòu)建關(guān)鍵字[字符Pc,字符Pc+1],在所述專用詞索引表中,根據(jù)
所構(gòu)建的關(guān)鍵字查找對應的匹配項,如果不存在,則將當前識別位置Pc加1,
轉(zhuǎn)入執(zhí)行所述e2;否則,轉(zhuǎn)入執(zhí)行所述c2;
c2、根據(jù)所構(gòu)造的關(guān)鍵字,以及對應的匹配項,對從當前識別位置Pc開
始的段落,按照匹配優(yōu)先級的順序進行專用詞匹配;如果未查找到,則將當
前識別位置Pc加1,轉(zhuǎn)入步驟e2;
d2、確定所述識別區(qū)間,其中,段落起始字符位置為當前識別位置Pc,
技術(shù)研發(fā)人員:楊燕菲,梅林,楊雷鳴,
申請(專利權(quán))人:北大方正集團有限公司,北京北大方正電子有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。