• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    專用詞不拆行處理方法和裝置制造方法及圖紙

    技術(shù)編號:11362552 閱讀:51 留言:0更新日期:2015-04-29 13:06
    本發(fā)明專利技術(shù)提供一種基于專用詞不拆行處理方法和裝置,對文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹配,識別出包括關(guān)鍵字的專用詞,再根據(jù)所識別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文章段落的換行位置,以使設(shè)定類型的每個所述專用詞中包括的所有字符位于所述段落中的同一行。從而提高對專用詞在同一行中不拆分的處理效率。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及信息
    ,尤其涉及一種基于專用詞不拆行處理方法和裝置。?
    技術(shù)介紹
    在文章排版中,一些特定詞語,即專用詞,比如:人名、國名、地名等,通常需要整體排在一行中,不能在行末進行拆分。這樣排版,可以提供良好的閱讀體驗,體現(xiàn)豐富的人文關(guān)懷。?目前,通常情況下是操作人員通過鼠標拖放或鍵盤操作選中文檔中的某個專用詞文本,通過菜單命令,將該專用詞文本的屬性設(shè)置為不可拆分屬性。然而,如果文檔過長,或者文章內(nèi)容發(fā)生變化需要重新設(shè)置,則手動設(shè)置過程極其繁瑣、浪費人力和時間,效率低下。?
    技術(shù)實現(xiàn)思路
    本專利技術(shù)提供一種基于專用詞不拆行處理方法和裝置,以提高對專用詞在同一行中不拆分的處理效率。?一方面,本專利技術(shù)提供一種專用詞不拆行處理方法,包括:?對文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹配,識別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個關(guān)鍵字以及每個所述關(guān)鍵字相匹配的至少一個專用詞;?根據(jù)所識別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文章段落的換行位置,以使設(shè)定類型的每個所述專用詞中包括的所有字符位于所述段落中的同一行。?另一方面,本專利技術(shù)還提供一種專用詞不拆行處理裝置,包括:?識別模塊,用于根據(jù)預先設(shè)置的專用詞索引表中的關(guān)鍵字,識別文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹?配,識別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個關(guān)鍵字以及每個所述關(guān)鍵字相匹配的至少一個專用詞;?調(diào)整模塊,用于根據(jù)所識別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文章段落的換行位置,以使設(shè)定類型的每個所述專用詞中包括的所有字符位于所述段落中的同一行。?本專利技術(shù)提供一種基于專用詞不拆行處理方法和裝置,對文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹配,識別出包括關(guān)鍵字的專用詞,再根據(jù)所識別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文章段落的換行位置,以使設(shè)定類型的每個所述專用詞中包括的所有字符位于所述段落中的同一行。從而提高對專用詞在同一行中不拆分的處理效率。?附圖說明為了更清楚地說明本專利技術(shù)實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本專利技術(shù)的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。?圖1為本專利技術(shù)提供的專用詞不拆行處理方法一個實施例的流程圖;?圖2為本專利技術(shù)提供的專用詞索引表的示意圖;?圖3為本專利技術(shù)提供的專用詞不拆行處理方法專用詞處理效果示意圖;?圖4為本專利技術(shù)提供的專用詞不拆行處理裝置一個實施例的結(jié)構(gòu)示意圖;?圖5為本專利技術(shù)提供的專用詞不拆行處理裝置又一個實施例的結(jié)構(gòu)示意圖。?具體實施方式為使本專利技術(shù)實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本專利技術(shù)實施例中的附圖,對本專利技術(shù)實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本專利技術(shù)一部分實施例,而不是全部的實施例。基于本專利技術(shù)中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本專利技術(shù)保護的范圍。?圖1為本專利技術(shù)提供的專用詞不拆行處理方法一個實施例的流程圖,如圖1所示,該方法包括:?S101、對文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹配,識別出包括關(guān)鍵字的專用詞,專用詞索引表包括多個關(guān)鍵字以及每個關(guān)鍵字相匹配的至少一個專用詞;?S102、根據(jù)所識別出的專用詞中所包括的字符與換行位置的位置關(guān)系,調(diào)整文章段落的換行位置,以使設(shè)定類型的每個專用詞中包括的所有字符位于段落中的同一行。?一方面,可以預先創(chuàng)建并維護專用詞庫,分類管理專用詞。?其中,該專用詞庫中可以包括多個專用詞分類,例如:地名分類,國家分類,名人分類等等。每個專用詞分類可以包含下列內(nèi)容:?分類名稱,指定該專用詞分類的名稱;?分類對應的優(yōu)先級別,指在段落換行處,該專用詞分類中專用詞項的匹配優(yōu)先次序;?忽略標記,指在段落換行處,該專用詞分類中專用詞項是否允許拆行;?專用詞項(M個,M≥0),指在該專用詞分類中包括的專用詞。?進一步的,專用詞項中包括下列內(nèi)容:文本,指定該專用詞項的內(nèi)容;優(yōu)先級別,指在段落拆行處,該專用詞項的匹配優(yōu)先次序;忽略標記,指在段落拆行處,該專用詞項是否允許拆行。?另一方面,基于專用詞庫,可以預先建立專用詞索引表,該專用詞索引表包括多個專用詞索引項,專用詞索引項包含以下內(nèi)容:關(guān)鍵字以及每個關(guān)鍵字相匹配的匹配項。其中,關(guān)鍵字,指該專用詞索引項的檢索關(guān)鍵字,為專用詞項的文本中相鄰的2個字符;匹配項(N個,N≥0),指定該專用詞索引項對應的匹配項數(shù)組,可以按照計算出匹配項的優(yōu)先級從高到低的順序進行排序。?可以通過以下步驟來建立專用詞索引表:依次遍歷設(shè)定的專用詞庫確定專用詞所屬的分類,專用詞庫中包括專用詞分類、每個分類對應的優(yōu)先級別和是否拆行的忽略標識;每個專用詞分類中包括至少一個專用詞項、每個專用詞項的優(yōu)先級別和是否拆行的忽略標識;根據(jù)專用詞庫中每個專用詞項中的相鄰2個字符,確定專用詞項對應的關(guān)鍵字以及關(guān)鍵字在專用詞項中的匹?配位置信息;根據(jù)專用詞所屬的分類,對應的關(guān)鍵字以及關(guān)鍵字在專用詞中的匹配位置信息,建立專用詞索引表。?具體的,對于當前專用詞項的文本中的第N組相鄰字符,構(gòu)建新的關(guān)鍵字[字符N,字符N+1],構(gòu)建新的匹配項,將其專用詞項指針設(shè)置為當前專用詞項,匹配位置設(shè)置為N;在專用詞索引表中,根據(jù)新的關(guān)鍵字查找對應的專用詞索引項,如果找到,將當前的專用詞索引項設(shè)置為找到的專用詞索引項,轉(zhuǎn)入執(zhí)行:計算出新的匹配項的優(yōu)先級,并按照高低順序,加入到當前的專用詞索引項;否則,轉(zhuǎn)入執(zhí)行:構(gòu)建新的專用詞索引項,設(shè)置其關(guān)鍵字為新的關(guān)鍵字,其匹配項數(shù)組為空,加入專用詞索引表,并將當前的專用詞索引項設(shè)置為新的專用詞索引項。?可選的,對于同一關(guān)鍵字對應的多個專用詞項,還可以根據(jù)各個專用詞項的:文本長度,分類優(yōu)先級別,分類順序,詞優(yōu)先級別,詞順序,和匹配位置中的一種或多種,確定該關(guān)鍵字對應的各專用詞項的匹配優(yōu)先級。?其中,文本長度,指定對應的專用詞項的文本長度;分類優(yōu)先級別,指定對應的專用詞分類的優(yōu)先級別;分類順序,指定對應的專用詞分類在庫中的位置;詞優(yōu)先級別,指定對應的專用詞項的優(yōu)先級別;詞順序,指定對應的專用詞項在分類中的位置;匹配位置,指定該匹配項的匹配位置。?其中,優(yōu)先級的比較可以按照文本長度,分類優(yōu)先級別,分類順序,詞優(yōu)先級別,詞順序,和匹配位置的順序依次進行,例如:文本長度越大,優(yōu)先級越高;分類級別越高,優(yōu)先級越高;分類順序越靠前,優(yōu)先級越高;匹配位置越靠后,優(yōu)先級越高。?專用詞索引表可以如下表一所示,同時參見圖2:?上表中包括多個關(guān)鍵字,例如:郁金,金香,庫本文檔來自技高網(wǎng)...

    【技術(shù)保護點】
    一種專用詞不拆行處理方法,其特征在于,包括:對文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹配,識別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個關(guān)鍵字以及每個所述關(guān)鍵字相匹配的至少一個專用詞;根據(jù)所識別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)整所述文章段落的換行位置,以使設(shè)定類型的每個所述專用詞中包括的所有字符位于所述段落中的同一行。

    【技術(shù)特征摘要】
    1.一種專用詞不拆行處理方法,其特征在于,包括:
    對文章段落換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字
    的字符進行匹配,識別出包括關(guān)鍵字的專用詞,所述專用詞索引表包括多個
    關(guān)鍵字以及每個所述關(guān)鍵字相匹配的至少一個專用詞;
    根據(jù)所識別出的專用詞中所包括的字符與所述換行位置的位置關(guān)系,調(diào)
    整所述文章段落的換行位置,以使設(shè)定類型的每個所述專用詞中包括的所有
    字符位于所述段落中的同一行。
    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述專用詞索引表中還包
    括:與所述專用詞相匹配的匹配項,所述匹配項包括:所述關(guān)鍵字對應的專
    用詞項以及所述關(guān)鍵字在所述專用詞項中的匹配位置信息。
    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對文章段落換行位置
    附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹配,識別出
    包括關(guān)鍵字的專用詞之前,還包括:
    依次遍歷設(shè)定的專用詞庫確定所述專用詞所屬的分類,所述專用詞庫中
    包括專用詞分類、每個分類對應的優(yōu)先級別和是否拆行的忽略標識;每個所
    述專用詞分類中包括至少一個專用詞項、每個所述專用詞項的優(yōu)先級別和是
    否拆行的忽略標識;
    根據(jù)所述專用詞庫中每個專用詞項中的相鄰2個字符,確定所述專用詞
    項對應的關(guān)鍵字以及所述關(guān)鍵字在所述專用詞項中的匹配位置信息;
    根據(jù)所述專用詞所屬的分類,對應的關(guān)鍵字以及所述關(guān)鍵字在所述專用
    詞項中的匹配位置信息,建立所述專用詞索引表。
    4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述專用詞庫中
    每個專用詞項中的相鄰2個字符,確定所述專用詞項對應的關(guān)鍵字以及所述
    關(guān)鍵字在所述專用詞項中的匹配位置信息之后,還包括:
    對于同一關(guān)鍵字對應的多個所述專用詞項,根據(jù)各個所述專用詞項的:
    文本長度,分類優(yōu)先級別,分類順序,詞優(yōu)先級別,詞順序,和匹配位置中
    的一種或多種,確定該關(guān)鍵字對應的各所述專用詞項的匹配優(yōu)先級。
    5.根據(jù)權(quán)利要求1-4任一項所述的方法,其特征在于,所述對文章段落
    換行位置附近的字符與預先設(shè)置的專用詞索引表中的關(guān)鍵字的字符進行匹

    \t配,識別出包括關(guān)鍵字的專用詞,具體包括:
    從段落中自動換行的第P個字符向前計算所述專用詞識別的起始位置
    Ps;
    從所述起始位置Ps開始向后,依次識別匹配出是否存在所述關(guān)鍵字中包
    括的字符的專用詞,確定識別區(qū)間,直到識別位置大于P;所述識別區(qū)間包
    括:所述段落起始字符位置、段落結(jié)束字符位置、識別出的專用詞。
    6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述從段落中自動換行的
    第P個字符向前計算所述專用詞識別的起始位置Ps,具體包括:
    a1、設(shè)置所述起始位置Ps為所述自動換行位置P減1;
    b1、構(gòu)建關(guān)鍵字[字符Ps,字符Ps+1],在所述專用詞索引表中,根據(jù)所
    構(gòu)建的關(guān)鍵字查找對應的匹配項,若查找不到,則返回所述起始位置Ps;
    c1、根據(jù)所構(gòu)建的關(guān)鍵字在對應的專用詞中的位置和專用詞的文本長度,
    確定最大前綴字符個數(shù)L,在所述起始位置Ps開始向前遍歷字符,直到遍歷
    到分隔位置或遍歷個數(shù)等于L;
    d1、如果遍歷到所述分隔位置,則將所述起始位置Ps設(shè)置為分隔位置后
    返回所述起始位置Ps;
    e1、如果遍歷個數(shù)等于所述L,則將所述起始位置Ps設(shè)置為Ps減L+1
    后轉(zhuǎn)入執(zhí)行所述b1。
    7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述從所述起始位置Ps
    開始向后,依次識別匹配出是否存在所述關(guān)鍵字中包括的字符專用詞,確定
    識別區(qū)間,直到識別位置大于P,具體包括:
    a2、設(shè)置當前識別位置為Pc為所述起始位置Ps;
    b2、構(gòu)建關(guān)鍵字[字符Pc,字符Pc+1],在所述專用詞索引表中,根據(jù)
    所構(gòu)建的關(guān)鍵字查找對應的匹配項,如果不存在,則將當前識別位置Pc加1,
    轉(zhuǎn)入執(zhí)行所述e2;否則,轉(zhuǎn)入執(zhí)行所述c2;
    c2、根據(jù)所構(gòu)造的關(guān)鍵字,以及對應的匹配項,對從當前識別位置Pc開
    始的段落,按照匹配優(yōu)先級的順序進行專用詞匹配;如果未查找到,則將當
    前識別位置Pc加1,轉(zhuǎn)入步驟e2;
    d2、確定所述識別區(qū)間,其中,段落起始字符位置為當前識別位置Pc,

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:楊燕菲梅林楊雷鳴
    申請(專利權(quán))人:北大方正集團有限公司北京北大方正電子有限公司
    類型:發(fā)明
    國別省市:北京;11

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产成人无码精品久久久久免费| 中文字幕亚洲精品无码| 中文字幕无码精品亚洲资源网久久| 国产精品无码无需播放器| 蜜色欲多人AV久久无码| av无码免费一区二区三区| 亚洲heyzo专区无码综合| AV无码精品一区二区三区| 精品国产毛片一区二区无码 | 伊人久久大香线蕉无码| 亚洲第一极品精品无码久久| 超清无码熟妇人妻AV在线电影| 波多野结衣AV无码| 永久免费av无码入口国语片| 亚洲日韩av无码中文| 免费A级毛片无码A∨中文字幕下载| 中文字幕无码日韩专区| 久久久g0g0午夜无码精品| 亚洲av无码片在线观看| 国产精品亚洲专区无码牛牛| 2020无码专区人妻系列日韩| 色爱无码AV综合区| 无码粉嫩虎白一线天在线观看| 亚洲AV无码成人精品区天堂| 日本无码WWW在线视频观看| 国产免费久久久久久无码| 成人免费a级毛片无码网站入口 | 精品久久久无码中文字幕边打电话| 色综合色国产热无码一| 无码夫の前で人妻を侵犯| 亚洲一区二区三区国产精品无码| 亚洲av无码潮喷在线观看| 亚洲国产成人片在线观看无码| 亚洲韩国精品无码一区二区三区| av无码a在线观看| 久久亚洲日韩看片无码| 精品无码一区二区三区爱欲九九| 无码人妻一区二区三区免费n鬼沢| 日韩人妻无码精品久久免费一| 日韩乱码人妻无码中文字幕| 免费A级毛片无码A∨中文字幕下载|