本發(fā)明專利技術(shù)實施例公開了一種基于疑問語義的自然語言語義計算方法及裝置,設(shè)計多個多層次的疑問語義標注集,每個標注集均由若干現(xiàn)代漢語中常用的疑問詞組成,其中疑問詞包括疑問代詞;根據(jù)待處理語句的各組成部分的疑問特征,通過所述疑問語義標注集、疑問語義句模庫和疑問語義樹,將所述待處理語句的各組成部分切分并標注為疑問對象或疑問運算符;根據(jù)所述疑問對象或所述疑問運算符的性質(zhì)和規(guī)則,通過所述疑問語義標注集、疑問語義句模庫和疑問語義樹,作為一個基礎(chǔ)的語義計算方法,本發(fā)明專利技術(shù)實施例可以有效的解決常見的自然語言處理問題,尤其是在語句的切分標注、自然語言搜索、機器翻譯、人機問答等領(lǐng)域具有較高的使用價值。
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)實施例涉及信息處理的
,尤其涉及一種基于疑問語義的自然語言 語義計算的方法及裝置。
技術(shù)介紹
自然語言處理是研究人人、人機交際中語言問題的一門學(xué)科。在自然語言處理中, 語義計算是通過計算機解釋自然語言中各級單位即字、詞素、詞、詞組、短語、句子、句群、段 落、篇章等的意義,所關(guān)心的重點是這個語言單位到底說了什么。在目前技術(shù)中主要有:義 素分析法、語義場、語義網(wǎng)絡(luò)、Montague語法、優(yōu)選語義學(xué)、概念依存理論、意義-文本理論 等方法。 在目前技術(shù)中,語義計算的主要的缺陷表現(xiàn)為兩方面:一方面?zhèn)戎赜诶媒y(tǒng)計方 法進行字符運算,很少或者沒有涉及語義問題;另一方面失之于語義概念抽象或規(guī)則復(fù)雜, 利用計算機技術(shù)難以實現(xiàn)或算法復(fù)雜度高,缺乏實用性。
技術(shù)實現(xiàn)思路
本專利技術(shù)實施例的目的在于提出一種基于疑問語義的自然語言語義計算的方法及 裝置,旨在解決如何建立簡單易懂的語義劃分規(guī)則對自然語言進行處理的問題。 為達此目的,本專利技術(shù)實施例采用以下技術(shù)方案: 設(shè)計多個多層次的疑問語義標注集,每個標注集均由若干現(xiàn)代漢語中常用的疑問 詞組成,其中疑問詞包括疑問代詞; 根據(jù)待處理語句的各組成部分的疑問特征,通過所述疑問語義標注集、疑問語義 句模庫和疑問語義樹,將所述待處理語句的各組成部分切分并標注為疑問對象或疑問運算 符; 根據(jù)所述疑問對象或所述疑問運算符的性質(zhì)和規(guī)則,結(jié)合所述疑問語義句模庫、 統(tǒng)計方法和疑問語義樹,實現(xiàn)待處理語句的疑問語義計算。 優(yōu)選地,所述設(shè)計多個多層次的疑問語義標注集,每個標注集均由若干現(xiàn)代漢語 中常用的疑問詞組成,其中疑問詞包括疑問代詞,包括: 根據(jù)不同的語義場景或者不同的應(yīng)用場景設(shè)計多個多層次的疑問語義標注集,每 個標注集均由若干現(xiàn)代漢語中常用的疑問詞組成,其中疑問詞包括疑問代詞。 優(yōu)選地,所述根據(jù)待處理語句的各組成部分的疑問特征,通過所述疑問語義標注 集、疑問語義句模庫和疑問語義樹,將所述待處理語句的各組成部分切分并標注為疑問對 象或疑問運算符,包括: 若所述語義范疇為人,則與人對應(yīng)的疑問代詞為"誰"; 若所述語義范疇為事物,則與事物對應(yīng)的疑問代詞為"什么"; 若所述語義范疇為動作,則與所述事物對應(yīng)的疑問代詞為"怎么",與所述"怎么" 疑問語義等同的其他疑問代詞為怎么樣、怎樣、怎、怎么著、怎的和如何; 若所述語義范疇為時間,則與所述時間對應(yīng)的疑問代詞為幾時,與所述"幾時"疑 問語義等同的其他疑問代詞為多會兒、哪會兒和多咱; 若所述語義范疇為地點場所,則與所述地點場所對應(yīng)的疑問代詞為哪里,與所述 "哪里"疑問語義等同的其他疑問代詞為哪和哪兒; 若所述語義范疇為數(shù)目數(shù)量,則與所述數(shù)目數(shù)量對應(yīng)的疑問代詞為多少,與所述 多少等同的其他疑問代詞為幾和多; 若所述語義范疇為虛詞,則將所述語義范疇切分并標注為疑問運算符。 優(yōu)選地,所述方法還包括: 將搜索字符通過預(yù)先設(shè)置的算法劃分為預(yù)先設(shè)置的疑問對象; 根據(jù)劃分后的疑問代詞搜索預(yù)先存儲的字符; 若劃分后的疑問代詞和預(yù)先存儲的字符對應(yīng),則顯示與所述預(yù)先存儲的字符對應(yīng) 的劃分前的待處理的字符。 優(yōu)選地,所述方法還包括: 接收用戶輸入的搜索字符; 根據(jù)所述搜索字符和相似度計算獲取預(yù)先存儲的字符模型; 根據(jù)所述預(yù)先存儲的字符模塊劃分為預(yù)先設(shè)置的疑問對象; 根據(jù)劃分后的疑問代詞搜索預(yù)先存儲的字符; 若劃分后的疑問代詞和預(yù)先存儲的字符對應(yīng),則顯示與所述預(yù)先存儲的字符對應(yīng) 的劃分前的待處理的字符。 -種基于疑問語義的自然語言語義計算的裝置,所述裝置包括: 設(shè)計模塊,用于設(shè)計多個多層次的疑問語義標注集,每個標注集均由若干現(xiàn)代漢 語中常用的疑問詞組成,其中疑問詞包括疑問代詞; 標注模塊,用于根據(jù)待處理語句的各組成部分的疑問特征,通過所述疑問語義標 注集、疑問語義句模庫和疑問語義樹,將所述待處理語句的各組成部分切分并標注為疑問 對象或疑問運算符; 計算模塊,用于根據(jù)所述疑問對象或所述疑問運算符的性質(zhì)和規(guī)則,結(jié)合所述疑 問語義句模庫、統(tǒng)計方法和疑問語義樹,實現(xiàn)待處理語句的疑問語義計算。 優(yōu)選地,所述設(shè)計模塊,包括: 設(shè)計單元,用于根據(jù)不同的語義場景或者不同的應(yīng)用場景設(shè)計多個多層次的疑問 語義標注集,每個標注集均由若干現(xiàn)代漢語中常用的疑問詞組成,其中疑問詞包括疑問代 O 優(yōu)選地,所述標注模塊,包括: 第一標注單元,用于若所述語義范疇為人,則與人對應(yīng)的疑問代詞為"誰"; 第二標注單元,用于若所述語義范疇為事物,則與事物對應(yīng)的疑問代詞為"什么"; 第三標注單元,用于若所述語義范疇為動作,則與所述事物對應(yīng)的疑問代詞為"怎 么",與所述"怎么"疑問語義等同的其他疑問代詞為怎么樣、怎樣、怎、怎么著、怎的和如何; 第四標注單元,用于若所述語義范疇為時間,則與所述時間對應(yīng)的疑問代詞為幾 時,與所述"幾時"疑問語義等同的其他疑問代詞為多會兒、哪會兒和多咱;第五標注單元,用于若所述語義范疇為地點場所,則與所述地點場所對應(yīng)的疑問 代詞為哪里,與所述"哪里"疑問語義等同的其他疑問代詞為哪和哪兒; 第六標注單元,用于若所述語義范疇為數(shù)目數(shù)量,則與所述數(shù)目數(shù)量對應(yīng)的疑問 代詞為多少,與所述多少等同的其他疑問代詞為幾和多; 第七標注單元,用于若所述語義范疇為虛詞,則將所述語義范疇切分并標注為疑 問運算符。 優(yōu)選地,所述裝置還包括: 第一劃分模塊,用于將搜索字符通過預(yù)先設(shè)置的算法劃分為預(yù)先設(shè)置的疑問對 象; 第一搜索模塊,用于根據(jù)劃分后的疑問代詞搜索預(yù)先存儲的字符; 第一顯示模塊,用于若劃分后的疑問代詞和預(yù)先存儲的字符對應(yīng),則顯示與所述 預(yù)先存儲的字符對應(yīng)的劃分前的待處理的字符。 優(yōu)選地,接收模塊,用于接收用戶輸入的搜索字符; 獲取模塊,用于根據(jù)所述搜索字符和相似度計算獲取預(yù)先存儲的字符模型; 第二劃分模塊,用于根據(jù)所述預(yù)先存儲的字符模塊劃分為預(yù)先設(shè)置的疑問對象; 第二搜索模塊,用于根據(jù)劃分后的疑問代詞搜索預(yù)先存儲的字符; 第二顯示模塊,用于若劃分后的疑問代詞和預(yù)先存儲的字符對應(yīng),則顯示與所述 預(yù)先存儲的字符對應(yīng)的劃分前的待處理的字符。 本專利技術(shù)實施例通過設(shè)計多個多層次的疑問語義標注集,每個標注集均由若干現(xiàn)代 漢語中常用的疑問詞組成,其中疑問詞包括疑問代詞;根據(jù)待處理語句的各組成部分的疑 問特征,通過所述疑問語義標注集、疑問語義句模庫和疑問語義樹,將所述待處理語句的各 組成部分切分并標注為疑問對象或疑問運算符;根據(jù)所述疑問對象或所述疑問運算符的性 質(zhì)和規(guī)則,通過所述疑問語義標注集、疑問語義句模庫和疑問語義樹,實現(xiàn)待處理語句的疑 問語義計算,作為一個基礎(chǔ)的語義計算方法,本專利技術(shù)實施例可以有效的解決常見的自然語 言處理問題,尤其是在語句的切分標注、自然語言搜索、機器翻譯、人機問答等領(lǐng)域具有較 高的使用價值。【附圖說明】圖1是本專利技術(shù)實施例基于疑問語義的自然語言語義計算的方法第一實施例的流 程不意圖;圖2是本專利技術(shù)實施例基于疑問語義的自然語言語義計算的方法第二實施例的流 程不意圖; 圖3是本專利技術(shù)實施例基于疑問語義的自然語言語義計算的方法第三實施例的流 程不意圖;圖4是本專利技術(shù)實施例基于疑問語義的自然語言語義計算的裝置的功能模塊示意 圖;圖5是本專利技術(shù)實施例設(shè)計模塊401的功能模塊示意圖;圖6是本專利技術(shù)實本文檔來自技高網(wǎng)...

【技術(shù)保護點】
一種基于疑問語義的自然語言語義計算的方法,其特征在于,所述方法包括:設(shè)計多個多層次的疑問語義標注集,每個標注集均由若干現(xiàn)代漢語中常用的疑問詞組成,其中疑問詞包括疑問代詞;根據(jù)待處理語句的各組成部分的疑問特征,通過所述疑問語義標注集、疑問語義句模庫和疑問語義樹,將所述待處理語句的各組成部分切分并標注為疑問對象或疑問運算符;根據(jù)所述疑問對象或所述疑問運算符的性質(zhì)和規(guī)則,結(jié)合所述疑問語義句模庫、統(tǒng)計方法和疑問語義樹,實現(xiàn)待處理語句的疑問語義計算。
【技術(shù)特征摘要】
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:劉戰(zhàn)雄,
申請(專利權(quán))人:劉戰(zhàn)雄,
類型:發(fā)明
國別省市:河北;13