【技術實現步驟摘要】
電子設備及其自然語言分析方法
本專利技術涉及一種電子設備及其自然語言分析方法。
技術介紹
隨著技術的發展,具有人機會話功能的計算機等智能型的電子設備越來越受到消費者的親睞。然而,自然語言理解一直是人工智能學科內引人注目而又困難重重的一個核心研究課題。在人機會話的過程中,電子設備將用戶的自然語言通過詞匯切分法等方式進行切分,然后結合預存的基礎語料庫來理解用戶的自然語言,通過轉換最終得到句子的語意。雖然基礎語料庫中已被注入大量的語言知識和語法規則知識,然而,當用戶的自然語言中出現語言代指時,例如,自然語言中的“然而圓規很不平,顯出鄙夷的神色,仿佛嗤笑法國人不知道拿破侖…(魯迅先生的《故鄉》)”、“學生吃食堂”、“老鄉吃大碗”等等,電子設備根據基礎語料庫就無法快速準確的理解用戶的自然語言。
技術實現思路
有鑒于此,有必要提供一種用于電子設備的自然語言分析方法,可提高電子設備理解用戶的自然語言的準確度,以便于更有效的人機會話,以解決上述問題。有鑒于此,還有必要提供一種采用自然語言分析方法的電子設備,以解決上述問題。一種自然語言分析方法,用于包括存儲有基礎語料庫的電子設備。所述基礎語料庫記錄了多個詞匯以及每一詞匯的使用頻率。所述電子設備還存儲有記錄了至少一代指詞匯及其臨時理解結果的一一對應關系的臨時語料庫。所述方法包括如下步驟:接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電信號;將所述用戶的語音信號和/或文字輸入信號轉換為一預設的語言的文本信息;將所述文本信息切分為包括多個詞匯的多種詞匯切分結果,并在所述多種詞匯切分結果的基礎上,根據句式構造規則將所述 ...
【技術保護點】
一種自然語言分析方法,用于包括存儲有基礎語料庫的電子設備,其特征在于,所述基礎語料庫記錄了多個詞匯以及每一詞匯的使用頻率,所述電子設備還存儲有記錄了至少一代指詞匯及其臨時理解結果的一一對應關系的臨時語料庫,所述方法包括如下步驟:接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電信號;將所述用戶的語音信號和/或文字輸入信號轉換為一預設的語言的文本信息;將所述文本信息切分為包括多個詞匯的多種詞匯切分結果,并在所述多種詞匯切分結果的基礎上,根據句式構造規則將所述文本信息進行語句成分劃分,得到多種語句劃分結果;從所述基礎語料庫中獲取切分后的每一詞匯的使用頻率,并在獲取的每一詞匯的使用頻率的基礎上,根據各種詞匯切分結果以及語句劃分結果綜合分析并得到一第一理解結果;根據上下文理解法對用戶的一預設時段內的文本信息進行分析,判斷所述第一理解結果是否為一恰當的理解結果;當所述第一理解結果不是恰當的理解結果時,確定導致所述第一理解結果為不恰當的理解結果的一或多個代指詞匯,并將所述一或多個代指詞匯與存儲在所述臨時語料庫中的詞匯進行對比,判斷臨時語料庫中是否記錄了所述一或多個代指詞匯;當所述臨時 ...
【技術特征摘要】
1.一種自然語言分析方法,用于包括存儲有基礎語料庫的電子設備,其特征在于,所述基礎語料庫記錄了多個詞匯以及每一詞匯的使用頻率,所述電子設備還存儲有記錄了至少一代指詞匯及其臨時理解結果的一一對應關系的臨時語料庫,所述方法包括如下步驟:接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電信號;將所述用戶的語音信號和/或文字輸入信號轉換為一預設的語言的文本信息;將所述文本信息切分為包括多個詞匯的多種詞匯切分結果,并在所述多種詞匯切分結果的基礎上,根據句式構造規則將所述文本信息進行語句成分劃分,得到多種語句劃分結果;從所述基礎語料庫中獲取切分后的每一詞匯的使用頻率,并在獲取的每一詞匯的使用頻率的基礎上,根據各種詞匯切分結果以及語句劃分結果綜合分析并得到一第一理解結果;根據上下文理解法對用戶的一預設時段內的文本信息進行分析,判斷所述第一理解結果是否為一恰當的理解結果;當所述第一理解結果不是恰當的理解結果時,確定導致所述第一理解結果為不恰當的理解結果的一或多個代指詞匯,并將所述一或多個代指詞匯與存儲在所述臨時語料庫中的詞匯進行對比,判斷臨時語料庫中是否記錄了所述一或多個代指詞匯;當所述臨時語料庫中未記錄所述一或多個代指詞匯時,根據上下文分析確定所述一或多個代指詞匯的臨時理解結果以及對所述文本信息的第二理解結果,并將所述一或多個代指詞匯及其臨時理解結果一一對應存儲于臨時語料庫中;及根據所述第二理解結果以及基礎語料庫和臨時語料庫確定用于回應用戶的所述文本信息的一回復信息。2.如權利要求1所述的自然語言分析方法,其特征在于,還包括:將所述回復信息轉換為自然語言的文本信息和/或語音信號;及顯示所述轉換后的文本信息和/或播放所述語音信號。3.如權利要求1或2所述的自然語言分析方法,其特征在于,還包括:新建一臨時語料庫,并將所確定的一或多個代指詞匯及其臨時理解結果一一對應后存儲于該新建的臨時語料庫中。4.如權利要求1或2所述的自然語言分析方法,其特征在于,還包括:當所述第一理解結果為不恰當的理解結果,且所述臨時語料庫中記錄了所述一或多個代指詞匯時,從臨時語料庫中獲取所述一或多個代指詞匯所對應的臨時理解結果,并據此確定對所述文本信息的第三理解結果;及根據所述第三理解結果以及基礎語料庫和臨時語料庫確定用于回應用戶的所述文本信息的一回復信息。5.如權利要求1或2所述的自然語言分析方法,其特征在于,還包括:判斷當前會話是否已結束;及當當前會話已結束時,刪除所述臨時語料庫。6.一種電子設備,包括存儲有基礎語料庫的存儲單元和輸入單元,所述基礎語料庫記錄了多個詞匯以及每一詞匯的使用頻率...
【專利技術屬性】
技術研發人員:熊雨凱,陸欣,翁世芳,劉慧豐,呂東生,張玉勇,朱健健,成響林,黃選峰,姜安林,周小山,李新華,
申請(專利權)人:富泰華工業深圳有限公司,鴻海精密工業股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。