• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    電子設備及其自然語言分析方法技術

    技術編號:8883153 閱讀:230 留言:0更新日期:2013-07-04 02:02
    一種自然語言分析方法,用于包括存儲有基礎語料庫和臨時語料庫的電子設備。所述方法包括如下步驟:接收用戶輸入并轉換為電信號;將輸入信號轉換為文本信息;將文本信息進行分析;根據基礎語料庫和詞匯切分結果和語句劃分結果分析得到第一理解結果;根據上下文理解法判斷第一理解結果是否為恰當的理解結果;當第一理解結果不是恰當的理解結果時,確定一或多個代指詞匯,根據上下文確定其臨時理解結果以及對文本信息的第二理解結果;及根據第二理解結果以及基礎語料庫和臨時語料庫確定用于回應用戶的文本信息的一回復信息。本發明專利技術還提供了一種應用上述方法的電子設備。本發明專利技術提高了電子設備理解用戶的自然語言的準確度。

    【技術實現步驟摘要】
    電子設備及其自然語言分析方法
    本專利技術涉及一種電子設備及其自然語言分析方法。
    技術介紹
    隨著技術的發展,具有人機會話功能的計算機等智能型的電子設備越來越受到消費者的親睞。然而,自然語言理解一直是人工智能學科內引人注目而又困難重重的一個核心研究課題。在人機會話的過程中,電子設備將用戶的自然語言通過詞匯切分法等方式進行切分,然后結合預存的基礎語料庫來理解用戶的自然語言,通過轉換最終得到句子的語意。雖然基礎語料庫中已被注入大量的語言知識和語法規則知識,然而,當用戶的自然語言中出現語言代指時,例如,自然語言中的“然而圓規很不平,顯出鄙夷的神色,仿佛嗤笑法國人不知道拿破侖…(魯迅先生的《故鄉》)”、“學生吃食堂”、“老鄉吃大碗”等等,電子設備根據基礎語料庫就無法快速準確的理解用戶的自然語言。
    技術實現思路
    有鑒于此,有必要提供一種用于電子設備的自然語言分析方法,可提高電子設備理解用戶的自然語言的準確度,以便于更有效的人機會話,以解決上述問題。有鑒于此,還有必要提供一種采用自然語言分析方法的電子設備,以解決上述問題。一種自然語言分析方法,用于包括存儲有基礎語料庫的電子設備。所述基礎語料庫記錄了多個詞匯以及每一詞匯的使用頻率。所述電子設備還存儲有記錄了至少一代指詞匯及其臨時理解結果的一一對應關系的臨時語料庫。所述方法包括如下步驟:接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電信號;將所述用戶的語音信號和/或文字輸入信號轉換為一預設的語言的文本信息;將所述文本信息切分為包括多個詞匯的多種詞匯切分結果,并在所述多種詞匯切分結果的基礎上,根據句式構造規則將所述文本信息進行語句成分劃分,得到多種語句劃分結果;從所述基礎語料庫中獲取切分后的每一詞匯的使用頻率,并在獲取的每一詞匯的使用頻率的基礎上,根據各種詞匯切分結果以及語句劃分結果綜合分析并得到一第一理解結果;根據上下文理解法對用戶的一預設時段內的文本信息進行分析,判斷所述第一理解結果是否為一恰當的理解結果;當所述第一理解結果不是恰當的理解結果時,確定導致所述第一理解結果為不恰當的理解結果的一或多個代指詞匯,并將所述一或多個代指詞匯與存儲在所述臨時語料庫中的詞匯進行對比,判斷臨時語料庫中是否記錄了所述一或多個代指詞匯;當所述臨時語料庫中未記錄所述一或多個代指詞匯時,根據上下文分析確定所述一或多個代指詞匯的臨時理解結果以及對所述文本信息的第二理解結果,并將所述一或多個代指詞匯及其臨時理解結果一一對應存儲于臨時語料庫中;及根據所述第二理解結果以及基礎語料庫和臨時語料庫確定用于回應用戶的所述文本信息的一回復信息。一種電子設備,包括存儲有基礎語料庫的存儲單元和輸入單元。所述基礎語料庫記錄了多個詞匯以及每一詞匯的使用頻率。所述輸入單元用于接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電信號。所述存儲單元還存儲了一臨時語料庫。所述臨時語料庫記錄了至少一代指詞匯及其臨時理解結果的一一對應關系。所述電子設備還包括:一語言文字轉換模塊,用于將所述用戶的語音信號和/或文字輸入信號轉換為一預設的語言的文本信息;一語言分析模塊,用于將所述文本信息切分為包括多個詞匯的多種詞匯切分結果,并在所述多種詞匯切分結果的基礎上,根據句式構造規則將所述文本信息進行語句成分劃分,得到多種語句劃分結果;以及從所述基礎語料庫中獲取切分后的每一詞匯的使用頻率,并在獲取的每一詞匯的使用頻率的基礎上,根據各種詞匯切分結果以及語句劃分結果綜合分析并得到一第一理解結果;一判斷模塊,用于根據上下文理解法對用戶的一預設時段內的文本信息進行分析,判斷所述第一理解結果是否為一恰當的理解結果,以及當所述第一理解結果不是恰當的理解結果時,確定導致所述第一理解結果為不恰當的理解結果的一或多個代指詞匯,并將所述一或多個代指詞匯與存儲在所述臨時語料庫中的詞匯進行對比,判斷臨時語料庫中是否記錄了所述一或多個代指詞匯;所述語言分析模塊,還用于當所述臨時語料庫中未記錄所述一或多個代指詞匯時,根據上下文分析確定所述一或多個代指詞匯的臨時理解結果以及對所述文本信息的第二理解結果,并將所述一或多個代指詞匯及其臨時理解結果一一對應存儲于臨時語料庫中;及一智能會話模塊,用于根據所述第二理解結果以及基礎語料庫和臨時語料庫確定用于回應用戶的所述文本信息的一回復信息。相對于現有技術,上述電子設備及其自然語言分析方法,使用上述電子設備及其自然語言分析方法,當用戶啟動電子設備后,用戶可以通過輸入單元與電子設備進行人機會話,通過將用戶的語音和/或文字輸入轉換為一文本信息,將該文本信息進行分析后確定一理解結果,判斷所述理解結果為不恰當的理解結果時,確定一或多個導致所述理解結果為不恰當的理解結果的一或多個詞匯(即代指詞匯)及其臨時理解結果并存儲于臨時語料庫,并確定一新的理解結果,同時,根據新的理解結果以及基礎語料庫和臨時語料庫確定用于回應用戶的所述文本信息的一回復信息,從而更準確的理解用戶的自然語言,提高了人機會話的效率。附圖說明圖1為本專利技術一實施方式的電子設備的功能模塊圖。圖2為本專利技術中電子設備的自然語言分析方法的步驟流程圖。主要元件符號說明電子設備100存儲單元10基礎語料庫11臨時語料庫41輸入單元20處理單元30語音文字轉換模塊31語言分析模塊32判斷模塊33智能會話模塊34緩存器40顯示單元50語音輸出單元60如下具體實施方式將結合上述附圖進一步說明本專利技術。具體實施方式請參閱圖1,其為本專利技術的一實施方式的電子設備100的功能模塊圖。電子設備100可更準確的理解用戶自然語言,具有較高的人機會話效率。在本實施方式中,電子設備100為一電腦,在其他實施方式中,電子設備100還可以是手機等電子設備。電子設備100包括一存儲單元10、一輸入單元20、一處理單元30、一顯示單元50和一語音輸出單元60。存儲單元10存儲有基礎語料庫11?;A語料庫11記錄了海量的詞匯以及每一詞匯的使用頻率。基礎語料庫11是按照明確的語言學標準選擇并排序的語言運用材料匯集,是按照明確的設計標準集成的可機讀的大型文本庫。在本實施方式中,基礎語料庫11是存有大量的中文自然語言的文本庫,在其他實施方式中,基礎語料庫11還可以存儲有英文、日文等其他語言種類的自然語言的文本庫。具體文本的語言種類可以根據需要設置。緩存器40中存儲有臨時語料庫41。臨時語料庫41記錄了至少一代指詞匯及其臨時理解結果的一一對應關系。該臨時語料庫41是在電子設備100進行人機會話的過程中存儲的。例如,臨時語料庫41記錄了代指詞匯“圓規”與對其的臨時理解結果為“一人名”的對應關系、代指詞匯“吃食堂”與對其的臨時理解結果為“在食堂吃飯”等等。在一實施方式中,該臨時語料庫41暫存于存儲單元10中。輸入單元20用于接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電信號,并將轉換得到的語音信號和/或文字輸入信號傳輸至處理單元30。處理單元30包括一語音文字轉換模塊31、一語言分析模塊32、一判斷模塊33和一智能會話模塊34。當用戶開啟電子設備100后,輸入單元20即被啟動,用戶可以通過輸入單元20與電子設備100進行人機會話。語音文字轉換模塊31用于將輸入單元20傳輸的用戶的語音信號和本文檔來自技高網...
    電子設備及其自然語言分析方法

    【技術保護點】
    一種自然語言分析方法,用于包括存儲有基礎語料庫的電子設備,其特征在于,所述基礎語料庫記錄了多個詞匯以及每一詞匯的使用頻率,所述電子設備還存儲有記錄了至少一代指詞匯及其臨時理解結果的一一對應關系的臨時語料庫,所述方法包括如下步驟:接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電信號;將所述用戶的語音信號和/或文字輸入信號轉換為一預設的語言的文本信息;將所述文本信息切分為包括多個詞匯的多種詞匯切分結果,并在所述多種詞匯切分結果的基礎上,根據句式構造規則將所述文本信息進行語句成分劃分,得到多種語句劃分結果;從所述基礎語料庫中獲取切分后的每一詞匯的使用頻率,并在獲取的每一詞匯的使用頻率的基礎上,根據各種詞匯切分結果以及語句劃分結果綜合分析并得到一第一理解結果;根據上下文理解法對用戶的一預設時段內的文本信息進行分析,判斷所述第一理解結果是否為一恰當的理解結果;當所述第一理解結果不是恰當的理解結果時,確定導致所述第一理解結果為不恰當的理解結果的一或多個代指詞匯,并將所述一或多個代指詞匯與存儲在所述臨時語料庫中的詞匯進行對比,判斷臨時語料庫中是否記錄了所述一或多個代指詞匯;當所述臨時語料庫中未記錄所述一或多個代指詞匯時,根據上下文分析確定所述一或多個代指詞匯的臨時理解結果以及對所述文本信息的第二理解結果,并將所述一或多個代指詞匯及其臨時理解結果一一對應存儲于臨時語料庫中;及根據所述第二理解結果以及基礎語料庫和臨時語料庫確定用于回應用戶的所述文本信息的一回復信息。...

    【技術特征摘要】
    1.一種自然語言分析方法,用于包括存儲有基礎語料庫的電子設備,其特征在于,所述基礎語料庫記錄了多個詞匯以及每一詞匯的使用頻率,所述電子設備還存儲有記錄了至少一代指詞匯及其臨時理解結果的一一對應關系的臨時語料庫,所述方法包括如下步驟:接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電信號;將所述用戶的語音信號和/或文字輸入信號轉換為一預設的語言的文本信息;將所述文本信息切分為包括多個詞匯的多種詞匯切分結果,并在所述多種詞匯切分結果的基礎上,根據句式構造規則將所述文本信息進行語句成分劃分,得到多種語句劃分結果;從所述基礎語料庫中獲取切分后的每一詞匯的使用頻率,并在獲取的每一詞匯的使用頻率的基礎上,根據各種詞匯切分結果以及語句劃分結果綜合分析并得到一第一理解結果;根據上下文理解法對用戶的一預設時段內的文本信息進行分析,判斷所述第一理解結果是否為一恰當的理解結果;當所述第一理解結果不是恰當的理解結果時,確定導致所述第一理解結果為不恰當的理解結果的一或多個代指詞匯,并將所述一或多個代指詞匯與存儲在所述臨時語料庫中的詞匯進行對比,判斷臨時語料庫中是否記錄了所述一或多個代指詞匯;當所述臨時語料庫中未記錄所述一或多個代指詞匯時,根據上下文分析確定所述一或多個代指詞匯的臨時理解結果以及對所述文本信息的第二理解結果,并將所述一或多個代指詞匯及其臨時理解結果一一對應存儲于臨時語料庫中;及根據所述第二理解結果以及基礎語料庫和臨時語料庫確定用于回應用戶的所述文本信息的一回復信息。2.如權利要求1所述的自然語言分析方法,其特征在于,還包括:將所述回復信息轉換為自然語言的文本信息和/或語音信號;及顯示所述轉換后的文本信息和/或播放所述語音信號。3.如權利要求1或2所述的自然語言分析方法,其特征在于,還包括:新建一臨時語料庫,并將所確定的一或多個代指詞匯及其臨時理解結果一一對應后存儲于該新建的臨時語料庫中。4.如權利要求1或2所述的自然語言分析方法,其特征在于,還包括:當所述第一理解結果為不恰當的理解結果,且所述臨時語料庫中記錄了所述一或多個代指詞匯時,從臨時語料庫中獲取所述一或多個代指詞匯所對應的臨時理解結果,并據此確定對所述文本信息的第三理解結果;及根據所述第三理解結果以及基礎語料庫和臨時語料庫確定用于回應用戶的所述文本信息的一回復信息。5.如權利要求1或2所述的自然語言分析方法,其特征在于,還包括:判斷當前會話是否已結束;及當當前會話已結束時,刪除所述臨時語料庫。6.一種電子設備,包括存儲有基礎語料庫的存儲單元和輸入單元,所述基礎語料庫記錄了多個詞匯以及每一詞匯的使用頻率...

    【專利技術屬性】
    技術研發人員:熊雨凱,陸欣翁世芳,劉慧豐,呂東生,張玉勇,朱健健成響林黃選峰姜安林,周小山李新華
    申請(專利權)人:富泰華工業深圳有限公司,鴻海精密工業股份有限公司,
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产成人无码免费网站| 亚洲AV无码成人精品区狼人影院 | 亚洲精品无码专区| 国产精品无码无片在线观看3D| 久久精品亚洲中文字幕无码网站 | 91精品国产综合久久四虎久久无码一级| 国产精品爆乳奶水无码视频 | 亚洲ⅴ国产v天堂a无码二区| 精品无码综合一区二区三区| 在线观看成人无码中文av天堂| 无码人妻精品一区二区三区9厂| 亚洲人成无码网站在线观看| 少妇无码太爽了在线播放| 天堂无码久久综合东京热| 亚洲中文字幕无码爆乳av中文 | 国外AV无码精品国产精品| 久久亚洲AV成人无码国产| 久久久久亚洲精品无码蜜桃| 亚洲成A∨人片天堂网无码| 亚洲一本大道无码av天堂 | 国产亚洲大尺度无码无码专线| 免费无码午夜福利片| 久久国产精品无码HDAV| 成人午夜精品无码区久久| 国产成人亚洲精品无码AV大片| 亚洲AV永久无码精品一福利| 日韩国产精品无码一区二区三区 | 亚洲av无码乱码国产精品fc2 | 无码日韩人妻AV一区二区三区| 亚洲AV无码专区在线亚| 日韩精品无码中文字幕一区二区| 久久久无码人妻精品无码| 亚洲精品无码AV人在线播放| 97性无码区免费| 色综合久久久无码中文字幕波多| 亚洲成a∨人片在无码2023 | 免费无码国产在线观国内自拍中文字幕| 亚洲欧洲无码一区二区三区 | 无码 免费 国产在线观看91| 无码aⅴ精品一区二区三区| 久久久无码精品人妻一区|