System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及自然語言處理,適用于金融或醫療領域,尤其涉及一種答復文本生成方法、裝置、計算機設備及存儲介質。
技術介紹
1、問答模式是最常見的信息傳遞方式,通常用于回答提出的問題,并提供與問題相關的信息。問答模式常用于在線客服、智能助手、陪伴閑聊等場景。在問答模式中,答案的質量經常從真實性、是否有幫助、通順性等維度衡量,其中真實性是所有標準中最基礎和重要的特性。
2、一般問題的答案都是確定的,但與時間地點、與應用場景等相關的問題答案會與時間地點、應用場景等相關。如在美國問“我們的時區是什么”與在中國問“我們的時區是什么”答案是不一樣的;在平安問“公司的主頁地址是什么”與在招商銀行問“公司的主頁地址是什么”也是不一樣的。
3、目前一般的深度學習問答模型通常把常識知識記憶到模型參數中,不管在什么場景下問相同的問題均回答一樣的答案。為了使模型能適應不同的場景,通常會把跟場景相關的相關背景知識輸入到模型中啟發模型輸出與背景相關的答案,但如果相關背景知識比較少見或與記憶中的知識相沖突,模型會忽略背景仍然輸出記憶中的答案,導致產生錯誤。由此可見,傳統的深度學習問答模型存在準確性較低的問題。
技術實現思路
1、本申請實施例的目的在于提出一種答復文本生成方法、裝置、計算機設備及存儲介質,以解決傳統的深度學習問答模型存在準確性較低的問題。
2、為了解決上述技術問題,本申請實施例提供一種答復文本生成方法,采用了如下所述的技術方案:
3、接收用戶終端發送的咨詢
4、對所述咨詢文本數據進行第一向量轉化操作,得到咨詢文本向量;
5、對所述咨詢文本數據進行背景檢測操作,得到背景檢測結果;
6、若所述背景檢測結果不存在相關背景知識,則將所述咨詢文本向量作為問答模型的模型輸入數據;
7、若所述背景檢測結果存在相關背景知識,則對所述相關背景知識進行第二向量轉化操作,得到相關背景知識向量;
8、將所述咨詢文本向量以及所述相關背景知識向量進行拼接操作,得到拼接文本向量;
9、將所述拼接文本向量作為所述問答模型的模型輸入數據;
10、將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本。
11、進一步的,所述對所述咨詢文本數據進行背景檢測操作,得到背景檢測結果的步驟,具體包括下述步驟:
12、對所述咨詢文本數據進行關鍵信息提取操作,得到關鍵特征信息;
13、根據所述關鍵特征信息構建語義表示向量;
14、在預先構建的背景知識庫中檢索與所述語義表示向量相對應的背景知識,得到所述背景檢測結果。
15、進一步的,所述在預先構建的背景知識庫中檢索與所述語義表示向量相對應的背景知識,得到所述背景檢測結果的步驟,具體包括下述步驟:
16、計算所述語義表示向量與所述背景知識庫中背景知識的向量的相似度,判斷所述相似度是否大于或者等于預設的相似度閾值。
17、進一步的,所述將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本的步驟,具體包括下述步驟:
18、根據pointer-generator?network機制將所述咨詢文本數據以及所述相關背景知識中的關鍵詞以預設概率復制到所述問答模型的輸出數據中,得到目標答復文本。
19、進一步的,在所述將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本的步驟之后,還包括下述步驟:
20、對所述目標答復文本進行句法分析操作,得到句法分析結果;
21、若所述句法分析結果存在語法錯誤文本,則根據預設的語法規則對所述語法錯誤文本進行修正處理。
22、進一步的,在所述將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本的步驟之后,還包括下述步驟:
23、計算所述目標答復文本與所述咨詢文本數據和/或所述相關背景知識的相關度;
24、若所述相關不滿足預設的相關度閾值,則重新執行所述答復文本生成操作,直至得到目標答復文本與所述咨詢文本數據和/或所述相關背景知識的相關度滿足所述相關度閾值。
25、為了解決上述技術問題,本申請實施例還提供一種答復文本生成裝置,采用了如下所述的技術方案:
26、咨詢文本獲取模塊,用于接收用戶終端發送的咨詢文本數據;
27、第一向量轉化模塊,用于對所述咨詢文本數據進行第一向量轉化操作,得到咨詢文本向量;
28、背景檢測模塊,用于對所述咨詢文本數據進行背景檢測操作,得到背景檢測結果;
29、第一輸入數據確認模塊,用于若所述背景檢測結果不存在相關背景知識,則將所述咨詢文本向量作為問答模型的模型輸入數據;
30、第二向量轉化模塊,用于若所述背景檢測結果存在相關背景知識,則對所述相關背景知識進行第二向量轉化操作,得到相關背景知識向量;
31、向量拼接模塊,用于將所述咨詢文本向量以及所述相關背景知識向量進行拼接操作,得到拼接文本向量;
32、第二輸入數據確認模塊,用于將所述拼接文本向量作為所述問答模型的模型輸入數據;
33、答復文本生成模塊,用于將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本。
34、進一步的,所述背景檢測模塊包括:
35、關鍵信息提取子模塊,用于對所述咨詢文本數據進行關鍵信息提取操作,得到關鍵特征信息;
36、語義向量構建子模塊,用于根據所述關鍵特征信息構建語義表示向量;
37、背景檢測結果獲取子模塊,用于在預先構建的背景知識庫中檢索與所述語義表示向量相對應的背景知識,得到所述背景檢測結果。
38、為了解決上述技術問題,本申請實施例還提供一種計算機設備,采用了如下所述的技術方案:
39、包括存儲器和處理器,所述存儲器中存儲有計算機可讀指令,所述處理器執行所述計算機可讀指令時實現如上所述的答復文本生成方法的步驟。
40、為了解決上述技術問題,本申請實施例還提供一種計算機可讀存儲介質,采用了如下所述的技術方案:
41、所述計算機可讀存儲介質上存儲有計算機可讀指令,所述計算機可讀指令被處理器執行時實現如上所述的答復文本生成方法的步驟。
42、本申請提供了一種答復文本生成方法,包括:接收用戶終端發送的咨詢文本數據;對所述咨詢文本數據進行第一向量轉化操作,得到咨詢文本向量,便于計算機進行后續處理和分析,這種轉化使得文本數據在保留關鍵信息的同時,能夠以數值形式被機器學習和深度學習模型有效處理;對所述咨詢文本數據進行背景檢測操作,得到背景檢測結果,通過背景檢測,系統能夠識別咨詢文本中涉及的主題、領域或上下文信息,有助于系統更好地理解用戶的問題,并為后續處理提供有用的上下文信息;若所述背景檢測結果本文檔來自技高網...
【技術保護點】
1.一種答復文本生成方法,其特征在于,包括下述步驟:
2.根據權利要求1所述的答復文本生成方法,其特征在于,所述對所述咨詢文本數據進行背景檢測操作,得到背景檢測結果的步驟,具體包括下述步驟:
3.根據權利要求2所述的答復文本生成方法,其特征在于,所述在預先構建的背景知識庫中檢索與所述語義表示向量相對應的背景知識,得到所述背景檢測結果的步驟,具體包括下述步驟:
4.根據權利要求1所述的答復文本生成方法,其特征在于,所述將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本的步驟,具體包括下述步驟:
5.根據權利要求1所述的答復文本生成方法,其特征在于,在所述將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本的步驟之后,還包括下述步驟:
6.根據權利要求1所述的答復文本生成方法,其特征在于,在所述將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本的步驟之后,還包括下述步驟:
7.一種答復文本生成裝置,其特征在于,包括:
8.根據權利要
9.一種計算機設備,包括存儲器和處理器,其特征在于,所述存儲器中存儲有計算機可讀指令,所述處理器執行所述計算機可讀指令時實現如權利要求1至6中任一項所述的答復文本生成方法的步驟。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機可讀指令,所述計算機可讀指令被處理器執行時實現如權利要求1至6中任一項所述的答復文本生成方法的步驟。
...【技術特征摘要】
1.一種答復文本生成方法,其特征在于,包括下述步驟:
2.根據權利要求1所述的答復文本生成方法,其特征在于,所述對所述咨詢文本數據進行背景檢測操作,得到背景檢測結果的步驟,具體包括下述步驟:
3.根據權利要求2所述的答復文本生成方法,其特征在于,所述在預先構建的背景知識庫中檢索與所述語義表示向量相對應的背景知識,得到所述背景檢測結果的步驟,具體包括下述步驟:
4.根據權利要求1所述的答復文本生成方法,其特征在于,所述將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本的步驟,具體包括下述步驟:
5.根據權利要求1所述的答復文本生成方法,其特征在于,在所述將所述模型輸入數據輸入至所述問答模型進行答復文本生成操作,得到目標答復文本的步驟之后,還包...
【專利技術屬性】
技術研發人員:侯翠琴,章林,李劍鋒,
申請(專利權)人:平安科技深圳有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。