信息生成方法、裝置、電子設備及可讀存儲介質制造方法及圖紙

技術編號：39255438 閱讀：27 留言：0更新日期：2023-10-30 12:07

本公開涉及一種信息生成方法、裝置、電子設備及可讀存儲介質，該方法包括：獲取輸入的問題信息，利用生成模型生成針對問題信息的回復信息；生成模型通過以下步驟訓練得到：獲取樣本數據，每一條樣本數據包括一個問題信息和問題信息對應的預設回復信息，每一條樣本數據包括原始樣本和根據原始樣本構建的正例樣本和負例樣本，提取樣本數據的表示向量，通過表示向量及預設的損失函數訓練初始生成模型得到生成模型。到生成模型。到生成模型。

全部詳細技術資料下載

【技術實現步驟摘要】
信息生成方法、裝置、電子設備及可讀存儲介質

[0001]本公開涉及計算機
，尤其涉及一種信息生成方法、裝置、電子設備及可讀存儲介質。

技術介紹

[0002]相關技術中，人機對話領域中，針對用戶的提問，閑聊對話機器人通常使用檢索模型或者生成模型來給出合適的回復。然而，對于檢索模型而言，需要語料庫足夠充足才能針對用戶的提問給出合適的回復，而且檢索模型的回復只能是語料庫里面的，泛化能力差；對于生成模型而言，其模型尺寸通常比較大，導致回復提問的速度難以滿足高并發場景下的延遲要求，另外，由于生成的回復趣味性不夠，導致用戶體驗較差。

技術實現思路

[0003]為克服相關技術中存在的問題，本公開提供一種信息生成方法、裝置、電子設備及可讀存儲介質。
[0004]根據本公開實施例的第一方面，提供一種信息生成方法，包括：獲取輸入的問題信息；利用生成模型生成針對所述問題信息的回復信息；所述生成模型通過以下步驟訓練得到：獲取樣本數據；每一條所述樣本數據包括一個所述問題信息和所述問題信息對應的預設回復信息；每一條所述樣本數據包括原始樣本和根據所述原始樣本構建的正例樣本和負例樣本；提取所述樣本數據的表示向量；通過所述表示向量及預設的損失函數訓練初始生成模型得到所述生成模型。
[0005]可選的，所述提取所述樣本數據的表示向量的步驟包括：將所述樣本數據輸入至所述初始生成模型，通過所述初始生成模型在每一個所述樣本數據的預設回復信息后添加占位符；對添加所述占位符后的樣本數據中每個字符進行語義學習，得到所述樣本數據...

【技術保護點】

【技術特征摘要】
1.一種信息生成方法，其特征在于，包括：獲取輸入的問題信息；利用生成模型生成針對所述問題信息的回復信息；所述生成模型通過以下步驟訓練得到：獲取樣本數據；每一條所述樣本數據包括一個所述問題信息和所述問題信息對應的預設回復信息；每一條所述樣本數據包括原始樣本和根據所述原始樣本構建的正例樣本和負例樣本；提取所述樣本數據的表示向量；通過所述表示向量及預設的損失函數訓練初始生成模型得到所述生成模型。2.根據權利要求1所述方法，其特征在于，所述提取所述樣本數據的表示向量的步驟包括：將所述樣本數據輸入至所述初始生成模型，通過所述初始生成模型在每一個所述樣本數據的預設回復信息后添加占位符；對添加所述占位符后的樣本數據中每個字符進行語義學習，得到所述樣本數據的表示向量。3.根據權利要求1或2所述的方法，其特征在于，所述損失函數通過以下步驟得到：根據所述樣本數據中的所述原始樣本與對應的所述正例樣本的相似度，以及所述原始樣本與對應的所述負例樣本的相似度，確定所述損失函數。4.根據權利要求3所述方法，其特征在于，所述損失函數的計算公式包括：其中，L
cont
(θ)為所述損失函數，N為對所述初始生成模型進行一次反向傳播參數更新所需的樣本數據的數量，為所述原始樣本，為根據所述原始樣本構建的正例樣本，sim()為相似度函數，τ為常數，為根據所述原始樣本構建的正例樣本和負例樣本，為所述原始樣本與構建的樣本的運算和，S為構造的樣本集。5.根據權利要求1所述方法，其特征在于，所述利用生成模型生成針對所述問題信息的回復信息的步驟之前還包括：從語料庫中檢索與所述問題信息相匹配的候選回復信息；獲取所述候選回復信息的得分；在所述候選回復信息中存在至少一個得分大于預設閾值的候選回復信息的情況下，基于得分大于所述預設閾...

【專利技術屬性】
技術研發人員：夏小強，
申請(專利權)人：北京小米松果電子有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術