System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及進行對話的方法、計算設備、存儲介質和程序產品等。
技術介紹
1、大語言模型在解決領域適用性問題時,往往需要通過微調來實現領域內效果增強。然而由于部分領域數據在模型預訓練時沒涉及到,因此通常需要較多的微調樣本,而過多的微調樣本容易導致數據失衡從而產生額外的幻覺問題。
技術實現思路
1、本公開實施例提供了進行對話的方法以及相應的執行這些方法的計算設備、非暫時性機器可讀存儲介質和計算機程序產品。
2、根據本公開實施例的第一個方面,提供了一種進行對話的方法,包括:接收請求文本;使用文本分類模型對所述請求文本進行分類,獲得所述請求文本所屬的問答領域;構建提示,其中所述提示包括所述請求文本以及所述請求文本所屬的所述問答領域;以及將所述提示輸入大語言模型,得到與所述請求文本對應的回答。
3、可選地,所述大語言模型是經過微調的大語言模型,對大語言模型進行微調的過程包括:獲得屬于第一問答領域的一個或多個多輪對話;在所述一個或多個多輪對話中的相鄰兩輪對話之間插入至少一輪噪音對話,其中所述至少一輪噪音對話為與所述第一問答領域不同的問答領域的對話;以及使用一個或多個插入了所述至少一輪噪音對話的多輪對話作為微調樣本,對大語言模型進行微調,直到滿足微調停止條件,其中所述微調停止條件包括損失函數不再下降或者測試集指標達標或者迭代達到預設的微調次數。
4、可選地,所述相鄰兩輪對話是從所述一個或多個多輪對話中隨機選擇的相鄰兩輪對話;所述至少一輪噪音對話是從與所述第一問答
5、可選地,所述噪音對話與所述相鄰兩輪對話有相關性,其中所述相關性包括:所述噪音對話包含與所述相鄰兩輪對話中的至少一輪對話中的實體相同或相似的實體;或者所述噪音對話中的一個槽位與所述相鄰兩輪對話中的至少一輪對話中的一個實體相似;或者所述噪音對話中的一個實體與所述相鄰兩輪對話中的至少一輪對話中的一個槽位相似;或者所述噪音對話與所述相鄰兩輪對話中的至少一輪對話的相似度超過閾值;或者在預定的一組噪音對話中所述噪音對話與所述相鄰兩輪對話中的至少一輪對話的相似度最高。
6、可選地,所述文本分類模型的訓練過程包括:預定義多個問答領域;按照所述預定義的多個問答領域分別標注多個對話作為訓練樣本;使用所述訓練樣本訓練所述文本分類模型,直到滿足訓練停止條件,其中所述訓練停止條件包括損失函數不再下降或者測試集指標達標或者迭代達到預設的訓練次數。
7、可選地,將所述提示輸入大語言模型,得到與所述請求文本對應的回答,包括:使用所述大語言模型為所述提示生成一個或多個推理路徑;所述大語言模型至少基于所述一個或多個推理路徑為所述提示生成一個或多個候選回答;從所述一個或多個候選回答中確定所述回答。
8、根據本公開實施例的第二個方面,提供了一種對話裝置,包括:接收單元,用于接收請求文本;分類單元,用于使用文本分類模型對所述請求文本進行分類,獲得所述請求文本所屬的問答領域;構建單元,用于構建提示,其中所述提示包括所述請求文本以及所述請求文本所屬的所述問答領域;以及回復單元,用于將所述提示輸入大語言模型,得到與所述請求文本對應的回答。
9、根據本公開實施例的第三個方面,提供了一種計算設備,包括:處理器;以及存儲器,其上存儲有可執行代碼,當可執行代碼被處理器執行時,使處理器執行如上述第一個方面中的任一方案所述的方法。
10、根據本公開實施例的第四個方面,提供了一種非暫時性機器可讀存儲介質,其上存儲有可執行代碼,當可執行代碼被電子設備的處理器執行時,使處理器執行如上述第一個方面中的任一方案所述的方法。
11、根據本公開實施例的第五個方面,提供了一種計算機程序產品,包括可執行代碼,當所述可執行代碼被電子設備的處理器執行時,使所述處理器執行如上述第一個方面中的任一方案所述的方法。
本文檔來自技高網...【技術保護點】
1.一種進行對話的方法,包括:
2.根據權利要求1所述的方法,其中,
3.根據權利要求2所述的方法,其中,
4.根據權利要求2所述的方法,其中,
5.根據權利要求1所述的方法,其中,
6.根據權利要求1所述的方法,其中,將所述提示輸入大語言模型,得到與所述請求文本對應的回答,包括:
7.一種對話裝置,包括:
8.一種計算設備,包括:
9.一種非暫時性機器可讀存儲介質,其上存儲有可執行代碼,當所述可執行代碼被電子設備的處理器執行時,使所述處理器執行如權利要求1-6中任一項所述的方法。
10.一種計算機程序產品,包括可執行代碼,當所述可執行代碼被電子設備的處理器執行時,使所述處理器執行如權利要求1-6中任何一項所述的方法。
【技術特征摘要】
1.一種進行對話的方法,包括:
2.根據權利要求1所述的方法,其中,
3.根據權利要求2所述的方法,其中,
4.根據權利要求2所述的方法,其中,
5.根據權利要求1所述的方法,其中,
6.根據權利要求1所述的方法,其中,將所述提示輸入大語言模型,得到與所述請求文本對應的回答,包括:
7.一種對話...
【專利技術屬性】
技術研發人員:安旭,
申請(專利權)人:武漢星紀魅族科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。