System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及人工智能,尤其涉及一種偏好預測方法、裝置、電子設備及可讀存儲介質。
技術介紹
1、在隨著深度學習技術的發展,大規模語言模型已經在自然語言處理領域取得了顯著的進展,這些模型在對話生成、文本分類等任務上表現出色,廣泛應用于對話系統、虛擬助理、生成式ai產品等領域。
2、但是,在用戶與大規模語言模型的交互中,針對同一文本不同大規模語言模型生成的文本響應會有一定差異,這就導致難以準確預測用戶對不同大規模語言模型生成結果的偏好,現有技術在處理用戶偏好文本響應時,容易受到位置偏差(優先選擇第一個展示的結果)和冗長偏差(更長的響應被認為更好)的影響,難以實現精準的偏好預測,導致模型生成結果與用戶真實需求不符。
技術實現思路
1、有鑒于此,本申請實施例提供了一種偏好預測方法、裝置、電子設備及可讀存儲介質,以解決現有技術中難以預測用戶的真實偏好響應,導致模型生成結果與用戶真實需求不符,降低用戶使用體驗的問題。
2、本申請實施例的第一方面,提供了一種偏好預測方法,該方法包括:
3、獲取初始文本和與初始文本對應的至少兩種響應文本,其中每一種響應文本為不同的響應生成模型根據初始文本生成;將初始文本和至少兩種響應文本進行拼接,得到目標對話文本;將目標對話文本輸入到文本預測模型,文本預測模型用于確定目標對話文本中初始文本與每一響應文本的偏好度,文本預測模型是由預先設置的訓練集對初始文本預測模型進行訓練得到的,訓練集包括多個樣本初始文本,每一樣本初始文本對應至少兩種
4、本申請實施例的第二方面,提供了一種偏好預測裝置,該裝置包括:
5、獲取模塊,被配置為獲取初始文本和與初始文本對應的至少兩種響應文本,其中每一種響應文本為不同的響應生成模型根據初始文本生成;
6、拼接模塊,被配置為將初始文本和至少兩種響應文本進行拼接,得到目標對話文本;預測模塊,被配置為將目標對話文本輸入到文本預測模型,文本預測模型用于確定目標對話文本中初始文本與每一響應文本的偏好度,文本預測模型是由預先設置的訓練集對初始文本預測模型進行訓練得到的,訓練集包括多個樣本初始文本,每一樣本初始文本對應至少兩種樣本響應文本,初始文本預測模型的損失值由樣本初始文本與每一種樣本響應文本的偏好度,和樣本響應文本與每一響應生成模型的匹配度所共同確定的;確定模塊,被配置為根據初始文本與每一響應文本的偏好度確定目標響應文本。
7、本申請實施例的第三方面,提供了一種電子設備,包括存儲器、處理器以及存儲在存儲器中并且可在處理器上運行的計算機程序,該處理器執行計算機程序時實現上述方法的步驟。
8、本申請實施例的第四方面,提供了一種可讀存儲介質,該可讀存儲介質存儲有計算機程序,該計算機程序被處理器執行時實現上述方法的步驟。
9、本申請實施例與現有技術相比存在的有益效果是:
10、根據本申請提供的技術方案,獲取初始文本和與初始文本對應的至少兩種響應文本;將初始文本和至少兩種響應文本進行拼接,得到目標對話文本;將目標對話文本輸入到文本預測模型,文本預測模型用于確定目標對話文本中初始文本與每一響應文本的偏好度,文本預測模型是由預先設置的訓練集對初始文本預測模型進行訓練得到的,訓練集包括多個樣本初始文本,每一樣本初始文本對應至少兩種樣本響應文本,初始文本預測模型的損失值由樣本初始文本與每一種樣本響應文本的偏好度,和樣本響應文本與每一響應生成模型的匹配度所共同確定;根據初始文本與每一響應文本的偏好度確定目標響應文本。通過樣本初始文本與每一種樣本響應文本的偏好度和樣本響應文本與每一響應生成模型的匹配度所共同確定文本預測模型的損失值,能夠客觀評估每一響應生成模型的對話表現,以便確定最佳響應生成模型和其生成的響應文本,并進一步利用文本預測模型確定目標對話文本中初始文本與每一響應文本的偏好度,可以從至少兩種響應文本確定滿足用戶偏好的目標響應文本,從而提高用戶使用體驗。避免了現有技術中難以預測用戶的真實偏好響應,導致模型生成結果與用戶真實需求不符,降低用戶使用體驗的問題。
本文檔來自技高網...【技術保護點】
1.一種偏好預測方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述文本預測模型包括多頭分類器,所述將所述目標對話文本輸入到文本預測模型,包括:
3.根據權利要求2所述的方法,其特征在于,所述基于所述第一損失值和第二損失值,得到所述多頭分類器輸出的所述損失值,包括:
4.根據權利要求1所述的方法,其特征在于,所述將所述目標對話文本輸入到文本預測模型之前,還包括:
5.根據權利要求4所述的方法,其特征在于,所述方法還包括:
6.根據權利要求1所述的方法,其特征在于,所述將所述目標對話文本輸入到文本預測模型之后,還包括:
7.根據權利要求6所述的方法,其特征在于,所述根據所述第一偏好度和所述第二偏好度,確定所述目標響應文本,包括:
8.一種偏好預測裝置,其特征在于,包括:
9.一種電子設備,包括存儲器、處理器以及存儲在所述存儲器中并且可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1至7中任一項所述方法的步驟。
10
...【技術特征摘要】
1.一種偏好預測方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述文本預測模型包括多頭分類器,所述將所述目標對話文本輸入到文本預測模型,包括:
3.根據權利要求2所述的方法,其特征在于,所述基于所述第一損失值和第二損失值,得到所述多頭分類器輸出的所述損失值,包括:
4.根據權利要求1所述的方法,其特征在于,所述將所述目標對話文本輸入到文本預測模型之前,還包括:
5.根據權利要求4所述的方法,其特征在于,所述方法還包括:
6.根據權利要求1所述的方法,其特征在于,所述將所述目標對話...
【專利技術屬性】
技術研發人員:蔣佩釗,
申請(專利權)人:深圳須彌云圖空間科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。