System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及自然語言處理及金融科技,尤其涉及一種基于蒸餾模型的問題答案獲得方法、裝置、計算機設備及存儲介質。
技術介紹
1、隨著人工智能技術的快速發展,自然語言處理逐漸應用于各類領域,在金融領域中,采用大語言模型預測生成用戶提出的理財咨詢、金融政策咨詢等問題,能夠有效提高金融業務處理效率。但是,由于大型語言模型的推理采用自回歸生成方式,在進行問題答案的推理過程中,每生成一個詞元token都需要模型訪問全部參數,將參數從存儲器傳輸到計算單元進行運算,過程繁瑣,導致問題答案獲得的效率較低。因此如何提高問題答案的獲得效率成為了亟需解決的問題。
技術實現思路
1、本申請提供了一種基于蒸餾模型的問題答案獲得方法、裝置、計算機設備及存儲介質,以提高問題答案的獲得效率。
2、第一方面,本申請提供了一種基于蒸餾模型的問題答案獲得方法,所述方法包括:
3、獲取待回答問題,并基于所述待回答問題確定初始問答模型;
4、獲取與所述初始問答模型對應的目標問答模型以及蒸餾模型,基于所述蒸餾模型,對所述待回答問題的問題序列進行處理,獲得所述待回答問題對應的初始答案序列;
5、將所述問題序列與所述初始答案序列進行拼接,獲得目標序列;
6、基于所述目標問答模型以及所述目標序列,對所述初始答案序列進行校驗,獲得所述待回答問題的目標答案。
7、第二方面,本申請還提供了一種基于蒸餾模型的問題答案獲得裝置,所述裝置包括:
8、初始問答模型確定
9、初始答案序列獲得模塊,用于獲取與所述初始問答模型對應的目標問答模型以及蒸餾模型,基于所述蒸餾模型,對所述待回答問題的問題序列進行處理,獲得所述待回答問題對應的初始答案序列;
10、目標序列獲得模塊,用于將所述問題序列與所述初始答案序列進行拼接,獲得目標序列;
11、目標答案獲得模塊,用于基于所述目標問答模型以及所述目標序列,對所述初始答案序列進行校驗,獲得所述待回答問題的目標答案。
12、第三方面,本申請還提供了一種計算機設備,所述計算機設備包括存儲器和處理器;所述存儲器,用于存儲計算機程序;所述處理器,用于執行所述計算機程序并在執行所述計算機程序時實現如上述的基于蒸餾模型的問題答案獲得方法。
13、第四方面,本申請還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時使所述處理器實現如上述的基于蒸餾模型的問題答案獲得方法。
14、本申請公開了一種基于蒸餾模型的問題答案獲得方法、裝置、計算機設備及存儲介質,獲取待回答問題,并基于所述待回答問題確定初始問答模型;獲取與所述初始問答模型對應的目標問答模型以及蒸餾模型,基于所述蒸餾模型,對所述待回答問題的問題序列進行處理,獲得所述待回答問題對應的初始答案序列;將所述問題序列與所述初始答案序列進行拼接,獲得目標序列;基于所述目標問答模型以及所述目標序列,對所述初始答案序列進行校驗,獲得所述待回答問題的目標答案。本申請通過初始問答模型對應的蒸餾模型,獲得待回答問題的初始答案序列,蒸餾模型能夠顯著減少參數量和計算復雜度,進而提高了初始答案序列的獲得效率。其次,通過初始問答模型對應的目標問答模型對初始答案序列進行校驗,獲得目標答案,能夠對初始答案序列中的錯誤進行修正,保證了答案的準確性。并且,目標問答模型只需要對序列進行校驗,無需生成整個序列,任務量較低,提高了問題答案獲得的效率。
本文檔來自技高網...【技術保護點】
1.一種基于蒸餾模型的問題答案獲得方法,其特征在于,包括:
2.根據權利要求1所述的基于蒸餾模型的問題答案獲得方法,其特征在于,所述獲取與所述初始問答模型對應的目標問答模型以及蒸餾模型,包括:
3.根據權利要求2所述的基于蒸餾模型的問題答案獲得方法,其特征在于,所述對所述目標問答模型進行蒸餾,獲得所述初始問答模型對應的蒸餾模型,包括:
4.根據權利要求3所述的基于蒸餾模型的問題答案獲得方法,其特征在于,所述基于所述第一預測結果、所述第二預測結果以及所述初始問答模型的損失函數,獲得所述學生模型的損失函數,包括:
5.根據權利要求1所述的基于蒸餾模型的問題答案獲得方法,其特征在于,所述基于所述目標問答模型以及所述目標序列,對所述初始答案序列進行校驗,獲得所述待回答問題的目標答案,包括:
6.根據權利要求5所述的基于蒸餾模型的問題答案獲得方法,其特征在于,所述基于所述驗證結果以及所述預測詞元,對所述初始答案序列進行修正,獲得所述目標答案,包括:
7.根據權利要求1至6任一項所述的基于蒸餾模型的問題答案獲得方法,其特
8.一種基于蒸餾模型的問題答案獲得裝置,其特征在于,包括:
9.一種計算機設備,其特征在于,所述計算機設備包括存儲器和處理器;
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時使所述處理器實現如權利要求1至7中任一項所述的基于蒸餾模型的問題答案獲得方法。
...【技術特征摘要】
1.一種基于蒸餾模型的問題答案獲得方法,其特征在于,包括:
2.根據權利要求1所述的基于蒸餾模型的問題答案獲得方法,其特征在于,所述獲取與所述初始問答模型對應的目標問答模型以及蒸餾模型,包括:
3.根據權利要求2所述的基于蒸餾模型的問題答案獲得方法,其特征在于,所述對所述目標問答模型進行蒸餾,獲得所述初始問答模型對應的蒸餾模型,包括:
4.根據權利要求3所述的基于蒸餾模型的問題答案獲得方法,其特征在于,所述基于所述第一預測結果、所述第二預測結果以及所述初始問答模型的損失函數,獲得所述學生模型的損失函數,包括:
5.根據權利要求1所述的基于蒸餾模型的問題答案獲得方法,其特征在于,所述基于所述目標問答模型以及所述目標序列,對所述初始答案序列進行校驗,...
【專利技術屬性】
技術研發人員:唐小初,龔述濤,舒暢,陳又新,
申請(專利權)人:平安科技深圳有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。