System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及人工智能,尤其涉及大模型和深度學習。更具體地,本公開提供了一種大模型微調方法、裝置、電子設備和存儲介質。
技術介紹
1、隨著人工智能技術的發展,大模型的應用場景在不斷增加。大模型可以是參數量較大的預訓練模型,可以應對不同語義粒度下的任務,進行復雜的邏輯推理。
技術實現思路
1、本公開提供了一種大模型微調方法、裝置、設備以及存儲介質。
2、根據本公開的一方面,提供了一種大模型微調方法,該方法包括:根據模型應用場景,從多個不同類型的大模型中確定待部署大模型,其中,多個不同類型的大模型包括對話式大模型和基礎大模型;將初始提示數據輸入待部署大模型,得到第一輸出結果;根據與模型應用場景對應的預設數據庫和第一輸出結果中至少之一,調整初始提示數據,得到經調整提示數據;根據與模型應用場景對應的訓練樣本數據,微調待部署大模型,得到目標大模型;根據經調整提示數據和目標大模型,確定目標大模型的第一性能評估值,其中,所述第一性能評估值用于表征所述目標大模型的性能。
3、根據本公開的另一方面,提供了一種大模型微調裝置,該裝置包括:第一確定模塊,用于根據模型應用場景,從多個不同類型的大模型中確定待部署大模型,其中,多個不同類型的大模型包括對話式大模型和基礎大模型;第一獲得模塊,用于將初始提示數據輸入待部署大模型,得到第一輸出結果;調整模塊,用于根據與模型應用場景對應的預設數據庫和第一輸出結果中至少之一,調整初始提示數據,得到經調整提示數據;微調模塊,用于根據與模型應用場景對應
4、根據本公開的另一方面,提供了一種電子設備,包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器;其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行根據本公開提供的方法。
5、根據本公開的另一方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,該計算機指令用于使計算機執行根據本公開提供的方法。
6、根據本公開的另一方面,提供了一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行時實現根據本公開提供的方法。
7、應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
本文檔來自技高網...【技術保護點】
1.一種大模型微調方法,包括:
2.根據權利要求1所述的方法,還包括:
3.根據權利要求1所述的方法,其中,所述根據模型應用場景,從多個不同類型的大模型中確定待部署大模型包括以下至少之一:
4.根據權利要求1所述的方法,其中,所述根據與所述模型應用場景對應的預設數據庫和所述第一輸出結果中至少之一,調整所述初始提示數據,得到經調整提示數據包括:
5.根據權利要求1所述的方法,其中,所述根據與所述模型應用場景對應的預設數據庫和所述第一輸出結果中至少之一,調整所述初始提示數據,得到經調整提示數據包括:
6.根據權利要求5所述的方法,其中,所述根據所述第一輸出結果,基于所述初始提示數據進行N次迭代地調整,得到待增強提示數據包括:
7.根據權利要求1所述的方法,其中,所述根據與所述模型應用場景對應的訓練樣本數據,微調所述待部署大模型,得到目標大模型包括:
8.根據權利要求1所述的方法,還包括:
9.一種大模型微調裝置,包括:
10.根據權利要求9所述的裝置,還包括:
11
12.根據權利要求9所述的裝置,其中,所述調整模塊包括:
13.根據權利要求9所述的裝置,其中,所述調整模塊包括:
14.根據權利要求13所述的裝置,其中,所述調整單元包括:
15.根據權利要求9所述的裝置,其中,所述微調模塊包括:
16.根據權利要求9所述的裝置,還包括:
17.一種電子設備,包括:
18.一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行根據權利要求1至8中任一項所述的方法。
19.一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現根據權利要求1至8中任一項所述的方法。
...【技術特征摘要】
1.一種大模型微調方法,包括:
2.根據權利要求1所述的方法,還包括:
3.根據權利要求1所述的方法,其中,所述根據模型應用場景,從多個不同類型的大模型中確定待部署大模型包括以下至少之一:
4.根據權利要求1所述的方法,其中,所述根據與所述模型應用場景對應的預設數據庫和所述第一輸出結果中至少之一,調整所述初始提示數據,得到經調整提示數據包括:
5.根據權利要求1所述的方法,其中,所述根據與所述模型應用場景對應的預設數據庫和所述第一輸出結果中至少之一,調整所述初始提示數據,得到經調整提示數據包括:
6.根據權利要求5所述的方法,其中,所述根據所述第一輸出結果,基于所述初始提示數據進行n次迭代地調整,得到待增強提示數據包括:
7.根據權利要求1所述的方法,其中,所述根據與所述模型應用場景對應的訓練樣本數據,微調所述待部署大模型,得到目標大模型包括:
8.根據權利要求...
【專利技術屬性】
技術研發人員:邢軍華,代秀坤,羅航,歐陽劍,
申請(專利權)人:昆侖芯北京科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。