System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 成在人线av无码免费高潮水,国产乱人伦Av在线无码,亚洲AV无码成人网站久久精品大
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    大模型訓練方法、裝置、電子設備、存儲介質及程序產品制造方法及圖紙

    技術編號:44039683 閱讀:4 留言:0更新日期:2025-01-15 01:17
    本申請提供一種大模型訓練方法、裝置、電子設備、存儲介質及程序產品。該方法包括:根據預設的角色提示詞、轉化提示詞、標準化提示詞和答復提示詞,將知識語料轉換為多個問答對;將多個問答對中的多個標準問題依次輸入至待訓練大模型中,以輸出多個標準問題對應的多個測試答案;根據預設的評測提示詞和多個標準問題對應的多個標準答案,分別對多個測試答案進行評測,以得到多個評測結果;篩選出所有評測結果為回答錯誤的測試答案,并將測試答案對應的標準問題所屬的問答對保存至訓練問答對集;采用訓練問答對集對待訓練大模型進行微調訓練,以得到訓練好的大模型;保存訓練好的大模型為目標大模型。能夠提高計算機設備的處理效率,節省計算資源。

    【技術實現步驟摘要】

    本申請涉及人工智能領域,尤其涉及一種大模型訓練方法、裝置、電子設備、存儲介質及程序產品


    技術介紹

    1、開源的通用大模型技術發展迅速,展現出了強大的通用和泛化能力。這些大模型在自然語言處理、圖像識別等多個領域都取得了顯著的成果。

    2、目前,在開發特定行業或特定場景的大模型時一般是采用全量的行業或領域的數據在計算機設備上對大模型進行微調訓練。

    3、然而,現有技術中,大模型的訓練開發,存在計算機設備處理效率低,計算資源浪費的問題。


    技術實現思路

    1、本申請提供一種大模型訓練方法、裝置、電子設備、存儲介質及程序產品,用以解決現有技術存在計算機設備處理效率低,計算資源浪費的技術問題。

    2、第一方面,本申請提供一種大模型訓練方法,包括:

    3、獲取知識語料;

    4、根據預設的角色提示詞、轉化提示詞、標準化提示詞和答復提示詞,將所述知識語料轉換為多個問答對,其中每個問答對包括一個標準問題和所述標準問題對應的標準答案;

    5、將所述多個問答對中的多個標準問題依次輸入至待訓練大模型中,以輸出所述多個標準問題對應的多個測試答案;

    6、根據預設的評測提示詞和所述多個標準問題對應的多個標準答案,分別對所述多個測試答案進行評測,以得到多個評測結果;

    7、篩選出所有評測結果為回答錯誤的測試答案,并將所述測試答案對應的標準問題所屬的問答對保存至訓練問答對集;

    8、采用所述訓練問答對集對所述待訓練大模型進行微調訓練,以得到訓練好的大模型;

    9、保存所述訓練好的大模型為目標大模型。

    10、可選地,如上所述的方法,所述根據預設的角色提示詞、轉化提示詞、標準化提示詞和答復提示詞,將所述知識語料轉換為多個問答對,包括:將預設的角色提示詞輸入至預設的輔助大模型中,以設置所述預設的輔助大模型的角色;將預設的轉化提示詞和所述知識語料輸入至所述預設的輔助大模型中,以輸出所述知識語料對應的多個問題;將預設的標準化提示詞和所述多個問題輸入至所述預設的輔助大模型中進行標準化處理,以輸出多個標準問題;將預設的答復提示詞、所述多個標準問題和所述知識語料輸入至所述預設的輔助大模型中,以輸出多個問答對。

    11、可選地,如上所述的方法,所述根據預設的評測提示詞和所述多個標準問題對應的多個標準答案,分別對所述多個測試答案進行評測,以得到多個評測結果,包括:針對所述多個問答對中的每個問答對,將所述問答對的標準問題、所述標準問題對應的標準答案和所述標準問題對應的測試答案,創建為三元組,以得到多個三元組;將預設的評測提示詞和所述多個三元組輸入至預設的輔助大模型,以輸出多個評測結果。

    12、可選地,如上所述的方法,所述將預設的評測提示詞和所述多個三元組輸入至預設的輔助大模型,以輸出多個評測結果,包括:依次遍歷所述多個三元組,并針對遍歷到的三元組,執行以下步驟:采用預設的輔助大模型,根據預設的評測提示詞,計算所述三元組中的測試答案和標準答案的相關性;通過所述預設的輔助大模型,若判定所述相關性達到預設的相關性閾值,則生成回答正確的評測結果;若判定所述相關性未達到預設的相關性閾值,則生成回答錯誤的評測結果。

    13、可選地,如上所述的方法,所述采用所述訓練問答對集對所述待訓練大模型進行微調訓練,以得到訓練好的大模型,包括:根據預設的超參數,配置所述待訓練大模型的批量大小、學習率和訓練輪數;將所述訓練問答對集輸入至所述待訓練大模型中;采用低階適應算法,按照所述批量大小和學習率,對所述待訓練大模型進行微調訓練,直至訓練次數達到所述訓練輪數,以得到訓練好的大模型。

    14、可選地,如上所述的方法,所述預設的輔助大模型具有邏輯推理能力。

    15、第二方面,本申請提供一種大模型訓練裝置,包括:

    16、獲取模塊,用于獲取知識語料;

    17、轉換模塊,用于根據預設的角色提示詞、轉化提示詞、標準化提示詞和答復提示詞,將所述知識語料轉換為多個問答對,其中每個問答對包括一個標準問題和所述標準問題對應的標準答案;

    18、輸出模塊,用于將所述多個問答對中的多個標準問題依次輸入至待訓練大模型中,以輸出所述多個標準問題對應的多個測試答案;

    19、評測模塊,用于根據預設的評測提示詞和所述多個標準問題對應的多個標準答案,分別對所述多個測試答案進行評測,以得到多個評測結果;

    20、篩選模塊,用于篩選出所有評測結果為回答錯誤的測試答案,并將所述測試答案對應的標準問題所屬的問答對保存至訓練問答對集;

    21、訓練模塊,用于采用所述訓練問答對集對所述待訓練大模型進行微調訓練,以得到訓練好的大模型;

    22、保存模塊,用于保存所述訓練好的大模型為目標大模型。

    23、第三方面,本申請提供一種計算機設備,包括:處理器,以及與所述處理器通信連接的存儲器;

    24、所述存儲器存儲計算機執行指令;

    25、所述至少一個處理器執行所述存儲器存儲的計算機執行指令,使得所述至少一個處理器執行如上第一方面以及第一方面各種可能的設計所述的大模型訓練方法。

    26、第四方面,本申請提供一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有計算機執行指令,所述計算機執行指令被處理器執行時用于實現如上第一方面以及第一方面各種可能的設計所述的方法。

    27、第五方面,本申請提供一種計算機程序產品,包括計算機程序,該計算機程序被處理器執行時實現如上第一方面以及第一方面各種可能的設計所述的方法。

    28、本申請提供的大模型訓練方法、裝置、電子設備、存儲介質及程序產品,通過根據預設的評測提示詞和多個標準問題對應的多個標準答案,分別對多個測試答案進行評測,以得到多個評測結果;篩選出所有評測結果為回答錯誤的測試答案,并將測試答案對應的標準問題所屬的問答對保存至訓練問答對集;采用訓練問答對集對待訓練大模型進行微調訓練,以得到訓練好的大模型,能夠提高計算機設備的處理效率,節省計算資源。

    本文檔來自技高網...

    【技術保護點】

    1.一種大模型訓練方法,其特征在于,應用于計算機設備,包括:

    2.根據權利要求1所述的方法,其特征在于,所述根據預設的角色提示詞、轉化提示詞、標準化提示詞和答復提示詞,將所述知識語料轉換為多個問答對,包括:

    3.根據權利要求1所述的方法,其特征在于,所述根據預設的評測提示詞和所述多個標準問題對應的多個標準答案,分別對所述多個測試答案進行評測,以得到多個評測結果,包括:

    4.根據權利要求3所述的方法,其特征在于,所述將預設的評測提示詞和所述多個三元組輸入至預設的輔助大模型,以輸出多個評測結果,包括:

    5.根據權利要求1至4任一項所述的方法,其特征在于,所述采用所述訓練問答對集對所述待訓練大模型進行微調訓練,以得到訓練好的大模型,包括:

    6.根據權利要求2或4所述的方法,其特征在于,所述預設的輔助大模型具有邏輯推理能力。

    7.一種大模型訓練裝置,其特征在于,應用于計算機設備,包括:

    8.一種計算機設備,其特征在于,包括:處理器,以及與所述處理器通信連接的存儲器;

    9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有計算機執行指令,所述計算機執行指令被處理器執行時用于實現如權利要求1至6任一項所述的大模型訓練方法。

    10.一種計算機程序產品,包括計算機程序,其特征在于,該計算機程序被處理器執行時實現如權利要求1至6任一項所述的方法。

    ...

    【技術特征摘要】

    1.一種大模型訓練方法,其特征在于,應用于計算機設備,包括:

    2.根據權利要求1所述的方法,其特征在于,所述根據預設的角色提示詞、轉化提示詞、標準化提示詞和答復提示詞,將所述知識語料轉換為多個問答對,包括:

    3.根據權利要求1所述的方法,其特征在于,所述根據預設的評測提示詞和所述多個標準問題對應的多個標準答案,分別對所述多個測試答案進行評測,以得到多個評測結果,包括:

    4.根據權利要求3所述的方法,其特征在于,所述將預設的評測提示詞和所述多個三元組輸入至預設的輔助大模型,以輸出多個評測結果,包括:

    5.根據權利要求1至4任一項所述的方法,其特征在于,所述采用所述訓練問答對集對所述待...

    【專利技術屬性】
    技術研發人員:劉兆祥劉想王愷廉士國
    申請(專利權)人:中國聯合網絡通信集團有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 中文一国产一无码一日韩| 无码一区二区三区老色鬼| 无码狠狠躁久久久久久久| 久久久久久久久无码精品亚洲日韩| 免费A级毛片无码免费视| 精品无码成人片一区二区| 亚洲av永久无码精品国产精品| 人妻精品久久无码专区精东影业| 亚洲精品无码久久久久AV麻豆| 亚洲看片无码在线视频| 欧洲精品无码一区二区三区在线播放| 777爽死你无码免费看一二区| 亚洲精品无码av片| 亚洲Av无码一区二区二三区| 国产成人无码18禁午夜福利p| 国产亚洲精久久久久久无码| 无码精品人妻一区二区三区影院| 亚洲爆乳无码专区| 精品无码国产一区二区三区51安| 亚洲熟妇无码av另类vr影视| 日木av无码专区亚洲av毛片| 免费看又黄又无码的网站| 中文字幕无码一区二区三区本日| 中文字幕AV无码一区二区三区| 亚洲中文字幕无码一久久区| 激情无码亚洲一区二区三区| 一本无码人妻在中文字幕免费| 久久久久久久久免费看无码| 一本一道VS无码中文字幕| 久久久无码中文字幕久...| 日本无码色情三级播放| 波多野结AV衣东京热无码专区| 国产AV无码专区亚洲AV蜜芽| 亚洲AV无码乱码在线观看| 18禁超污无遮挡无码免费网站国产| 99精品人妻无码专区在线视频区| 97碰碰碰人妻视频无码| 人妻aⅴ无码一区二区三区| 欲色aV无码一区二区人妻| 熟妇人妻AV无码一区二区三区| 亚洲AV日韩AV无码污污网站|