System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及決策智能體構建,特別是涉及一種基于大語言模型的智能體構建方法、系統、介質及設備。
技術介紹
1、決策智能體的構建和訓練的難點主要包括:首先,明確業務問題以及精準提煉輸入、輸出存在困難,這高度依賴設計者對業務的深度理解,且需要不斷進行校正和優化;其次,設計適配業務的神經網絡結構和強化學習算法極具挑戰性,需要考慮業務需求和數據體量等多方面因素,構建網絡及訓練過程中還可能要反復調優,避免過擬合欠擬合等情況,很大程度上依賴人員的經驗和技術;再次,通常支撐決策智能體訓練的仿真訓練系統的應用規范復雜,開發代碼調用仿真訓練系統支持決策智能體訓練,對設計人員專業性要求高,效率相對較低。
技術實現思路
1、本申請提供一種基于大語言模型的智能體構建方法、系統、介質及設備,通過選擇合適的大語言模型,為大語言模型建立系列提示工程文本,進而支持按需實現高效、準確的決策智能體構建與訓練。
2、本申請實施例第一方面提供一種基于大語言模型的智能體構建方法,上述方法包括:
3、確定目標大語言模型;
4、基于網絡模型庫對應的說明文檔和實例代碼,建立網絡模型對應的第一提示工程文本;
5、基于強化學習算法庫對應的說明文檔和實例代碼,建立強化學習算法對應的第二提示工程文本;
6、基于仿真訓練環境的接口文檔、類庫函數和代碼示例,建立仿真訓練環境對應的第三提示工程文本;
7、基于所述第一提示工程文本、所述第二提示工程文本和所述第三提示工程文本,構
8、基于用戶輸入信息生成目標業務對應的目標提示工程文本,并將所述目標提示工程文本輸入所述目標大語言模型,以使所述目標大語言模型對所述目標提示工程文本進行需求解析,得到需求標簽,并基于所述需求標簽和所述完整示范提示工程文本,生成所述目標業務對應的目標代碼,所述目標代碼用于構建相應的決策智能體模型并對所述決策智能體模型進行訓練。
9、可選地,所述網絡模型庫對應的說明文檔和實例代碼包括多種網絡模型對應的說明信息和代碼信息;
10、基于網絡模型庫對應的說明文檔和實例代碼,建立網絡模型對應的第一提示工程文本,包括:
11、基于多種網絡模型對應的說明信息,建立網絡模型分類及特性文檔、網絡模型架構說明文檔、網絡模型參數設置文檔和網絡模型函數定義文檔;其中,所述網絡模型分類及特性文檔用于對各個網絡模型的名稱、特點、適用場景和優勢與局限性進行說明;所述網絡模型架構說明文檔用于對各個網絡模型的層次結構、神經元連接方式和數據流向進行說明;所述網絡模型參數設置文檔用于對各個網絡模型的參數名稱、可取值范圍、建議值和對模型性能的影響進行說明;所述網絡模型函數定義文檔用于對各個網絡模型的函數名稱、功能描述、輸入參數、輸出結果和算法邏輯進行說明;
12、基于多種網絡模型對應的代碼信息,建立網絡模型函數調用示例文檔;所述網絡模型函數調用示例文檔用于對各個網絡模型的示例使用場景、調用代碼和代碼注釋進行說明;
13、基于所述網絡模型分類及特性文檔、所述網絡模型架構說明文檔、所述網絡模型參數設置文檔、所述網絡模型函數定義文檔和所述網絡模型函數調用示例文檔,生成所述網絡模型對應的第一提示工程文本。
14、可選地,強化學習算法庫對應的說明文檔和實例代碼包括多種強化學習算法對應的說明信息和代碼信息;
15、基于強化學習算法庫對應的說明文檔和實例代碼,建立強化學習算法對應的第二提示工程文本,包括:
16、基于多種強化學習算法對應的說明信息,建立強化學習算法類庫函數說明文檔和模型訓練超參數調優經驗文檔;其中,所述強化學習算法類庫函數說明文檔用于對各個強化學習算法的算法名稱、原理、優缺點、適用場景、性能對比、函數名稱、功能描述、輸入參數、輸出結果和算法邏輯進行說明;所述模型訓練超參數調優經驗文檔用于對使用各個強化學習算法的網絡模型的超參數、調優方法、調優經驗總結和應用案例進行說明;
17、基于多種強化學習算法對應的代碼信息,建立強化學習算法類庫函數調用示例文檔;所述強化學習算法類庫函數調用示例文檔用于對各個強化學習算法的示例使用場景、調用代碼和代碼注釋進行說明;
18、基于所述強化學習算法類庫函數說明文檔、所述模型訓練超參數調優經驗文檔和所述強化學習算法類庫函數調用示例文檔,生成所述強化學習算法對應的第二提示工程文本。
19、可選地,基于仿真訓練環境的接口文檔、類庫函數和代碼示例,建立仿真訓練環境對應的第三提示工程文本,包括:
20、基于所述仿真訓練環境的接口文檔,建立仿真訓練環境介紹文檔、仿真訓練環境配置文檔、仿真訓練環境接口詳細說明文檔和仿真訓練環境數據格式規范文檔;其中,所述仿真訓練環境介紹文檔用于對各個仿真環境的功能模塊、特點、適用范圍和優勢進行說明;所述仿真訓練環境配置文檔用于對各個仿真環境的硬件要求、軟件依賴、環境變量設置和配置步驟進行說明;所述仿真訓練環境接口詳細說明文檔用于對各個仿真環境的接口名稱、功能、輸入參數格式和要求、輸出數據格式和含義進行說明;所述仿真訓練環境數據格式規范文檔用于對各個仿真環境的輸入數據格式、輸出數據格式、數據類型和數據維度進行說明;
21、基于所述仿真訓練環境的類庫函數,建立仿真訓練環境類庫函數分類匯總文檔和仿真訓練環境類庫函數內部實現剖析文檔;其中,所述仿真訓練環境類庫函數分類匯總文檔用于對各個仿真環境的函數類別、函數名稱和函數功能進行說明;所述仿真訓練環境類庫函數內部實現剖析文檔用于對各個仿真環境的函數代碼、關鍵代碼注釋、流程圖和函數執行流程進行說明;
22、基于所述仿真訓練環境的代碼示例,建立仿真訓練環境應用實例文檔,所述仿真訓練環境應用實例文檔用于對各個仿真環境應用的實例場景、實現步驟、代碼示例和應用結果進行說明;
23、基于所述仿真訓練環境介紹文檔、所述仿真訓練環境配置文檔、所述仿真訓練環境接口詳細說明文檔、所述仿真訓練環境數據格式規范文檔、所述仿真訓練環境類庫函數分類匯總文檔、所述仿真訓練環境類庫函數內部實現剖析文檔和所述仿真訓練環境應用實例文檔,生成所述仿真訓練環境對應的第三提示工程文本。
24、可選地,基于所述第一提示工程文本、所述第二提示工程文本和所述第三提示工程文本,構建針對不同業務需求的完整示范提示工程文本,包括:
25、對不同決策智能體的業務需求、所述第一提示工程文本、所述第二提示工程文本和所述第三提示工程文本,進行檢查和補充,得到完整提示信息;
26、基于不同業務需求對應的目標功能對所述完整提示信息進行整理,生成針對不同業務需求的完整示范提示工程文本。
27、可選地,基于用戶輸入信息生成目標業務對應的目標提示工程文本,包括:
28、獲取用戶輸入的需求信息、技術實施約束信息和/或實施要求信息;其中,所述需求信息用于描述所述目標業本文檔來自技高網...
【技術保護點】
1.一種基于大語言模型的智能體構建方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述網絡模型庫對應的說明文檔和實例代碼包括多種網絡模型對應的說明信息和代碼信息;
3.根據權利要求1所述的方法,其特征在于,強化學習算法庫對應的說明文檔和實例代碼包括多種強化學習算法對應的說明信息和代碼信息;
4.根據權利要求1所述的方法,其特征在于,基于仿真訓練環境的接口文檔、類庫函數和代碼示例,建立仿真訓練環境對應的第三提示工程文本,包括:
5.根據權利要求1所述的方法,其特征在于,基于所述第一提示工程文本、所述第二提示工程文本和所述第三提示工程文本,構建針對不同業務需求的完整示范提示工程文本,包括:
6.根據權利要求1所述的方法,其特征在于,基于用戶輸入信息生成目標業務對應的目標提示工程文本,包括:
7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
8.一種基于大語言模型的智能體構建系統,其特征在于,所述系統包括:
9.一種計算機可讀存儲介質,其上存儲有計算機程
10.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時,實現如權利要求1至7任一項所述的基于大語言模型的智能體構建方法。
...【技術特征摘要】
1.一種基于大語言模型的智能體構建方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述網絡模型庫對應的說明文檔和實例代碼包括多種網絡模型對應的說明信息和代碼信息;
3.根據權利要求1所述的方法,其特征在于,強化學習算法庫對應的說明文檔和實例代碼包括多種強化學習算法對應的說明信息和代碼信息;
4.根據權利要求1所述的方法,其特征在于,基于仿真訓練環境的接口文檔、類庫函數和代碼示例,建立仿真訓練環境對應的第三提示工程文本,包括:
5.根據權利要求1所述的方法,其特征在于,基于所述第一提示工程文本、所述第二提示工程文本和所述第三提示工程文本,構建針對不同業務需求的完整示范提示工程...
【專利技術屬性】
技術研發人員:曹揚,呂乃冰,趙若帆,張晨光,趙亞麗,吳京輝,趙思聰,李世添,薛源,王朋,李冬雪,
申請(專利權)人:北京航天晨信科技有限責任公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。