System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及計算機模型,具體而言,涉及一種大模型服務系統、方法、計算機設備及可讀存儲介質。
技術介紹
1、在人工智能領域,大語言模型服務系統的崛起如同一場技術革命,它以不可阻擋之勢滲透至各行各業,重塑了技術生態。這些模型以其強大的語言處理能力,不僅吸引了普通民眾的廣泛關注,也成為大型企業不可或缺的技術支柱。
2、但是在研究中發現,現有的模型服務系統存在以下缺陷:缺乏靈活性,傳統的文本處理或生成系統往往缺乏足夠的靈活性,無法根據用戶的特定需求進行定制化的操作,這些系統通常只能按照預設的流程或算法運行,難以適應多樣化的應用場景;檢索效率低下,在文本檢索方面,傳統的系統可能依賴于關鍵詞匹配等簡單方法,導致檢索效率低下且準確性不高。特別是在處理大規模文本數據時,這種方法的局限性尤為明顯;安全性較低,在管控大模型的輸入輸出、權限控制、渠道管理、安全控制以及租戶管理等方面表現不佳,無法滿足日益增長的安全需求。
技術實現思路
1、有鑒于此,本專利技術的目的在于提供一種大模型服務系統、方法、計算機設備及可讀存儲介質,以提高大模型服務的靈活性、模型檢索的效率、模型服務的安全性,進一步滿足多樣化的業務場景需求,提高用戶體驗。
2、第一方面,本申請實施例提供了一種大模型服務系統,所述系統包括提示詞工程模塊、檢索增強生成模塊、插件開發模塊和智能體模塊;
3、所述提示詞工程模塊,用于配置若干提示詞模板,并向目標用戶進行展示;還用于響應于所述目標用戶對若干提示詞模板中第一
4、所述檢索增強生成模塊,用于接收所述目標用戶上傳的基礎文本,將所述基礎文本轉換為若干高維詞向量,并將各高維詞向量存儲至向量數據庫中形成檢索數據庫;還用于接收所述目標用戶輸入的提問信息,根據所述提問信息從所述檢索數據庫中檢索出第二提示詞,基于所述第二提示詞生成第二目標文本;
5、所述插件開發模塊,用于接收所述目標用戶輸入的配置文件和提問信息,對所述配置文件進行解析,基于解析結果得到第三方api接口的詳細信息;還用于基于所述提問信息判斷是否需要調用所述第三方api接口,當需要調用所述第三方api接口時,從所述第三方api接口調用擴展數據;還用于基于所述提問信息從所述擴展數據中檢索出第三提示詞,基于所述第三提示詞生成第三目標文本;
6、所述智能體模塊,用于接收所述目標用戶對系統執行鏈的自定義操作,基于所述自定義操作對所述提示詞工程模塊、所述檢索增強生成模塊和所述插件開發模塊的執行組合和/或執行順序進行定義。
7、可選地,所述基于所述第一提示詞生成第一目標文本,包括:
8、利用目標大模型,根據所述第一提示詞生成所述第一目標文本;
9、所述基于所述第二提示詞生成第二目標文本,包括:
10、利用所述目標大模型,根據所述第二提示詞生成所述第二目標文本;
11、所述基于所述第三提示詞生成第三目標文本,包括:
12、利用所述目標大模型,根據所述第三提示詞生成所述第三目標文本。
13、可選地,所述系統還包括模型訓練模塊和模型管理模塊;
14、所述模型訓練模塊,用于對初始大模型進行模型訓練;
15、所述模型管理模塊,用于對訓練后的初始大模型進行測試,將測試通過的初始大模型作為所述目標大模型進行部署。
16、可選地,所述將所述基礎文本轉換為若干高維詞向量,包括:
17、通過嵌入模型對所述基礎文本進行解析得到若干高維詞向量,其中,所述嵌入模型包括m3e模型、gte模型、bge模型。
18、可選地,所述目標大模型包括glm模型、qwen模型。
19、可選地,所述根據所述提問信息從所述檢索數據庫中檢索出第二提示詞,包括:
20、將所述提問信息進行文本向量化處理得到初始詞向量;
21、分別計算所述初始詞向量和所述檢索數據庫中各高維詞向量的相似度;
22、將所述檢索數據庫中與所述初始詞向量的相似度超過預設閾值的高維詞向量確定為所述第二提示詞。
23、第二方面,本申請實施例提供了一種大模型服務方法,應用于大模型服務系統,所述系統包括提示詞工程模塊、檢索增強生成模塊、插件開發模塊和智能體模塊,所述方法還包括:
24、所述提示詞工程模塊配置若干提示詞模板,并向目標用戶進行展示;還用于響應于所述目標用戶對若干提示詞模板中第一提示詞的選擇操作,基于所述第一提示詞生成第一目標文本;
25、所述檢索增強生成模塊接收所述目標用戶上傳的基礎文本,將所述基礎文本轉換為若干高維詞向量,并將各高維詞向量存儲至向量數據庫中形成檢索數據庫;還用于接收所述目標用戶輸入的提問信息,根據所述提問信息從所述檢索數據庫中檢索出第二提示詞,基于所述第二提示詞生成第二目標文本;
26、所述插件開發模塊接收所述目標用戶輸入的配置文件和提問信息,對所述配置文件進行解析,基于解析結果得到第三方api接口的詳細信息;基于所述提問信息判斷是否需要調用所述第三方api接口,當需要調用所述第三方api接口時,從所述第三方api接口調用擴展數據;基于所述提問信息從所述擴展數據中檢索出第三提示詞,基于所述第三提示詞生成第三目標文本;
27、所述智能體模塊接收所述目標用戶對系統執行鏈的自定義操作,基于所述自定義操作對所述提示詞工程模塊、所述檢索增強生成模塊和所述插件開發模塊的執行組合和/或執行順序進行定義。
28、可選地,所述基于所述第一提示詞生成第一目標文本,包括:
29、利用目標大模型,根據所述第一提示詞生成所述第一目標文本;
30、所述基于所述第二提示詞生成第二目標文本,包括:
31、利用所述目標大模型,根據所述第二提示詞生成所述第二目標文本;
32、所述基于所述第三提示詞生成第三目標文本,包括:
33、利用所述目標大模型,根據所述第三提示詞生成所述第三目標文本。
34、可選地,所述系統還包括模型訓練模塊和模型管理模塊,所述方法還包括:
35、所述模型訓練模塊對初始大模型進行模型訓練;
36、所述模型管理模塊對訓練后的初始大模型進行測試,將測試通過的初始大模型作為所述目標大模型進行部署。
37、可選地,所述將所述基礎文本轉換為若干高維詞向量,包括:
38、通過嵌入模型對所述基礎文本進行解析得到若干高維詞向量,其中,所述嵌入模型包括m3e模型、gte模型、bge模型。
39、可選地,所述目標大模型包括glm模型、qwen模型。
40、可選地,所述根據所述提問信息從所述檢索數據庫中檢索出第二提示詞,包括:
41、將所述提問信息進行文本向量化處理得到初始詞向量;
42、分別計算所述初始詞向量和所述檢索數據庫中各高維詞向本文檔來自技高網...
【技術保護點】
1.一種大模型服務系統,其特征在于,所述系統包括提示詞工程模塊、檢索增強生成模塊、插件開發模塊和智能體模塊;
2.根據權利要求1所述的系統,其特征在于,所述基于所述第一提示詞生成第一目標文本,包括:
3.根據權利要求2所述的系統,其特征在于,所述系統還包括模型訓練模塊和模型管理模塊;
4.根據權利要求1所述的系統,其特征在于,所述將所述基礎文本轉換為若干高維詞向量,包括:
5.根據權利要求2所述的系統,其特征在于,所述目標大模型包括GLM模型、Qwen模型。
6.根據權利要求1所述的系統,其特征在于,所述根據所述提問信息從所述檢索數據庫中檢索出第二提示詞,包括:
7.一種大模型服務方法,其特征在于,應用于大模型服務系統,所述系統包括提示詞工程模塊、檢索增強生成模塊、插件開發模塊和智能體模塊,所述方法還包括:
8.一種計算機設備,其特征在于,包括:處理器、存儲器和總線,所述存儲器存儲有所述處理器可執行的機器可讀指令,當計算機設備運行時,所述處理器與所述存儲器之間通過所述總線通信,所述機器可讀指令被所
9.一種計算機可讀存儲介質,其特征在于,該計算機可讀存儲介質上存儲有計算機程序,該計算機程序被處理器運行時執行如權利要求7中所述的大模型服務方法的步驟。
...【技術特征摘要】
1.一種大模型服務系統,其特征在于,所述系統包括提示詞工程模塊、檢索增強生成模塊、插件開發模塊和智能體模塊;
2.根據權利要求1所述的系統,其特征在于,所述基于所述第一提示詞生成第一目標文本,包括:
3.根據權利要求2所述的系統,其特征在于,所述系統還包括模型訓練模塊和模型管理模塊;
4.根據權利要求1所述的系統,其特征在于,所述將所述基礎文本轉換為若干高維詞向量,包括:
5.根據權利要求2所述的系統,其特征在于,所述目標大模型包括glm模型、qwen模型。
6.根據權利要求1所述的系統,其特征在于,所述根據所述提問信息從所述檢索數據庫中檢索出...
【專利技術屬性】
技術研發人員:付琦,時皓軒,黃賢金,侯紹林,李尉誠,蔡文頌,王卓鑫,
申請(專利權)人:中國人壽保險股份有限公司上海數據中心,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。