System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及智能體微調,特別是涉及一種行業智能體自動微調方法、裝置、電子設備及存儲介質。
技術介紹
1、在金融、交通、文旅、政務、鄉村等眾多a2p(application?to?person,應用到個人)場景中,有著廣泛的智能交互、生產自動化、降本增效、提高用戶轉化率和黏性等方面的廣泛需求。各行業借助人工智能技術實現智能化轉型升級、提升市場競爭力的需求變得越來越迫切。智能體能夠借助多模態處理能力,將文字、音頻、圖像等多種類型的數據轉換為機器能夠理解的形式,之后通過思考和記憶等模塊對輸入內容進行推理和規劃,最后調用工具模塊執行對應任務。
2、智能體在行業應用中能夠將復雜任務分解為更小的子任務,并自動調用工具和api,在提升各行業工作效率和自動化程度方面具有巨大潛力。例如,在金融服務方面,智能體可為銀行、證券等金融機構提供全新的交互方式,用戶通過自然語言指令即可完成金融產品介紹、趨勢分析、投資咨詢等多種金融服務,覆蓋引流、轉化、營銷等多個階段,加速金融業數字化轉型升級。在文旅服務方面,旅游景區可通過智能體對游客進行針對性旅游宣傳并推送相關服務,實現文旅行業在宣傳渠道、在線服務、智能交互等方面的智能化升級。在政務服務方面,智能體可通過多輪交互讓用戶補全可能遺漏的信息、跟蹤投訴建議處理進度、形成服務閉環,解決企業群眾辦事難、辦事繁等問題。
3、目前,現有的智能體應用大多基于通用大語言模型底座,通過設計一系列針對性的prompt(提示對話框),使智能體具備處理行業應用任務的能力。由于通用大語言模型缺乏對行業知識或
4、綜上所述,現有的行業智能體微調方法在復雜行業任務中的任務完成準確率較低,且任務推理速度有待進一步提高,人工標注的方式也在一定程度上提高了人工成本,不利于推廣。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種在復雜行業任務中的任務完成準確率較高、任務推理效率較高且能夠減少人工標注成本并利于推廣使用的行業智能體自動微調方法、裝置、電子設備及存儲介質。
2、本專利技術提供了一種行業智能體自動微調方法,所述方法包括:
3、獲取行業數據,并對所述行業數據進行預處理,所述行業數據包括行業任務和行業知識的原始文檔,所述預處理包括數據解析和數據清洗;
4、采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗;
5、通過指令編碼器從所述第一指令響應對中抽取元知識,并通過所述元知識引導所述指令編碼器生成第二指令響應對,所述元知識包括所述第一指令響應對所述的任務類型、關聯的行業知識和技能種類;
6、從多個維度對所述第二指令響應對進行評估,以獲取所述第二指令響應對在所述行業任務中的評估分數,并去除所述評估分數低于第一閾值的第二指令響應對;
7、通過相似度判別將差異度超過第二閾值的第二指令響應對加入至微調數據集,并丟棄差異度低于第二閾值的第二指令響應對;
8、基于所述微調數據集中的第二指令響應對結合所述行業數據的指令數據集對面向行業應用的語言模型進行訓練微調,以提升所述語言模型在多任務環境中的性能。
9、在其中一個實施例中,所述獲取行業數據,并對所述行業數據進行預處理,包括:
10、從多種來源獲取所述行業數據,所述多種來源包括業務介紹、公司內部數據庫以及用戶交互數據;
11、對所述行業數據進行去噪、填補缺失值以及數據標準化的數據清洗操作,并對清洗后的行業數據進行數據轉換,以適應所述語言模型的輸入要求;
12、其中,所述數據轉換包括特征縮放、特征編碼、特征選擇以及數據歸一化。
13、在其中一個實施例中,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,包括:
14、通過所述投機推理構建指令-響應并行生成算法,以鼓勵所述語言模型生成多樣化指令數據,并通過所述思維鏈和思維樹生成中間推理步驟;
15、基于所述中間推理步驟對所述行業任務和行業知識進行檢索,以獲取所述行業任務和行業知識中與所述中間推理步驟關聯的事實內容。
16、在其中一個實施例中,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,還包括:
17、基于所述事實內容對所述中間推理步驟中的每個步驟進行真實性校驗,并根據校驗結果迭代調整所述中間推理步驟,以消除所述中間推理步驟中與所述事實內容不符合的步驟策略。
18、在其中一個實施例中,所述通過指令編碼器從所述第一指令響應對中抽取元知識,并通過所述元知識引導所述指令編碼器生成第二指令響應對,包括:
19、通過所述指令編碼器將所述第一指令響應對編碼為所述元知識,以降低所述第一指令響應對中的噪聲,并從所述第一指令響應對中壓縮提煉出與對應行業任務關聯性高于第三閾值的關鍵信息;
20、通過解碼器根據所述元知識和所述第一指令響應對生成新的指令數據,所述新的指令數據為所述第二指令響應對。
21、在其中一個實施例中,所述多個維度包括任務完成度、工具使用度、上下文一致性以及任務相關性;
22、所述基于所述微調數據集中的第二指令響應對結合所述行業數據的指令數據集對面向行業應用的語言模型進行訓練微調,以提升所述語言模型在多任務環境中的性能,之前還包括:
23、從所述任務完成度、工具使用度、上下文一致性以及任務相關性對所述第二指令響應對進行評估,并根據評估結果對所述第二指令響應的數據獎勵進行標注;
24、對比所述語言模型的原始輸出和標注后的所述第二指令響應對,通過相似度判別篩選出數據獎勵標注為第一數值且差異度超過第二閾值的第二指令響應對,并去除數據獎勵標注為第二數值且差異度低于第二閾值的第二指令響應對;
25、其中,評估分數超過所述第一閾值的第二指令響應對的數據獎勵標注為所述第一數值,評估分數低于所述第一閾值的第二指令響應對的數據獎勵標注為所述第二數值。
26、在其中一個實施例中,所述微調數據集本文檔來自技高網...
【技術保護點】
1.一種行業智能體自動微調方法,其特征在于,所述方法包括:
2.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述獲取行業數據,并對所述行業數據進行預處理,包括:
3.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,包括:
4.根據權利要求3所述的行業智能體自動微調方法,其特征在于,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,還包括:
5.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述通過指令編碼器從所述第一指令響應對中抽取元知識,并通過所述元知識引導所述指令編碼器生成第二指令響應對,包括:
6.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述多個維度包括任務
7.根據權利要求6所述的行業智能體自動微調方法,其特征在于,所述微調數據集中的第二指令響應對為篩選出的數據獎勵標注為第一數值且差異度超過第二閾值的第二指令響應對;
8.一種行業智能體自動微調裝置,其特征在于,所述裝置包括:
9.一種電子設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至7中任一項所述的行業智能體自動微調方法的步驟。
10.一種計算機存儲介質,存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述的行業智能體自動微調方法的步驟。
...【技術特征摘要】
1.一種行業智能體自動微調方法,其特征在于,所述方法包括:
2.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述獲取行業數據,并對所述行業數據進行預處理,包括:
3.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,包括:
4.根據權利要求3所述的行業智能體自動微調方法,其特征在于,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,還包括:
5.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述通過指令編碼器從所述第一指...
【專利技術屬性】
技術研發人員:肖清,王振波,郭熹,張振字,羅剛,張立業,熊梅艷,
申請(專利權)人:聯通在線信息科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。