System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲精品无码专区2,国产真人无码作爱免费视频,色欲狠狠躁天天躁无码中文字幕
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    行業智能體自動微調方法、裝置、電子設備及存儲介質制造方法及圖紙

    技術編號:43948311 閱讀:1 留言:0更新日期:2025-01-07 21:36
    本發明專利技術涉及行業智能體自動微調方法、裝置、電子設備及存儲介質,該方法包括:對行業數據進行預處理。采用思維鏈和思維樹構建初始指令響應對,通過投機推理根據初始指令響應對生成包含多個步驟的第一指令響應對,對每個步驟進行校驗。通過指令編碼器從第一指令響應對中抽取元知識,通過元知識引導指令編碼器生成第二指令響應對。對第二指令響應對進行評估,獲取第二指令響應對的評估分數,去除評估分數低于第一閾值的第二指令響應對。通過相似度判別將差異度超過第二閾值的第二指令響應對加入微調數據集,丟棄差異度低于第二閾值的第二指令響應對。基于微調數據集中的第二指令響應對結合行業數據的指令數據集對面向行業應用的語言模型進行微調。

    【技術實現步驟摘要】

    本專利技術涉及智能體微調,特別是涉及一種行業智能體自動微調方法、裝置、電子設備及存儲介質


    技術介紹

    1、在金融、交通、文旅、政務、鄉村等眾多a2p(application?to?person,應用到個人)場景中,有著廣泛的智能交互、生產自動化、降本增效、提高用戶轉化率和黏性等方面的廣泛需求。各行業借助人工智能技術實現智能化轉型升級、提升市場競爭力的需求變得越來越迫切。智能體能夠借助多模態處理能力,將文字、音頻、圖像等多種類型的數據轉換為機器能夠理解的形式,之后通過思考和記憶等模塊對輸入內容進行推理和規劃,最后調用工具模塊執行對應任務。

    2、智能體在行業應用中能夠將復雜任務分解為更小的子任務,并自動調用工具和api,在提升各行業工作效率和自動化程度方面具有巨大潛力。例如,在金融服務方面,智能體可為銀行、證券等金融機構提供全新的交互方式,用戶通過自然語言指令即可完成金融產品介紹、趨勢分析、投資咨詢等多種金融服務,覆蓋引流、轉化、營銷等多個階段,加速金融業數字化轉型升級。在文旅服務方面,旅游景區可通過智能體對游客進行針對性旅游宣傳并推送相關服務,實現文旅行業在宣傳渠道、在線服務、智能交互等方面的智能化升級。在政務服務方面,智能體可通過多輪交互讓用戶補全可能遺漏的信息、跟蹤投訴建議處理進度、形成服務閉環,解決企業群眾辦事難、辦事繁等問題。

    3、目前,現有的智能體應用大多基于通用大語言模型底座,通過設計一系列針對性的prompt(提示對話框),使智能體具備處理行業應用任務的能力。由于通用大語言模型缺乏對行業知識或行業應用的先驗知識,當遇到復雜行業任務時,任務完成準確率往往較低。其次,通過設計prompt誘導模型生成思維鏈和任務規劃的方式需要進行多次模型推理,而大語言模型采用自回歸方式生成內容,使得整個任務的執行時間較長,難以勝任實時性要求較高的應用場景。此外,智能體微調行業應用智能體的語言模型底座,需要構建大量高質量的指令數據,這些指令數據一般采用人工標注的方式,往往需要大量行業專家對指令數據進行標注和校對,人工成本較高,在實際應用中難以快速推廣復制。

    4、綜上所述,現有的行業智能體微調方法在復雜行業任務中的任務完成準確率較低,且任務推理速度有待進一步提高,人工標注的方式也在一定程度上提高了人工成本,不利于推廣。


    技術實現思路

    1、基于此,有必要針對上述技術問題,提供一種在復雜行業任務中的任務完成準確率較高、任務推理效率較高且能夠減少人工標注成本并利于推廣使用的行業智能體自動微調方法、裝置、電子設備及存儲介質。

    2、本專利技術提供了一種行業智能體自動微調方法,所述方法包括:

    3、獲取行業數據,并對所述行業數據進行預處理,所述行業數據包括行業任務和行業知識的原始文檔,所述預處理包括數據解析和數據清洗;

    4、采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗;

    5、通過指令編碼器從所述第一指令響應對中抽取元知識,并通過所述元知識引導所述指令編碼器生成第二指令響應對,所述元知識包括所述第一指令響應對所述的任務類型、關聯的行業知識和技能種類;

    6、從多個維度對所述第二指令響應對進行評估,以獲取所述第二指令響應對在所述行業任務中的評估分數,并去除所述評估分數低于第一閾值的第二指令響應對;

    7、通過相似度判別將差異度超過第二閾值的第二指令響應對加入至微調數據集,并丟棄差異度低于第二閾值的第二指令響應對;

    8、基于所述微調數據集中的第二指令響應對結合所述行業數據的指令數據集對面向行業應用的語言模型進行訓練微調,以提升所述語言模型在多任務環境中的性能。

    9、在其中一個實施例中,所述獲取行業數據,并對所述行業數據進行預處理,包括:

    10、從多種來源獲取所述行業數據,所述多種來源包括業務介紹、公司內部數據庫以及用戶交互數據;

    11、對所述行業數據進行去噪、填補缺失值以及數據標準化的數據清洗操作,并對清洗后的行業數據進行數據轉換,以適應所述語言模型的輸入要求;

    12、其中,所述數據轉換包括特征縮放、特征編碼、特征選擇以及數據歸一化。

    13、在其中一個實施例中,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,包括:

    14、通過所述投機推理構建指令-響應并行生成算法,以鼓勵所述語言模型生成多樣化指令數據,并通過所述思維鏈和思維樹生成中間推理步驟;

    15、基于所述中間推理步驟對所述行業任務和行業知識進行檢索,以獲取所述行業任務和行業知識中與所述中間推理步驟關聯的事實內容。

    16、在其中一個實施例中,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,還包括:

    17、基于所述事實內容對所述中間推理步驟中的每個步驟進行真實性校驗,并根據校驗結果迭代調整所述中間推理步驟,以消除所述中間推理步驟中與所述事實內容不符合的步驟策略。

    18、在其中一個實施例中,所述通過指令編碼器從所述第一指令響應對中抽取元知識,并通過所述元知識引導所述指令編碼器生成第二指令響應對,包括:

    19、通過所述指令編碼器將所述第一指令響應對編碼為所述元知識,以降低所述第一指令響應對中的噪聲,并從所述第一指令響應對中壓縮提煉出與對應行業任務關聯性高于第三閾值的關鍵信息;

    20、通過解碼器根據所述元知識和所述第一指令響應對生成新的指令數據,所述新的指令數據為所述第二指令響應對。

    21、在其中一個實施例中,所述多個維度包括任務完成度、工具使用度、上下文一致性以及任務相關性;

    22、所述基于所述微調數據集中的第二指令響應對結合所述行業數據的指令數據集對面向行業應用的語言模型進行訓練微調,以提升所述語言模型在多任務環境中的性能,之前還包括:

    23、從所述任務完成度、工具使用度、上下文一致性以及任務相關性對所述第二指令響應對進行評估,并根據評估結果對所述第二指令響應的數據獎勵進行標注;

    24、對比所述語言模型的原始輸出和標注后的所述第二指令響應對,通過相似度判別篩選出數據獎勵標注為第一數值且差異度超過第二閾值的第二指令響應對,并去除數據獎勵標注為第二數值且差異度低于第二閾值的第二指令響應對;

    25、其中,評估分數超過所述第一閾值的第二指令響應對的數據獎勵標注為所述第一數值,評估分數低于所述第一閾值的第二指令響應對的數據獎勵標注為所述第二數值。

    26、在其中一個實施例中,所述微調數據集本文檔來自技高網...

    【技術保護點】

    1.一種行業智能體自動微調方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述獲取行業數據,并對所述行業數據進行預處理,包括:

    3.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,包括:

    4.根據權利要求3所述的行業智能體自動微調方法,其特征在于,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,還包括:

    5.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述通過指令編碼器從所述第一指令響應對中抽取元知識,并通過所述元知識引導所述指令編碼器生成第二指令響應對,包括:

    6.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述多個維度包括任務完成度、工具使用度、上下文一致性以及任務相關性;

    7.根據權利要求6所述的行業智能體自動微調方法,其特征在于,所述微調數據集中的第二指令響應對為篩選出的數據獎勵標注為第一數值且差異度超過第二閾值的第二指令響應對;

    8.一種行業智能體自動微調裝置,其特征在于,所述裝置包括:

    9.一種電子設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至7中任一項所述的行業智能體自動微調方法的步驟。

    10.一種計算機存儲介質,存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述的行業智能體自動微調方法的步驟。

    ...

    【技術特征摘要】

    1.一種行業智能體自動微調方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述獲取行業數據,并對所述行業數據進行預處理,包括:

    3.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,包括:

    4.根據權利要求3所述的行業智能體自動微調方法,其特征在于,所述采用思維鏈和思維樹構建初始指令響應對,并通過投機推理根據構建的初始指令響應對生成包含多個步驟的第一指令響應對,以基于預處理后的所述行業數據對所述第一指令響應對中的每個步驟進行校驗,還包括:

    5.根據權利要求1所述的行業智能體自動微調方法,其特征在于,所述通過指令編碼器從所述第一指...

    【專利技術屬性】
    技術研發人員:肖清王振波郭熹張振字羅剛張立業熊梅艷
    申請(專利權)人:聯通在線信息科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码人妻AV免费一区二区三区| 国产成人精品无码片区在线观看| 影音先锋中文无码一区| MM1313亚洲精品无码久久| 中文字幕无码日韩专区免费| 色综合色国产热无码一| 久久av无码专区亚洲av桃花岛| 亚洲AV无码不卡无码| 欧洲精品久久久av无码电影| 亚洲?V无码乱码国产精品| 国产精品爆乳奶水无码视频| 亚洲成a人无码亚洲成www牛牛| 亚洲国产精品无码久久久蜜芽| 亚洲中文字幕无码亚洲成A人片| 免费无码A片一区二三区| 国产做无码视频在线观看| 亚洲中文无码mv| 国产精品午夜福利在线无码| 无码人妻视频一区二区三区| 国产精品va无码一区二区| 无码一区二区三区亚洲人妻| 狠狠爱无码一区二区三区| 久久久久亚洲Av片无码v| 无码一区18禁3D| 无码专区6080yy国产电影| 亚洲人成无码久久电影网站| 无码中文人妻在线一区二区三区| 在线a亚洲v天堂网2019无码| 熟妇人妻系列aⅴ无码专区友真希| 亚洲AV无码AV日韩AV网站| 人妻丰满AV无码久久不卡| 亚洲av永久无码精品漫画| 亚洲午夜国产精品无码| 中文字幕无码不卡免费视频| 国产高清不卡无码视频| 久久午夜福利无码1000合集| 亚洲VA成无码人在线观看天堂| 色国产色无码色欧美色在线| 无码国模国产在线无码精品国产自在久国产| 性无码免费一区二区三区在线| 亚洲综合无码一区二区|