System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于汽車信息資訊,特別涉及一種多適配器(muti-adapter)微調的汽車問答方法、計算機設備和存儲介質。
技術介紹
1、隨著大語言模型的發展,基于大模型的問答系統在處理復雜問題方面表現出色。大模型具有強大的自然語言處理能力,可以理解和生成豐富的語言表達,極大地提升了問答系統的性能。然而,當前的汽車問答系統大多以預先設定的規則和大量的標注數據進行訓練,這使得它們在處理多種問題時效率低下或準確率不足。盡管大模型在通用領域表現出色,但在特定領域的適配上仍然面臨挑戰。尤其在汽車領域,涉及大量專業知識和特定領域的問題,通用大模型難以準確回答這些專業問題。
2、現有的汽車問答系統功能單一,無法同時處理維修故障類問題、用車類問題和通用領域問題。在面對不同類型的問題時,往往需要依賴多(于1)個獨立的系統或模塊,造成資源浪費和使用不便。而且,當前的汽車智能問答系統主要依賴于預先構建的知識庫進行問答交互,這種方法在面對新的或未包含在知識庫中的問題時表現出明顯的局限性。此外,現有系統的微調技術通常不區分領域,采用單一的微調方法。這導致在處理不同領域問題時可能存在領域偏差,因為各領域的數據集規模和特點不同,無法保證一致的性能。這種方法忽視了不同領域的特異性,難以實現精確的領域適配。
3、所述知識庫的構建和維護需要投入大量的人力和資源,尤其是在處理頻繁更新的汽車技術和故障信息時,成本進一步增加。其中,數據收集、標注和系統更新都是耗時費力的過程,增加了整體運營成本。此外,現有的全參數微調方法成本高昂,不僅需要大量計算資
4、傳統基于規則和知識庫的方法在處理多輪問答和復雜上下文關聯問題時效率低下。系統在應對新問題時需要頻繁更新知識庫,影響響應速度和用戶體驗。同時,現有的微調方法在面對不同領域的問題時無法做到高效適應,導致系統在處理復雜多樣的問題時效率低下。
技術實現思路
1、針對上述問題,本專利技術提供一種muti-adapter微調的汽車問答方法、計算機設備和存儲介質。
2、本專利技術提供的多適配器微調的汽車問答方法,其特征在于,采用基座大模型得到并運用維修故障適配器、用車類問題適配器、通用領域問題適配器和意圖識別適配器后進行汽車問題的問答,包括步驟:
3、s1、所述基座大模型的建立和預訓練;
4、s2、基于維修故障問題數據集對所述基座大模型進行微調得到所述維修故障適配器;
5、s3、基于用車問題數據集對所述基座大模型進行微調得到所述用車類問題適配器;
6、s4、基于通用領域問題數據集對所述基座大模型進行微調得到所述通用領域問題適配器;
7、s5、基于意圖識別任務數據集對所述基座大模型進行微調得到所述意圖識別適配器。
8、進一步,
9、所述基座大模型基于automastergpt?v3.5,但其模型架構包含了40層的自注意力機制層和40層前饋神經網絡層;
10、所述自注意力機制層中的注意力頭數為32個,所述前饋神經網絡層的隱藏單元數量為8192個;
11、所述基座大模型在推理階段的上下文長度為8192個標志。
12、進一步,
13、所述步驟s2包括下列步驟:
14、s21、數據準備:收集和標注汽車維修故障問題數據并整理為維修故障問題數據集;
15、s22、微調訓練:使用所述維修故障問題數據集對所述基座大模型進行微調訓練,得到維修故障適配器;
16、s23、評估與調優:在維修故障問題上評估所述維修故障適配器的性能,并進行相應的優化,具體包括以下步驟:
17、s231、評估準備:選擇維修故障驗證集和測試集;
18、s232、確定維修故障評估標準和基準線,用于衡量所述維修故障適配器的性能是否達到預期;
19、s233、評估指標計算:使用準確率accuracy、精確率precision、召回率recall、f1-score對所述維修故障適配器的性能進行評估;
20、s234、計算所述基座大模型在不同類型維修故障問題上的響應時間;
21、s235、性能分析:根據所述步驟s233評估指標的計算結果,分析所述維修故障適配器在不同類型維修故障問題上的表現;
22、s236、調優:根據所述步驟s235的分析的結果,調整所述維修故障適配器的超參數;進行數據增強、包括增加維修故障問題數據的多樣性和數量;重新訓練所述基座大模型,并進行微調;
23、s237、迭代評估:重復所述步驟s231至步驟s236,直到所述維修故障適配器的性能達到預期標準;
24、s238、最終在獨立維修故障測試集上進行評估,驗證所述維修故障適配器在真實場景中的表現,
25、所述步驟s3包括下列步驟:
26、s31、數據準備:收集和標注用車類問題數據并整理為用車問題數據集;
27、s32、微調訓練:使用所述用車問題數據集對所述基座大模型進行微調訓練,得到用車類問題適配器;
28、s33、評估與調優:在用車問題上評估所述用車類問題適配器的性能,并進行相應的優化,具體包括以下步驟:
29、s331、評估準備:選擇用車問題驗證集和測試集;
30、s332、確定用車問題評估標準和基準線,用于衡量所述用車類問題適配器的表現是否達到預期;
31、s333、評估指標計算:使用準確率accuracy、精確率precision、召回率recall、f1-score對所述用車類問題適配器的性能進行評估;
32、s334、計算所述用車類問題適配器在不同類型用車問題上的響應時間;
33、s335、性能分析:根據所述步驟s333的評估指標的計算結果,分析所述用車類問題適配器在不同類型用車問題上的表現;
34、s336、調優:根據所述步驟s335的分析的結果,調整所述用車類問題適配器的超參數;進行數據增強、包括增加用車類問題數據的多樣性和數量;重新訓練所述基座大模型,并進行微調;
35、s337、迭代評估:重復所述步驟s331至步驟s336,直到所述用車類問題適配器的性能達到預期標準;
36、s338、最終在獨立用車問題測試集上進行評估,以驗證所述用車類問題適配器在真實場景中的表現,
37、所述步驟s4包括下列步驟:
38、s41、數據準備:收集和標注通用領域問題數據并整理為通用領域問題數據集;
39、s42、微調訓練:使用所述通用領域問題數據集對所述基座大模型進行微調訓練,得到通用領域問題適配器;
40、s43、評估與調優:在通用領域問題上評估所述通用領域問題適配器的性能,并進行相應的優化,具體包括以下步驟:
41、s43本文檔來自技高網...
【技術保護點】
1.多適配器微調的汽車問答方法,其特征在于,采用基座大模型得到并運用維修故障適配器、用車類問題適配器、通用領域問題適配器和意圖識別適配器后進行汽車問題的問答,包括步驟:
2.根據權利要求1所述的多適配器微調的汽車問答方法,其特征在于,
3.根據權利要求1或2所述的多適配器微調的汽車問答方法,其特征在于,
4.根據權利要求3所述的多適配器微調的汽車問答方法,其特征在于,
5.根據權利要求4所述的多適配器微調的汽車問答方法,其特征在于,
6.根據權利要求5所述的多適配器微調的汽車問答方法,其特征在于,
7.根據權利要求6所述的多適配器微調的汽車問答方法,其特征在于,
8.計算機設備,其特征在于,包括存儲器、第一處理器及儲存在所述存儲器上并可在所述第一處理器上運行的第一計算機程序,所述第一計算機程序被所述第一處理器執行時實現權利要求1-7中任一項所述的多適配器微調的汽車問答方法。
9.計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質用于儲存第二計算機程序,所述第二計算機程序可被至少一個
...【技術特征摘要】
1.多適配器微調的汽車問答方法,其特征在于,采用基座大模型得到并運用維修故障適配器、用車類問題適配器、通用領域問題適配器和意圖識別適配器后進行汽車問題的問答,包括步驟:
2.根據權利要求1所述的多適配器微調的汽車問答方法,其特征在于,
3.根據權利要求1或2所述的多適配器微調的汽車問答方法,其特征在于,
4.根據權利要求3所述的多適配器微調的汽車問答方法,其特征在于,
5.根據權利要求4所述的多適配器微調的汽車問答方法,其特征在于,
6.根據權利要求5所述的多適配器微調的汽車問答方法,...
【專利技術屬性】
技術研發人員:余文成,
申請(專利權)人:北京百車寶科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。