System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及自動化模型(automl)構建,為一種支持規則鏈的智能模型構建系統。
技術介紹
1、automl方法的典型流程涉及四個基本階段:數據預處理、特征工程、模型生成和模型驗證。第一階段涉及數據預處理,(a)生成適當數據集來訓練ml模型的數據收集方法,(b)數據可視化技術,用于幫助數據分析師理解內部數據結構,(c)數據清理機制,消除可用數據集中存在的噪音并避免創建受損模型,以及(d)使用的數據增強程序通過避免過度擬合問題來擴展原始數據集并增強模型的魯棒性。第二階段涉及利用特征工程機制從原始數據中提取特征,使ml算法的設計更加方便有效地描述數據。主要是針對:(a)特征選擇算法,用于拒絕原始特征集中的特征,這些特征看起來是多余的,或者它們會降低模型的性能,以及(b)執行維數的特征提取方法使用專門的功能數據轉換進行縮減,從而改變原始數據特征。第三階段涉及模型生成,被認為是automl方法的核心。模型生成分為兩個過程,即結構識別和架構優化。結構識別涉及確定最能解決當前問題的機器學習方法。常用的典型結構是神經網絡或深度神經網絡。下一步是優化架構和超參數集(例如學習率、層數等)并提出最佳的ml模型。第四階段涉及模型性能的評估,這可以根據明確定義的性能度量來進行。
2、規則鏈是一種基于規則的決策模型,它由一系列規則組成,每個規則都包含一個條件和一個操作。當滿足某個條件時,該規則會觸發相應的操作,并將控制權傳遞給下一個規則。這樣一直執行下去,直到達到終止條件或者所有規則都被執行完畢。由于規則鏈能夠提高代碼復用性、簡化代碼邏輯、
3、現有技術存在的問題
4、automl屬于自動化模型構建方法,其目標都是構建出符合要求的機器學習模型,旨在提高模型的性能和效率。automl可以由用戶配置、調整自動化的過程。但automl在生成模型過程中并不可見,生成的可能是難以解釋的黑盒模型,并且整個生成過程并不可見。支持規則鏈的智能模型構建系統可以通過對于規則鏈中各種規則的設定,對模型生成的進程進行監控,并且若生成過程出現錯誤也可以及時發現錯誤原因。除此之外,automl定制化功能有限,對于一些復雜項目,需要用戶高度定制,automl的自動化流程可能無法滿足特定需求,支持規則鏈的智能模型構建系統由于使用了大語言模型強大的生成能力以及其強大的上下文推理能力,以及對few-shot的提示形式的高度敏感,使得其可以更好的滿足用戶的需求。automl系統采用端到端的優化策略,旨在通過全局搜索找到最佳的模型和配置。這種方法需要不同步驟之間的緊密集成,以確保整體性能最佳。而支持規則鏈的智能模型構建系統將各個模塊分離出來,采用模塊間消息傳遞的方式,提高了靈活性和可擴展性,且由于模塊內部的細節并不影響模塊間的傳遞,可維護性也得到了巨大的提升。
技術實現思路
1、本專利技術要解決的技術問題是:如何實現機器學習智能模型部署的自動化
2、代碼的自動化生成以及自動化部署可以顯著減少模型從開發到上線進行生產的時間。在傳統的手工流程中,開發人員需要進行反復的溝通、測試、調試,并且在模型開發的每一個環節都需要進行管理。自動化流程可以減少人為的干預,使得新模型在開發及部署階段的時間消耗以及人力消耗減少。
3、本專利技術技術方案:
4、一種支持規則鏈的智能模型構建系統,包括:用戶需求及數據接收模塊、機器學習模型生成模塊和上傳至指定倉庫模塊。
5、所述規則鏈是一組決策規則,用于控制各模塊的處理路徑。通過規則鏈,系統可以根據用戶需求、數據質量、模型效果靈活地配置執行路徑,實現智能化和動態化的處理;
6、具體的:
7、用戶需求及數據接收模塊用于接收用戶所需的需求以及用戶想要投入機器學習模型訓練過程中的數據,基于機器學習模型選擇規則,提取用戶需求和數據,并通過高級消息傳遞機制將其傳送至機器學習模型生成模塊;
8、所述機器學習模型選擇規則用于約束用戶需求分類后的結果,使得分類后的結果不在預設的機器學習模型類別中。
9、機器學習模型生成模塊通過代碼生成器生成相應的訓練完成的機器學習模型以及對應的api接口。具體的,機器學習模型生成模塊接收需求和數據,基于機器學習模型訓練規則和用戶所需api生成規則,自動選擇和生成適合的機器學習模型。生成的機器學習模型會被首先存儲在本地服務器內,并且通過消息傳遞機制將生成完畢的模型信息傳遞給上傳至指定倉庫模塊;
10、上傳至指定倉庫模塊基于上傳至指定倉庫模塊規則,將機器學習模型生成模塊生成的機器學習模型及api接口打包,并上傳至系統外用戶指定的docker倉庫,供用戶使用。
11、有益效果
12、本專利技術通過使用強化學習的代碼生成器訓練方式,代碼生成器能夠生成多樣、適應性強、可靠性高的代碼,提升機器學習模型生成模塊生成機器學習模型的效率及可靠性。
本文檔來自技高網...【技術保護點】
1.一種支持規則鏈的智能模型構建系統,其特征在于,包括:用戶需求及數據接收模塊、機器學習模型生成模塊和上傳至指定倉庫模塊;
2.如權利要求1所述支持規則鏈的智能模型構建系統,其特征在于,
3.如權利要求1所述支持規則鏈的智能模型構建系統,其特征在于,所述用戶需求及數據接收模塊用于系統與用戶的交互,捕捉和解析用戶的需求,同時收集和處理用戶提供的各種數據;包括:預訓練語言模型LM和單層全連接網絡FC;
4.如權利要求1所述支持規則鏈的智能模型構建系統,其特征在于,所述代碼生成器包括策略網絡PN和大語言模型LLM;所述策略網絡由預訓練語言模型LM以及一個單層神經網絡SN組成,所述預訓練語言模型LM預訓練后將參數凍結;
5.如權利要求4所述支持規則鏈的智能模型構建系統,其特征在于,所述代碼生成器訓練步驟如下:
6.如權利要求5所述支持規則鏈的智能模型構建系統,其特征在于,在強化學習訓練過程中,給定一個用戶需求,策略網絡PN從機器學習基礎模型候選池中找到K個代碼樣例ei={ei1,ei2,···,eiK},并且通過LLM生成代碼a
7.如權利要求6所述支持規則鏈的智能模型構建系統,其特征在于,評價函數EVAL()實現如下:
8.如權利要求6所述支持規則鏈的智能模型構建系統,其特征在于,使用蒙特卡洛采樣的方法,通過隨機取樣來估計預期的獎勵;
9.如權利要求8所述支持規則鏈的智能模型構建系統,其特征在于,使用策略梯度方法更新策略網絡PN的參數θ;如下:
...【技術特征摘要】
1.一種支持規則鏈的智能模型構建系統,其特征在于,包括:用戶需求及數據接收模塊、機器學習模型生成模塊和上傳至指定倉庫模塊;
2.如權利要求1所述支持規則鏈的智能模型構建系統,其特征在于,
3.如權利要求1所述支持規則鏈的智能模型構建系統,其特征在于,所述用戶需求及數據接收模塊用于系統與用戶的交互,捕捉和解析用戶的需求,同時收集和處理用戶提供的各種數據;包括:預訓練語言模型lm和單層全連接網絡fc;
4.如權利要求1所述支持規則鏈的智能模型構建系統,其特征在于,所述代碼生成器包括策略網絡pn和大語言模型llm;所述策略網絡由預訓練語言模型lm以及一個單層神經網絡sn組成,所述預訓練語言模型lm預訓練后將參數凍結;
5.如權利要求4所述支持規則鏈的智能模型構建...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。