System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于人工智能,特別涉及一種基于大語言模型的機器學習算法改進方法及系統。
技術介紹
1、隨著數據量的急劇增長和計算能力的提升,機器學習已經廣泛應用于各種領域,如圖像識別、自然語言處理、推薦系統等。然而,設計和優化機器學習算法通常需要大量的專業知識和時間。即使是經驗豐富的數據科學家,也很難手動設計出最優的機器學習算法,因為需要考慮的因素太多,如特征選擇、模型選擇、超參數調整、模型融合等。另一方面,大語言模型如gpt-3和gpt-4,已經表現出強大的理解和生成自然語言的能力。這些模型在大規模文本數據上進行預訓練,能夠理解復雜的語言結構和語義信息,生成連貫和準確的文本。因此亟需一種基于大語言模型的機器學習算法改進方法,通過使用大語言模型來分析和生成新的機器學習算法,以提高模型性能和準確度,加速算法研究和創新。
2、公開號為cn109961142b的中國專利公開了一種基于元學習的神經網絡優化方法及裝置,所述方法包括:部署多個機器學習任務,每個機器學習任務均運行于學習框架中,每個學習框架均包括神經網絡本體和神經網絡優化器,所述神經網絡優化器用于對與其對應的神經網絡本體的參數權重進行調整;設置元學習組合優化器;基于所述元學習組合優化器擬合機器學習任務運行過程中各個神經網絡組合的狀態特征與質量參數的映射關系;響應于優化指令,使用所述元學習組合優化器輸出組合優化策略;使用所述組合優化策略對待優化的神經網絡進行優化。所述專利技術存在以下問題:一、由于不同的機器學習任務可能具有不同的數據分布、特征和模式,元學習得到的優化策略可能
技術實現思路
1、為了解決上述現有技術中存在的問題,本專利技術提供一種基于大語言模型的機器學習算法改進方法及系統,通過利用大語言模型分析現有機器學習算法和其模型結構,提高機器學習算法的性能和準確度。
2、為解決上述技術問題,本專利技術提供一種基于大語言模型的機器學習算法改進方法,包括以下步驟:
3、s1:選擇合適的機器學習算法分析提示與待分析的機器學習算法技術文檔輸入大語言模型提取關鍵技術信息,生成現有機器學習算法的分析結果。
4、s2:基于分析結果利用大語言模型根據已有的機器學習算法挖掘潛在的創新點。
5、s3:根據挖掘的潛在創新點,通過使用元學習策略以現有機器學習算法生成新的機器學習算法。
6、s4:結合大語言模型與模型解釋工具分析新生成的機器學習算法,評估所述機器學習算法的算法特征貢獻度。
7、s5:利用大語言模型生成模型融合策略,生成最終的機器學習算法。
8、s6:根據需要利用機器學習算法解決的特定問題建立特征工程提示,將特征工程提示輸入大語言模型生成特征工程策略,將生成的特征工程策略輸入自動化特征工具進行數據特征提取。
9、s7:對提取的數據特征劃分訓練數據集和驗證數據集,利用訓練數據集對最終的機器學習算法進行訓練,并根據驗證數據集評估所述機器學習算法的性能。
10、優選的,所述步驟s4具體為:
11、s41:利用模型解釋工具分析新的機器學習算法,分析結果為機器學習算法中每個算法特征對機器學習算法預測結果的貢獻。
12、s42:將模型解釋工具的分析結果編碼為文本輸入大語言模型,得到相應的解釋性文本,評估機器學習算法的算法特征貢獻度。
13、優選的,所述步驟s5具體為:
14、s51:利用大語言模型評估多個新的機器學習算法的模型結構與預測性能,根據大語言模型生成的評估信息設計優化問題。
15、s52:通過利用大語言模型求解優化問題得到模型融合策略,通過模型融合策略組合多個新的機器學習算法的預測結果,提高機器學習算法的預測性能。
16、優選的,所述步驟s7具體為:
17、s71:利用訓練數據集對最終的機器學習算法進行訓練,聯合大語言模型與automl工具進行參數調優。
18、s72:利用大語言模型生成參數優化建議,將參數優化建議輸入automl工具,利用automl工具自動測試不同的參數組合,通過比較驗證集評估的機器學習算法性能,選擇性能最優的參數配置組合。
19、另一方面,本專利技術提供一種基于大語言模型的機器學習算法改進系統,所述系統實現如本專利技術任一實施例所述的一種基于大語言模型的機器學習算法改進方法,包括算法分析模塊、算法挖掘模塊、元學習模塊、模型解釋模塊、模型融合模塊、特征提取模塊與算法訓練模塊。
20、算法分析模塊,用于選擇合適的機器學習算法分析提示與待分析的機器學習算法技術文檔輸入大語言模型提取關鍵技術信息,生成現有機器學習算法的分析結果。
21、算法挖掘模塊,用于基于分析結果利用大語言模型根據已有的機器學習算法挖掘潛在的創新點。
22、元學習模塊,用于根據挖掘的潛在創新點,通過使用元學習策略以現有機器學習算法生成新的機器學習算法。
23、模型解釋模塊,用于結合大語言模型與模型解釋工具分析新生成的機器學習算法,評估所述機器學習算法的算法特征貢獻度。
24、模型融合模塊,用于利用大語言模型生成模型融合策略,生成最終的機器學習算法。
25、特征提取模塊,用于根據需要利用機器學習算法解決的特定問題建立特征工程提示,將特征工程提示輸入大語言模型生成特征工程策略,將生成的特征工程策略輸入自動化特征工具進行數據特征提取。
26、算法訓練模塊,用于對提取的數據特征劃分訓練數據集和驗證數據集,利用訓練數據集對最終的機器學習算法進行訓練,并根據驗證數據集評估所述機器學習算法的性能。
27、再一方面,本專利技術還提供一種電子設備,所述電子設備包括:存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如本專利技術任一實施例所述的一種基于大語言模型的機器學習算法改進方法。
28、再一方面,本專利技術還提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現如本專利技術任一實施例所述的一種基于大語言模型的機器學習算法改進方法。
29、與現有技術相比,本專利技術具有以下技術效果:
30、本專利技術提供一種基于大語言模型的機器學習算法改進方法,用于提高機器學習模型的性能和準確度。該方法包括利用大語言模型分析現有機器學習算法和模型結構,挖掘潛在的改進和創新點,提出新的機器學習算法。此外,該方法還引入了元學習、模型解釋性、模型融合和自動化特征工程等創新技術。本專利技術使得機器學習算法能夠更好地適應復雜的數據分布,提高模型的泛化能力,使模型在未知數據上表現得更好,加速算法的研究和創新,推動機器學習領域的發展。
本文檔來自技高網...【技術保護點】
1.一種基于大語言模型的機器學習算法改進方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種基于大語言模型的機器學習算法改進方法,其特征在于,所述步驟S4具體為:
3.根據權利要求1所述的一種基于大語言模型的機器學習算法改進方法,其特征在于,所述步驟S5具體為:
4.根據權利要求1所述的一種基于大語言模型的機器學習算法改進方法,其特征在于,所述步驟S7具體為:
5.一種基于大語言模型的機器學習算法改進系統,其特征在于,所述系統實現如權利要求1至4中任一項所述的一種基于大語言模型的機器學習算法改進方法,包括算法分析模塊、算法挖掘模塊、元學習模塊、模型解釋模塊、模型融合模塊、特征提取模塊與算法訓練模塊;
6.一種電子設備,所述電子設備包括:存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1至4中任一項所述的一種基于大語言模型的機器學習算法改進方法。
7.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序
...【技術特征摘要】
1.一種基于大語言模型的機器學習算法改進方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的一種基于大語言模型的機器學習算法改進方法,其特征在于,所述步驟s4具體為:
3.根據權利要求1所述的一種基于大語言模型的機器學習算法改進方法,其特征在于,所述步驟s5具體為:
4.根據權利要求1所述的一種基于大語言模型的機器學習算法改進方法,其特征在于,所述步驟s7具體為:
5.一種基于大語言模型的機器學習算法改進系統,其特征在于,所述系統實現如權利要求1至4中任一項所述的一種基于大語言模型的...
【專利技術屬性】
技術研發人員:鄭耀松,莊莉,梁懿,王秋琳,吳佩穎,
申請(專利權)人:福建億榕信息技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。