System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及計算機,尤其涉及一種深度學習模型超參數訓練方法、裝置、設備以及存儲介質。
技術介紹
1、隨著計算機技術的發展,深度學習模型例如卷積神經網絡、生成對抗神經網絡、長短期記憶神經網絡等受到了越來越多的關注,而在深度學習模型的設計中通常包含眾多可調超參數,通過對這些超參數的調整,能夠對深度學習模型內部復雜的模塊流程進行控制,使得深度學習模型可以在不同場景中實現性能最大化。
2、目前,通常由人工進行超參數調整,然而由于深度學習模型單次運行成本較高,超參數規模較大,人工調整超參數往往會是一個繁瑣低效的流程,并且,人工進行超參數調整勢必會引入不確定因素,導致調參準確性較差,有鑒于此,如何提高超參數調整效果,就成了目前亟待解決的技術問題。
技術實現思路
1、本公開的實施例提供了一種深度學習模型超參數訓練方法、裝置、設備以及存儲介質。
2、第一方面,本公開的實施例提供了一種深度學習模型超參數訓練方法,該方法包括:
3、獲取深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法;
4、根據多個不同的超參數范圍和多個不同的超參數搜索算法,生成深度學習模型對應的多個不同的超參數訓練配置數據;
5、針對每個超參數訓練配置數據,構建與其對應的容器,并在容器中使用超參數訓練配置數據中的超參數范圍和超參數搜索算法,以及深度學習模型對應的數據集,對深度學習模型進行超參數訓練,并獲取訓練后的超參數以及模型性能指標;
6、根據多
7、在第一方面的一些可實現方式中,獲取深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法,包括:
8、根據深度學習模型的應用場景和模型特征,確定深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法。
9、在第一方面的一些可實現方式中,獲取深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法,包括:
10、接收用戶通過界面引導輸入的深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法。
11、在第一方面的一些可實現方式中,任意兩個超參數訓練配置數據中的超參數范圍和/或超參數搜索算法不同。
12、在第一方面的一些可實現方式中,構建與超參數訓練配置數據對應的容器,包括:
13、根據超參數訓練配置數據,預估深度學習模型運行所需資源的資源信息;
14、向kubernetes平臺發送容器構建請求,其中,容器構建請求包括資源信息以及深度學習模型的標識信息,以用于kubernetes平臺響應于容器構建請求,根據標識信息從預設的鏡像倉庫中獲取深度學習模型對應的運行環境的鏡像文件,根據資源信息,進行資源分配,以此建立對應的初始容器,并在初始容器中根據鏡像文件搭建深度學習模型對應的運行環境。
15、在第一方面的一些可實現方式中,根據多個不同的超參數訓練配置數據對應的模型性能指標,從多個不同的超參數訓練配置數據對應的超參數中,確定深度學習模型的目標超參數,包括:
16、從多個不同的超參數訓練配置數據對應的超參數中,選擇模型性能指標最優的超參數訓練配置數據對應的超參數作為深度學習模型的目標超參數。
17、在第一方面的一些可實現方式中,該方法還包括:
18、根據目標超參數對深度學習模型進行配置;
19、使用深度學習模型對應的數據集對配置后的深度學習模型進行參數訓練,得到訓練完成的深度學習模型。
20、第二方面,本公開的實施例提供了一種深度學習模型超參數訓練裝置,該裝置包括:
21、獲取模塊,用于獲取深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法;
22、生成模塊,用于根據多個不同的超參數范圍和多個不同的超參數搜索算法,生成深度學習模型對應的多個不同的超參數訓練配置數據;
23、訓練模塊,用于針對每個超參數訓練配置數據,構建與其對應的容器,并在容器中使用超參數訓練配置數據中的超參數范圍和超參數搜索算法,以及深度學習模型對應的數據集,對深度學習模型進行超參數訓練,并獲取訓練后的超參數以及模型性能指標;
24、確定模塊,用于根據多個不同的超參數訓練配置數據對應的模型性能指標,從多個不同的超參數訓練配置數據對應的超參數中,確定深度學習模型的目標超參數。
25、第三方面,本公開的實施例提供了一種電子設備,該電子設備包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器;存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行如以上所述的方法。
26、第四方面,本公開的實施例提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,計算機指令用于使計算機執行如以上所述的方法。
27、在本公開的實施例中,可以根據深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法,生成深度學習模型對應的多個不同的超參數訓練配置數據,然后針對每個超參數訓練配置數據,構建與其對應的容器,并在容器中使用超參數訓練配置數據以及深度學習模型對應的數據集,對深度學習模型進行超參數訓練,并獲取訓練后的超參數以及模型性能指標,進而根據多個不同的超參數訓練配置數據對應的模型性能指標,從多個不同的超參數訓練配置數據對應的超參數中,確定深度學習模型的目標超參數。如此可以實現基于云原生的自動化超參數訓練,有效提高超參數調整效果。
28、應當理解,
技術實現思路
部分中所描述的內容并非旨在限定本公開的實施例的關鍵或重要特征,亦非用于限制本公開的范圍。本公開的其它特征將通過以下的描述變得容易理解。
【技術保護點】
1.一種深度學習模型超參數訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法,包括:
3.根據權利要求1所述的方法,其特征在于,所述獲取深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法,包括:
4.根據權利要求1所述的方法,其特征在于,任意兩個超參數訓練配置數據中的超參數范圍和/或超參數搜索算法不同。
5.根據權利要求1所述的方法,其特征在于,構建與超參數訓練配置數據對應的容器,包括:
6.根據權利要求1所述的方法,其特征在于,所述根據所述多個不同的超參數訓練配置數據對應的模型性能指標,從所述多個不同的超參數訓練配置數據對應的超參數中,確定所述深度學習模型的目標超參數,包括:
7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
8.一種深度學習模型超參數訓練裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,所述電子設備包括:
10.一種
...【技術特征摘要】
1.一種深度學習模型超參數訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述獲取深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法,包括:
3.根據權利要求1所述的方法,其特征在于,所述獲取深度學習模型對應的多個不同的超參數范圍和多個不同的超參數搜索算法,包括:
4.根據權利要求1所述的方法,其特征在于,任意兩個超參數訓練配置數據中的超參數范圍和/或超參數搜索算法不同。
5.根據權利要求1所述的方法,其特征在于,構建與超參數訓練配置數據對應的容器,包括:
【專利技術屬性】
技術研發人員:張美娜,馬龍幫,張海陸,程揭章,高玉坤,李海東,韓德昕,劉俊杰,
申請(專利權)人:中科星圖北岸科技青島有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。