【技術實現(xiàn)步驟摘要】
模型獲取方法、裝置、電子設備、存儲介質和程序產品
本公開涉及計算機
,尤其涉及計算機視覺和深度學習技術等人工智能領域。
技術介紹
隨著深度學習的不斷發(fā)展,其在眾多領域都取得了巨大的成功,且逐漸向全自動機器學習發(fā)展。例如,神經網絡結構搜索技術(NeuralArchitectureSearch,NAS)作為全自動機器學習的研究熱點之一,通過設計高效的搜索方法,自動獲取泛化能力強,硬件要求友好的神經網絡,大量的解放了相關研究人員的創(chuàng)造力。傳統(tǒng)的NAS方法需要獨立采樣并評估模型結構的性能,這種方式會造成很大的性能開銷。為降低性能開銷,基于梯度的超網絡訓練方法得以研究。其中,超網絡可以適用于多種不同的網絡結構應用。基于梯度的超網絡訓練方法,在超網絡訓練過程中,逐步刪除權重最低的連接,隨著連接的逐步刪除,搜索空間會逐步減少,最終收斂到最優(yōu)的結構中。
技術實現(xiàn)思路
本公開提供了一種模型獲取方法、裝置、電子設備、存儲介質和程序產品。根據(jù)本公開的一方面,提供了一種模型獲取方法,包括:獲取參考模型輸出的M個第一軟標簽,其中,所述M個第一軟標簽分別與所述參考模型的M個目標連接層一一對應;依據(jù)所述M個第一軟標簽對超網絡中的子網絡的中間節(jié)點的連接參數(shù)進行更新,得到目標模型;其中,所述子網絡的第i個中間節(jié)點是基于第i個目標連接層對應的第一軟件標簽進行更新,所述第i個中間節(jié)點位于所述超網絡包括的M個連接層中的第i個連接層。根據(jù)本公開的另一方面,提供了一種模型獲取裝置,包括: ...
【技術保護點】
1.一種模型獲取方法,包括:/n獲取參考模型輸出的M個第一軟標簽,其中,所述M個第一軟標簽分別與所述參考模型的M個目標連接層一一對應;/n依據(jù)所述M個第一軟標簽對超網絡中的子網絡的中間節(jié)點的連接參數(shù)進行更新,得到目標模型;/n其中,所述子網絡的第i個中間節(jié)點是基于第i個目標連接層對應的第一軟件標簽進行更新,所述第i個中間節(jié)點位于所述超網絡包括的M個連接層中的第i個連接層。/n
【技術特征摘要】
1.一種模型獲取方法,包括:
獲取參考模型輸出的M個第一軟標簽,其中,所述M個第一軟標簽分別與所述參考模型的M個目標連接層一一對應;
依據(jù)所述M個第一軟標簽對超網絡中的子網絡的中間節(jié)點的連接參數(shù)進行更新,得到目標模型;
其中,所述子網絡的第i個中間節(jié)點是基于第i個目標連接層對應的第一軟件標簽進行更新,所述第i個中間節(jié)點位于所述超網絡包括的M個連接層中的第i個連接層。
2.根據(jù)權利要求1所述的方法,其中,所述子網絡中的每個中間節(jié)點均存在K+1個連接,所述K為大于1的整數(shù),所述依據(jù)所述M個第一軟標簽對超網絡中的子網絡的中間節(jié)點的連接參數(shù)進行更新,包括:
對所述子網絡進行K輪迭代更新,其中,每輪迭代更新刪除每個所述中間節(jié)點的一個連接。
3.根據(jù)權利要求2所述的方法,其中,所述超網絡包括輸出節(jié)點,所述K輪迭代更新中的第j輪更新,包括:
按照預設順序分別對所述子網絡中的中間節(jié)點的連接進行刪除,其中,所述預設順序為按照所述子網絡中的中間節(jié)點與所述輸出節(jié)點之間的距離,由小至大進行排序得到的順序。
4.根據(jù)權利要求3所述的方法,其中,所述按照預設順序分別對所述子網絡中的中間節(jié)點的連接方式進行刪除,包括:
對目標中間節(jié)點進行K+1次刪除操作,得到K+1個中間超網絡,其中,每次刪除操作刪除所述目標中間節(jié)點的一個不同連接,所述目標中間節(jié)點為所述子網絡中的任意中間節(jié)點,且所述目標中間節(jié)點位于所述M個連接層中的第y個連接層,y為1至M中任一整數(shù);
確定所述K+1個中間超網絡中的第y個連接層輸出的K+1個第二軟標簽;
基于所述K+1個第二軟標簽與第y個目標連接層所對應的目標第一軟標簽之間的距離,將所述K+1個中間超網絡中的目標超網絡確定為更新后的超網絡。
5.根據(jù)權利要求4所述的方法,其中,所述目標超網絡為所述K+1個中間超網絡中輸出的第二軟標簽與所述目標第一軟標簽之間的距離最小的超網絡。
6.根據(jù)權利要求1所述的方法,其中,所述參考模型包括的連接層的數(shù)量為所述M的整數(shù)倍,所述M個目標連接層中任意兩個目標連接層之間間隔的連接層數(shù)相同。
7.一種模型獲取裝置,包括:
獲取模塊,用于獲取參考模型輸出的M個第一軟標簽,其中,所述M個第一軟標簽分別與所述參考模型的M個目標連接層一一對應;
更新模塊,用于依據(jù)所述M個第一軟標簽對超網絡中的子網絡的中間節(jié)點的連接參...
【專利技術屬性】
技術研發(fā)人員:希滕,張剛,溫圣召,
申請(專利權)人:北京百度網訊科技有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。