System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請屬于人工智能,尤其涉及一種高性能圖像檢測模型訓練方法、系統、設備和介質。
技術介紹
1、卷積神經網絡模型被廣泛應用在圖像分類、物體檢測、目標跟蹤等計算機視覺任務中,并取得了巨大成功。而卷積神經網絡既包含了對網絡結構的探索,又有例如知識蒸餾、剪枝等模型壓縮技術的運用,推動了深度學習技術在移動端、嵌入式端的應用落地,在智能家居、安防、自動駕駛、智慧海洋等領域都有重要貢獻。
2、現有技術輕量化卷積神經網絡通常采用網絡結構搜索算法,具體地,基于enas算法,遍歷預定義空間中的神經網絡結構,在訓練集中進行訓練,根據網絡在驗證集中的性能進行篩選,選出一個性能優良的輕量化模型。
3、上述現有技術的缺點在于:1.上述技術方案需要預先定義一個神經網絡結構的空間,由于沒有任何先驗知識,為了獲得性能優良的神經網絡,該空間需要包含盡可能多的網絡結構,同時為了得到空間中網絡結構的潛力,需要對預選的網絡進行訓練得到對應的性能,如此需要消耗較大的時間和計算資源。2.預定義空間中的網絡結構雖然數量眾多,但其中所有可能的網絡結構搭建規則都是人工預先定義的,由此,上述技術方案嚴重依賴于人工設定的構建網絡的規則,而基于依賴于人工預定義搭建的網絡結構也不是最優的輕量化網絡。
技術實現思路
1、本申請實施例提供了一種高性能圖像檢測模型訓練方法、系統、設備和介質,可以解決上述現有技術問題的至少之一。
2、第一方面,本申請實施例提供了一種高性能圖像檢測模型訓練方法,包括:
4、將多個神經網絡模塊分別采用鄰接矩陣的方式進行表示,基于所述鄰接矩陣,采用統計學習算法獲得多個所述神經網絡模塊中的主要神經網絡模塊;
5、基于所述主要神經網絡模塊,采用強化學習算法構建高性能神經網絡模型,獲得高性能卷積神經網絡;
6、基于所述高性能卷積神經網絡,訓練圖像檢測模型,采用交叉熵損失函數作為圖像檢測模型訓練的優化目標,獲取所述圖像檢測模型預測概率分布與真實標簽的差異度量。
7、進一步的,所述將多個神經網絡模塊分別采用鄰接矩陣的方式進行表示,包括:
8、基于所述神經網絡模塊的計算節點和不同計算節點之間的算子,將多個所述神經網絡模塊依次轉化為有向無環圖,所述算子為卷積核大小和池化層大小;
9、將所述有向無環圖轉化為鄰接矩陣,其中,所述鄰接矩陣的行和列表示計算節點,所述鄰接矩陣的元素值表示不同計算節點之間的連接關系以及不同計算節點之間的算子。
10、進一步的,所述基于所述鄰接矩陣,采用統計學算法獲得多個所述神經網絡模塊中的主要神經網絡模塊,包括:
11、將多個所述鄰接矩陣按列拼接成一個集合矩陣f,其中所述集合矩陣f的每一列表示一個神經網絡模塊;
12、采用非負矩陣分解算法對所述集合矩陣進行分解,獲得f=w×d,其中w表示非負的權重矩陣,d表示包含所述主要神經網絡模塊的矩陣,矩陣d中的列數量表示主要神經網絡模塊的數量。
13、進一步的,所述基于所述主要神經網絡模塊,采用強化學習算法構建高性能神經網絡模型,獲得高性能卷積神經網絡,包括:
14、將循環神經網絡作為構建高性能神經網絡模型的控制器,其中,所述控制器的輸出值的個數與生成的高性能卷積神經網絡的神經網絡模塊的數量一致;
15、將多個所述主要神經網絡模塊初始化為原始數據集,將所述原始數據集隨機劃分為訓練集和驗證集;
16、在所述訓練集以及所述驗證集上交替訓練,生成高性能神經網絡模型,所述高性能神經網絡模型的輸出結果為高性能卷積神經網絡。
17、進一步的,所述在所述訓練集以及所述驗證集上交替訓練,生成高性能神經網絡模型,包括:
18、采用隨機方法初始化所述控制器第一權重,所述第一權重為所述控制器生成的神經網絡的性能;
19、在所述訓練集上訓練生成初級卷積神經網絡,在所述驗證集上評估所述控制器的第一權重;
20、將所述驗證集中評估獲得的第一權重作為獎勵指標,在所述訓練集上訓練所述控制器;
21、對所述控制器的訓練以及對所述控制器的第一權重的評估交替進行,直至在訓練集上生成的初級卷積神經網絡在所述驗證集中的評估結果處于最佳狀態,獲得高性能神經網絡模型,所述最佳狀態為初級卷積神經網絡的性能提升效率低于預設閾值的狀態。
22、進一步的,所述基于所述高性能卷積神經網絡,訓練圖像檢測模型,包括:
23、將所述高性能卷積神經網絡作為主干網絡,構建圖像檢測模型,所述圖像檢測模型用于圖像的識別分類;
24、預訓練初始化所述主干網絡的第二權重;
25、基于retina?net,采用adam?w優化器對所述主干網絡進行訓練。
26、進一步的,所述預訓練初始化所述主干網絡的第二權重包括:
27、將image?net中的圖像作為訓練集,對所述訓練集中的圖像進行預處理生成訓練樣本;
28、基于adam?w優化器,將訓練樣本輸入至高性能卷積神經網絡進行多次訓練后獲得第二權重,所述第二權重為所述主干網絡的初始化權重。
29、第二方面,本申請實施例提供了一種高性能圖像檢測模型訓練系統,包括:
30、第一處理模塊:用于將現有的卷積神經網絡劃分為多個神經網絡模塊;
31、第二處理模塊:用于將多個神經網絡模塊分別采用鄰接矩陣的方式進行表示,基于所述鄰接矩陣,采用統計學習算法獲得多個所述神經網絡模塊中的主要神經網絡模塊;
32、第三處理模塊:用于基于所述主要神經網絡模塊,采用強化學習算法構建高性能神經網絡模型,獲得高性能卷積神經網絡;
33、第四處理模塊:用于基于所述高性能卷積神經網絡,訓練圖像檢測模型,采用交叉熵損失函數作為圖像檢測模型訓練的優化目標,獲取所述圖像檢測模型預測概率分布與真實標簽的差異度量。
34、第三方面,本申請實施例提供了一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現上述高性能圖像檢測模型訓練方法。
35、第四方面,本申請實施例提供了一種計算機可讀存儲介質,包括:所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現上述高性能圖像檢測模型訓練方法。
36、本申請實施例與現有技術相比存在的有益效果是:
37、本專利技術基于現有的輕量化卷積神經網絡,以輕量化卷積神經網絡的神經網絡模塊為學習起點,通過統計學習算法學習其輕量化的特性,同時構建高性能神經網絡模型,通過高性能神經網絡模型生成高性能卷積神經網絡,基于高性能卷積神經網絡訓練生成具有輕量化以及高性能的圖像檢測模型,進而實現圖像識別與檢測任務。此外,用于訓練高性能卷積神經網絡的神經網絡模塊是基于現有的卷積神經網絡中本文檔來自技高網...
【技術保護點】
1.一種高性能圖像檢測模型訓練方法,其特征在于,包括:
2.如權利要求1所述的方法,其特征在于,所述將多個神經網絡模塊分別采用鄰接矩陣的方式進行表示,包括:
3.如權利要求1所述的方法,其特征在于,所述基于所述鄰接矩陣,采用統計學算法獲得多個所述神經網絡模塊中的主要神經網絡模塊,包括:
4.如權利要求1所述的方法,其特征在于,所述基于所述主要神經網絡模塊,采用強化學習算法構建高性能神經網絡模型,獲得高性能卷積神經網絡,包括:
5.如權利要求4所述的方法,其特征在于,所述在所述訓練集以及所述驗證集上交替訓練,生成高性能神經網絡模型,包括:
6.如權利要求1所述的方法,其特征在于,所述基于所述高性能卷積神經網絡,訓練圖像檢測模型,包括:
7.如權利要求6所述的方法,其特征在于,所述預訓練初始化所述主干網絡的第二權重包括:
8.一種高性能圖像檢測模型訓練系統,其特征在于,包括:
9.一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述的方法。
...【技術特征摘要】
1.一種高性能圖像檢測模型訓練方法,其特征在于,包括:
2.如權利要求1所述的方法,其特征在于,所述將多個神經網絡模塊分別采用鄰接矩陣的方式進行表示,包括:
3.如權利要求1所述的方法,其特征在于,所述基于所述鄰接矩陣,采用統計學算法獲得多個所述神經網絡模塊中的主要神經網絡模塊,包括:
4.如權利要求1所述的方法,其特征在于,所述基于所述主要神經網絡模塊,采用強化學習算法構建高性能神經網絡模型,獲得高性能卷積神經網絡,包括:
5.如權利要求4所述的方法,其特征在于,所述在所述訓練集以及所述驗證集上交替訓練,生成高性能神經網絡模型,包括:
6....
【專利技術屬性】
技術研發人員:楊件,何綺珊,吳志銘,
申請(專利權)人:廣東南方網絡信息科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。