System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及神經網絡的多任務處理。示例涉及用于訓練神經網絡的裝置和方法以及用于使用經訓練的神經網絡執行多個任務的裝置和方法。
技術介紹
1、在機器學習領域,當處理多個任務時,為每個任務建立一個單獨的機器學習模型可能會占用大量內存。此外,在這些任務特定的模型之間不斷切換可能很耗時,對于需要重新燒錄片上模型的片上部署而言尤其如此。另一方面,依賴單個模型來處理多個任務可能會在保持多樣的輸入數據的可變性和在所有任務中實現高性能方面帶來挑戰。具體而言,歸一化層難以對來自多個分布的輸入(訓練)數據的統計數據進行建模。因此,存在改進機器學習中的多任務處理方法的需求。
技術實現思路
1、這一需求通過獨立權利要求的主題得以解決。
2、本公開的一些方面涉及一種用于訓練神經網絡的裝置,該裝置包括處理電路,處理電路被配置為獲得具有多個任務特定的輸出接口和由這些任務特定的輸出接口共享的多個層的神經網絡,并且通過將權重標準化應用到多個層中的至少一個卷積層的權重來訓練神經網絡,以執行多個任務。
3、本公開的一些方面涉及一種用于訓練神經網絡的方法,該方法包括獲得具有多個任務特定的輸出接口和由這些任務特定的輸出接口共享的多個層的神經網絡,并且訓練神經網絡以執行多個任務,其中訓練神經網絡包括將權重標準化應用到多個層中的至少一個卷積層的權重。
4、本公開的一些方面涉及一種用于使用經訓練的神經網絡執行多個任務的裝置,該裝置包括處理電路,該處理電路被配置為獲得經訓練的神經網絡,其中經訓練的
5、本公開的一些方面涉及一種使用經訓練的神經網絡執行多個任務的方法,該方法包括獲得具有多個任務特定的輸出接口和由這些任務特定的輸出接口共享的多個層的經訓練的神經網絡,其中多個層中的至少兩個卷積層彼此耦合,其間沒有批量歸一化層,并且使用經訓練的神經網絡執行多個任務。
本文檔來自技高網...【技術保護點】
1.一種用于訓練神經網絡的裝置,所述裝置包括處理電路,所述處理電路被配置為:
2.根據權利要求1所述的裝置,其中,所述處理電路被配置為將縮放的權重標準化應用到所述權重。
3.根據權利要求1所述的裝置,其中,所述多個層中的至少兩個卷積層在沒有歸一化層或批量歸一化層介于其間的情況下彼此耦合。
4.根據權利要求1所述的裝置,其中,所述多個層中的至少兩個卷積層彼此直接耦合。
5.根據權利要求1所述的裝置,其中,所述多個層包括比卷積層更少的批量歸一化層。
6.根據權利要求1所述的裝置,其中,所述處理電路被配置為訓練所述神經網絡執行至少兩個任務,其中,所述任務包括圖像分類、對象檢測、圖像分割和姿態估計中的至少一者。
7.根據權利要求1所述的裝置,其中,所述任務特定的輸出接口包括全連接層、單步多框檢測器層、全卷積層和自上而下層中的至少一者。
8.一種用于訓練神經網絡的方法,所述方法包括:
9.一種用于使用經訓練的神經網絡執行多個任務的裝置,所述裝置包括處理電路,所述處理電路被配置為:
1
...【技術特征摘要】
1.一種用于訓練神經網絡的裝置,所述裝置包括處理電路,所述處理電路被配置為:
2.根據權利要求1所述的裝置,其中,所述處理電路被配置為將縮放的權重標準化應用到所述權重。
3.根據權利要求1所述的裝置,其中,所述多個層中的至少兩個卷積層在沒有歸一化層或批量歸一化層介于其間的情況下彼此耦合。
4.根據權利要求1所述的裝置,其中,所述多個層中的至少兩個卷積層彼此直接耦合。
5.根據權利要求1所述的裝置,其中,所述多個層包括比卷積層更少的批量歸一化層。
6.根據權利要求1所...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。