一種深度卷積神經網絡及其執行該網絡的系統技術方案

技術編號：32203851 閱讀：21 留言：0更新日期：2022-02-09 17:08

本發明專利技術揭示了一種深度卷積神經網絡及其執行該網絡的系統，包括順序連接的多個匯集卷積層，每個匯集卷積層獲取輸入并生成輸出，每個匯集卷積層包括：至少一個卷積層，用于使用激活函數對輸入應用至少一個卷積操作；以及池層，用于將池操作應用于所述至少一個卷積層以生成輸出；多個全局平均池層，每個全局平均池層鏈接到多個池化卷積層中的相應一個的輸出，每個全局平均池層將全局平均池化操作應用于相應池化卷積層的輸出；終端隱藏層，用于組合全局平均池層的輸出；以及softmax層，用于將softmax操作應用于終端隱藏層的輸出。本發明專利技術能夠有效的解決中間隱藏層學習的特征丟失以及梯度消失問題。及梯度消失問題。及梯度消失問題。

全部詳細技術資料下載

【技術實現步驟摘要】
一種深度卷積神經網絡及其執行該網絡的系統

[0001]本專利技術屬于人工神經網絡
，特別是涉及一種深度卷積神經網絡及其執行該網絡的系統。

技術介紹

[0002]深度卷積神經網絡(CNN)被公認為是計算機視覺和其他應用的有力工具。例如，人們發現深度CNN能夠從原始像素值中提取豐富的層次特征，并在計算機視覺的分類和分割任務中實現驚人的性能。然而，現有的深度CNN方法可能會遇到各種問題；例如，在中間隱藏層學習的特征丟失和梯度消失問題。
[0003]CNN通常由幾個級聯卷積層組成，包括完全連接的人工神經元；它還可以包括池化層(平均池或最大池)、激活層、用于分類和/或檢測任務的softmax層。卷積層通常用于學習輸入數據的空間局部連通性以進行特征提取。池化層通常是為了減少接受域，從而防止過擬合。激活層，例如非線性激活，通常用于增強學習特征。標準CNN體系結構的各種變體可以使用更深(更多層)和更寬(更大層大小)的體系結構。為了避免深度神經網絡的過度擬合，可以使用一些正則化方法，如dropout或dropconnect；它在訓練過程中以一定的概率關閉學習神經元，并在訓練階段阻止神經元的共同適應。
[0004]一些深度CNN架構方法的成功部分在于使用了適當的非線性激活函數，這些函數定義了從輸入到輸出的值轉換。研究發現，與飽和的對應函數相比，采用線性整流激活函數的整流線性單元(ReLU)可以大大提高CNN的性能，實現更高的精度和更快的收斂速度。ReLU只在正端的使用單位映射，而不使用負的輸入，使得訓練中可...

【技術保護點】

【技術特征摘要】
1.一種深度卷積神經網絡，其特征在于：順序串聯的多個池卷積層，每個池卷積層接收第一輸入并生成一個池輸出，每個所述池卷積層包括：一個隱藏塊，其包括至少一個卷積層，所述卷積層被配置為使用激活函數將至少一個卷積操作應用于所述第一輸入；及一個池化層，其被配置為對所述隱藏塊的輸出進一步的應用池操作生成所述池輸出；終端隱藏塊，其被配置為接收最后順序串聯的池卷積層的匯集輸出作為第二輸入，所述最終隱藏塊包括至少一個卷積層，其被配置為使用所述激活函數將至少一個卷積操作應用于所述第二輸入；多個全局平均池層，每個全局平均池層對隱藏塊的輸出或終端隱藏塊的輸出進行全局平均池操作；終端隱藏層，接收組合全局平均池層的輸出；和softmax層，配置為對終端隱藏層的輸出進行softmax操作處理。2.如權利要求1所述的一種深度卷積神經網絡，其特征在于：所述激活函數是多分段線性函數，其表達式為：3.如權利要求1所述的一種深度卷積神經網絡，其特征在于：所述激活函數的每一部分基于輸入屬于多個端點范圍中的哪一個，端點是可學習的參數。4.如權利要求3所述的一種深度卷積神經網絡，其特征在于：如果輸入落入端點的中心范圍，則激活函數為恒等映射，否則，激活函數為基于端點范圍和相應斜率的線性函數，相應斜率為可學習參數。5.如權利要求1所述的一種深度卷積神經網絡，其特征在于：使用多分段線性函數將具有梯度下降的反向傳播應用于人工卷積神經網絡的層。6.如權利要求5所述的一種深度卷積神經網絡，其特征在于：如果反向傳播的輸出落入端點的中心范圍，則反向傳播函數為1，否則，反向傳播函數基于各自的斜率，各自的斜...

【專利技術屬性】
技術研發人員：何品翰，陳智，
申請(專利權)人：蘇州卓晉通信有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術