A device and method include: for the first convolution layer of convolution neural network, a feature map (406) is generated based on the region of the image to be evaluated and the learned filter from the first convolution layer; for one or more subsequent convolution layers of convolution neural network, a feature map based on the previous convolution layer, a learned filter for the previous convolution layer and a needle The learned filter for the subsequent convolution layer generates a feature map (408); and detects the presence of objects of interest in an area of the image based on the generated feature map of the first convolution layer and one or more subsequent convolutions (410).
【技術(shù)實現(xiàn)步驟摘要】
【國外來華專利技術(shù)】用于構(gòu)建魯棒的深度卷積神經(jīng)網(wǎng)絡(luò)的濾波器重用機制
本公開涉及神經(jīng)網(wǎng)絡(luò),并且更具體地,涉及用于卷積神經(jīng)網(wǎng)絡(luò)的濾波機制。
技術(shù)介紹
對象識別是計算機視覺領(lǐng)域中的重要組成部分。在過去的幾年中,深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)已經(jīng)被用于促進目標識別。深度卷積神經(jīng)網(wǎng)絡(luò)的強大之處在于其能夠?qū)W習(xí)特征的層級的事實。在G.Huang,Z.Liu,Q.Weinberge:DenselyConnectedConvolutionalNetworks,CoRR,abs/1608.06993(2016)(以下簡稱“Huang”)中描述了CNN架構(gòu)的示例。在Huang中,提出了CNN架構(gòu),其在神經(jīng)網(wǎng)絡(luò)中的塊的所有層內(nèi)引入了直接連接。即,在一個塊中,每層以前饋方式直接連接到每個其他層。一個塊通常包括不具有下采樣操作的若干層。針對每一層,所有在先前層的特征圖都被視為單獨的輸入,而其自身的特征圖作為對所有后續(xù)層的輸入被持續(xù)傳遞。核心思想是重用前面的層中所生成的特征圖。然而,這些特征圖本身不會為神經(jīng)網(wǎng)絡(luò)帶來新的信息。
技術(shù)實現(xiàn)思路
因此,本公開提供一種裝置和方法,以針對卷積神經(jīng)網(wǎng)絡(luò)的第一卷積層,基于將被評估的圖像的區(qū)域和來自第一卷積層的經(jīng)學(xué)習(xí)的濾波器來生成特征圖,針對卷積神經(jīng)網(wǎng)絡(luò)的在第一卷積層之后的一個或多個后續(xù)卷積層生成特征圖,以及基于第一卷積層和一個或多個后續(xù)卷積層的所生成的特征圖來在圖像的區(qū)域中檢測感興趣的對象的存在。每個后續(xù)卷積層基于先前卷積層的特征圖、針對先前卷積層的經(jīng)學(xué)習(xí)的濾波器和針對后續(xù)卷積層的經(jīng)學(xué)習(xí)的濾波器而被生成。裝 ...
【技術(shù)保護點】
1.一種計算機實現(xiàn)的方法,包括:/n配置以針對卷積神經(jīng)網(wǎng)絡(luò)的第一卷積層,基于將被評估的圖像的區(qū)域和來自所述第一卷積層的經(jīng)學(xué)習(xí)的濾波器來生成特征圖;/n配置以針對所述卷積神經(jīng)網(wǎng)絡(luò)的一個或多個后續(xù)卷積層生成特征圖,每個后續(xù)卷積層基于先前卷積層的所述特征圖、針對所述先前卷積層的經(jīng)學(xué)習(xí)的濾波器以及針對所述后續(xù)卷積層的經(jīng)學(xué)習(xí)的濾波器而被生成;以及/n配置以基于所述第一卷積層和所述一個或多個后續(xù)卷積層的所生成的特征圖來在所述圖像的所述區(qū)域中檢測感興趣的對象的存在。/n
【技術(shù)特征摘要】
【國外來華專利技術(shù)】1.一種計算機實現(xiàn)的方法,包括:
配置以針對卷積神經(jīng)網(wǎng)絡(luò)的第一卷積層,基于將被評估的圖像的區(qū)域和來自所述第一卷積層的經(jīng)學(xué)習(xí)的濾波器來生成特征圖;
配置以針對所述卷積神經(jīng)網(wǎng)絡(luò)的一個或多個后續(xù)卷積層生成特征圖,每個后續(xù)卷積層基于先前卷積層的所述特征圖、針對所述先前卷積層的經(jīng)學(xué)習(xí)的濾波器以及針對所述后續(xù)卷積層的經(jīng)學(xué)習(xí)的濾波器而被生成;以及
配置以基于所述第一卷積層和所述一個或多個后續(xù)卷積層的所生成的特征圖來在所述圖像的所述區(qū)域中檢測感興趣的對象的存在。
2.根據(jù)權(quán)利要求1所述的方法,進一步包括:
配置以接收從圖像感測設(shè)備所捕獲的所述圖像。
3.根據(jù)權(quán)利要求1和2中任一項所述的方法,進一步包括:
配置以在訓(xùn)練階段期間使用一個或多個訓(xùn)練圖像來針對所述卷積神經(jīng)網(wǎng)絡(luò)的每個卷積層學(xué)習(xí)濾波器。
4.根據(jù)權(quán)利要求3所述的方法,其中所述配置以學(xué)習(xí)濾波器包括:
配置以針對所述卷積神經(jīng)網(wǎng)絡(luò)的所述卷積層初始化濾波器;
配置以使用前向傳播來針對每個卷積層生成特征圖,所述第一卷積層之后的每個后續(xù)卷積層基于先前卷積層的所述特征圖、針對所述先前卷積層的經(jīng)學(xué)習(xí)的濾波器以及針對所述后續(xù)卷積層的濾波器而被生成;
配置以基于所述所生成的特征圖和針對每個類別和相應(yīng)標簽的得分使用損失函數(shù)來計算損失;以及
配置以在所計算的損失已經(jīng)減少的情況下使用后向傳播來針對所述卷積層更新所述濾波器,
其中所述配置以計算特征圖、所述配置以計算損失以及所述配置以更新所述濾波器被重復(fù),直到在所計算的損失不再減小時所述卷積神經(jīng)網(wǎng)絡(luò)收斂為止。
5.根據(jù)權(quán)利要求1至4中任一項所述的方法,其中兩個圖特征針對所述一個或多個后續(xù)卷積層中的每個后續(xù)卷積層被生成。
6.根據(jù)權(quán)利要求5所述的方法,進一步包括:
針對所述一個或多個后續(xù)卷積層中的每個后續(xù)卷積層級聯(lián)所述兩個圖特征。
7.根據(jù)權(quán)利要求1至6中任一項所述的方法,其中所述配置以針對第一卷積層生成特征圖、所述配置以針對一個或多個后續(xù)卷積層生成特征圖以及所述配置以檢測對象的存在在測試階段被執(zhí)行。
8.根據(jù)權(quán)利要求1至7中任一項所述的方法,其中所述配置以檢測包括:
配置以從所述卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用獲得針對所述區(qū)域的得分;以及
配置以將針對所述區(qū)域的所述得分與閾值的值比較,
其中如果針對所述區(qū)域的所述得分大于所述閾值的值,則所述對象在所述區(qū)域中被檢測到。
9.根據(jù)權(quán)利要求1至8中任一項所述的方法,進一步包括:
配置以在所述對象被檢測到的情況下啟動告警。
10.根據(jù)權(quán)利要求1至9中任一項所述的方法,其中所述卷積神經(jīng)網(wǎng)絡(luò)被應(yīng)用于所述圖像的每個區(qū)域,以檢測所述對象是否存在于所述圖像的所述區(qū)域中的任何區(qū)域中。
11.一種包括用于執(zhí)行根據(jù)權(quán)利要求1至10中任一項所述的方法的部件的裝置。
12.一種包括計算機代碼指令的計算機程序產(chǎn)品,所述計算機代碼指令在由至少一個處理器執(zhí)行時,使裝置至少執(zhí)行根據(jù)權(quán)利要求1至10中任一項所述的方法。
13.一種裝置,包括:
存儲器,以及
一個或多個處理器,被配置以:
針對卷積神經(jīng)網(wǎng)絡(luò)的第一卷積層,基于將被評估的圖像的區(qū)域和來自第一卷積層的經(jīng)學(xué)習(xí)的濾波器來生成特征圖;
針對所述卷積神經(jīng)網(wǎng)絡(luò)的一個或多個后續(xù)卷積層生成特征圖,每個后續(xù)卷積層基于先前卷積層的所述特征圖、針對所述先前卷積層的經(jīng)學(xué)習(xí)的濾波器以及針對所述后續(xù)卷積層的經(jīng)學(xué)習(xí)的濾波器而被生成;以及
基于所述第一卷積層和所述一個或多個后續(xù)卷積層的所生成的特征圖來在所述圖像的所述區(qū)域中檢測感興趣的對象的存在。
14.根據(jù)權(quán)利要求13所述的裝置,其中所述一個或多個處理器進一步被配置以接收從圖像感測設(shè)備所捕獲的所述圖像。
15.根據(jù)權(quán)利要求13和14中任一...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:姜曉恒,
申請(專利權(quán))人:諾基亞技術(shù)有限公司,
類型:發(fā)明
國別省市:芬蘭;FI
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。