System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及設計圖片開放集識別,具體為一種基于圖像重構的開集識別方法及系統。
技術介紹
1、開放識別模型(open?set?recognition,osr)是機器學習領域的一個重要分支,它旨在解決現實世界中的一個關鍵問題:如何處理在訓練階段未見過的新類別。這一挑戰在許多應用中都非常關鍵,比如安全監控、自然語言處理和醫療診斷等領域。目前在圖像開放識別領域主要有基于支持向量機、基于距離度量的傳統方法以及基于深度學習的方法。基于支持向量機的開放識別模型它通過最大化決策邊界的間隔來提高泛化能力,可以有效地區分已知類別和未知類別,但是在處理大規模數據集時可能會遇到計算效率低下的問題和對參數選擇敏感,參數調整不當可能會導致性能下降。基于距離度量的方法通過計算樣本之間的距離來識別未知類別,這種方法簡單直觀,計算效率較高,但是距離度量方法可能會受到數據分布的影響,如果不同類別的數據分布重疊,識別效果會大打折扣。基于深度學習的開放識別模型能夠學習復雜的數據表示,對于圖像高維數據有很好的識別效果。它們可以通過端到端的訓練自動提取特征,減少了人工干預。需要大量的標注數據進行訓練,而且模型的可解釋性較差,當出現錯誤時難以追蹤原因。
2、在通用開放識別領域提出的,已經有了一定程度的發展,但是在圖像開放識別領域仍然面臨著諸多挑戰:(1)分布變化:模型需要能夠處理與訓練數據分布不同的測試數據,這涉及到復雜的統計學和概率論問題;(2)拒絕選項:開放識別模型需要能夠拒絕那些它不確定的類別,而不是錯誤地將其歸類到已知類別中。因此如何提出一個具有高泛化
技術實現思路
1、本專利技術的目的在于提供一種基于圖像重構的開集識別方法及系統,以解決上述
技術介紹
中提出的問題。
2、為實現上述目的,本專利技術提供如下技術方案:一種基于圖像重構的開集識別方法,所述方法包括以下步驟:
3、利用圖像采集裝置采集分類圖像,圖像類型為rgb,構建圖像分類數據集;
4、將圖像分類數量按照9:1的比例分為已知類和未知類,按照圖像類別分類結果將數據集分為閉合數據集和開放數據集,閉合數據集用于訓練,開放數據集用于測試;
5、將大小不規則的圖像尺寸修改為相同尺寸,修改后的圖像(x)分辨率h×w×c應該不低于512×512×3;
6、將圖像x輸入到卷積神經網絡cnn編碼器中提取圖像深度特征信息進行編碼,編碼過程會進行四次下采樣,輸出向量避免丟失信息丟失,其中n為任意數;
7、將x4輸入到cnn解碼器中進行解碼,重構過程cnn會進行四次上采樣重構輸出與x相同維度的融合x1、x2、x3,防止編碼過程中信息丟失造成重構誤差較大,融合過程計算過程如下:
8、x′3=f3(x4)+x3
9、x′2=f2(x′3)+x2
10、x′1=f1(x′2)+x1
11、
12、其中f(x)為卷積網絡計算過程,x′上采樣之后的輸出;
13、計算x與之間的歐氏距離作為圖像重構誤差,輸入到極值分布概率模型模型中得到概率p確定當前輸入是否是已知類;
14、將x4轉換為一維向量xl輸入到分類器中得到輸入圖像在已知類中的分類分類結果;
15、綜合分類結果判別方式:p大于0.5則認為是未知類,p小于0.5則認為是已知類,圖像類別取分類器得到的分類結果。
16、優選的,方法還包括構建cnn編碼器,采用谷歌公司推出的googlenet深度學習網絡,googlenet模型通過cnn層對模型進行編碼,編碼過程中依次進行1/2、1/4、1/8、1/16四次下采樣,分別輸出x1512×512×32、x2256×256×288、x3128×128×768、x464×64×2038;
17、構建解碼器,解碼器由卷積層,relu層組成,對輸入向量x464×64×2038進行經過卷積計算和四次上采樣輸出每次上采樣融合了融合解碼器輸出特征信息;
18、構建分類器,分類器由線性層、激活曾及softmax層組成,x464×64×2038轉為一維向量xl作為輸入,經過多個線性層輸出n為已知類數量。
19、優選的,方法還包括構建極值分布概率模型,對已知類訓練集中的圖像進行重構訓練,獲取圖像重構解碼器和編碼器權重;采用已經訓練完成之后的重構模型對訓練集中的已知類進行圖像重構,獲取重構誤差,作為構建極值概率分布模型的集合;利用訓練集和極值理論構建重構誤差極值概率模型。
20、優選的,優選極值分布模型理論選擇基礎廣義極值理論,構建過程如下:
21、將訓練數據集中所有的圖像輸入到已訓練號的模型中,得到數據集圖像重構誤差,依據廣義極值分布理論構建圖像重構誤差分布概率模型;
22、極值理論模型介紹如下:
23、為對于給定某一足夠大的閾值ω和記為d的一類分布,該類具有n個樣本,{d1,d2,…,dn},gev可以描述為以下等式,記為pevt:
24、
25、式中,μ為位置參數,σ為尺度參數,ξ形狀參數,μ,ξ∈r,σ>0;pevt是廣義極值分布函數cfd,因此pevt表示的是d類極值分布的概率。
26、優選的,模型訓練過程包括:編碼器作為圖像分類和重構過程公共部分,編碼器、解碼器、分類器權重共同進行訓練,訓練損失函數如下:
27、分類損失函數將分類器數據的結果y與目標值計算交叉熵損失函數
28、計算公式如下:
29、
30、n為批次大小,y類別數;
31、圖像重構損失函數將解碼器輸出結果與輸入圖像計算歐式距離作為重構
32、
33、訓練總損失函數計算公式如下:
34、
35、λc,λr為分類損失和重構損失占比,本文取值為0.4,0.6。
36、一種基于圖像重構的開集識別系統,所述系統包括:
37、圖像采集模塊,利用圖像采集裝置采集分類圖像,圖像類型為rgb,構建圖像分類數據集;
38、圖像分類模塊,將圖像分類數量按照9:1的比例分為已知類和未知類,按照圖像類別分類結果將數據集分為閉合數據集和開放數據集,閉合數據集用于訓練,開放數據集用于測試;
39、圖像尺寸修改模塊,將大小不規則的圖像尺寸修改為相同尺寸,修改后的圖像(x)分辨率h×w×c應該不低于512×512×3;
40、編碼模塊,將圖像x輸入到卷積神經網絡cnn編碼器中提取圖像深度特征信息進行編碼,編碼過程會進行四次下采樣,輸出向量避免丟失信息丟失,其中n為任意數;
41、解碼模塊,將x4輸入到cnn解碼器中進行解碼,重構過程cnn會進行四次上采樣重構輸出與x相同維度的融合x1、x2、x3,防止編碼過程中信息丟失造成重構誤差較大,本文檔來自技高網...
【技術保護點】
1.一種基于圖像重構的開集識別方法,其特征在于:所述方法包括以下步驟:
2.根據權利要求1所述的一種基于圖像重構的開集識別方法,其特征在于:方法還包括構建CNN編碼器,采用谷歌公司推出的GoogleNet深度學習網絡,GoogleNet模型通過CNN層對模型進行編碼,編碼過程中依次進行1/2、1/4、1/8、1/16四次下采樣,分別輸出X1512×512×32、X2256×256×288、X3128×128×768、X464×64×2038;
3.根據權利要求1所述的一種基于圖像重構的開集識別方法,其特征在于:方法還包括構建極值分布概率模型,對已知類訓練集中的圖像進行重構訓練,獲取圖像重構解碼器和編碼器權重;采用已經訓練完成之后的重構模型對訓練集中的已知類進行圖像重構,獲取重構誤差,作為構建極值概率分布模型的集合;利用訓練集和極值理論構建重構誤差極值概率模型。
4.根據權利要求3所述的一種基于圖像重構的開集識別方法,其特征在于:優選極值分布模型理論選擇基礎廣義極值理論,構建過程如下:
5.根據權利要求4所述的一種基于圖像重構的開集識
6.一種根據權利要求1-5任意一項所述的基于圖像重構的開集識別方法的基于圖像重構的開集識別系統,其特征在于:所述系統包括:
7.根據權利要求6所述的一種基于圖像重構的開集識別系統,其特征在于:還包括CNN編碼器構建模塊,采用谷歌公司推出的GoogleNet深度學習網絡,GoogleNet模型通過CNN層對模型進行編碼,編碼過程中依次進行1/2、1/4、1/8、1/16四次下采樣,分別輸出X1512×512×32、X2256×256×288、X3128×128×768、X464×64×2038;
8.根據權利要求6所述的一種基于圖像重構的開集識別系統,其特征在于:還包括構建極值分布概率模型,對已知類訓練集中的圖像進行重構訓練,獲取圖像重構解碼器和編碼器權重;采用已經訓練完成之后的重構模型對訓練集中的已知類進行圖像重構,獲取重構誤差,作為構建極值概率分布模型的集合;利用訓練集和極值理論構建重構誤差極值概率模型。
9.根據權利要求8所述的一種基于圖像重構的開集識別系統,其特征在于:優選極值分布模型理論選擇基礎廣義極值理論,構建過程如下:
10.根據權利要求9所述的一種基于圖像重構的開集識別系統,其特征在于:模型訓練過程包括:編碼器作為圖像分類和重構過程公共部分,編碼器、解碼器、分類器權重共同進行訓練,訓練損失函數如下:
...【技術特征摘要】
1.一種基于圖像重構的開集識別方法,其特征在于:所述方法包括以下步驟:
2.根據權利要求1所述的一種基于圖像重構的開集識別方法,其特征在于:方法還包括構建cnn編碼器,采用谷歌公司推出的googlenet深度學習網絡,googlenet模型通過cnn層對模型進行編碼,編碼過程中依次進行1/2、1/4、1/8、1/16四次下采樣,分別輸出x1512×512×32、x2256×256×288、x3128×128×768、x464×64×2038;
3.根據權利要求1所述的一種基于圖像重構的開集識別方法,其特征在于:方法還包括構建極值分布概率模型,對已知類訓練集中的圖像進行重構訓練,獲取圖像重構解碼器和編碼器權重;采用已經訓練完成之后的重構模型對訓練集中的已知類進行圖像重構,獲取重構誤差,作為構建極值概率分布模型的集合;利用訓練集和極值理論構建重構誤差極值概率模型。
4.根據權利要求3所述的一種基于圖像重構的開集識別方法,其特征在于:優選極值分布模型理論選擇基礎廣義極值理論,構建過程如下:
5.根據權利要求4所述的一種基于圖像重構的開集識別方法,其特征在于:模型訓練過程包括:編碼器作為圖像分類和重構過程公共部分,編碼器、解碼器、分類器權重共同進行訓練,訓練損失函數如下:
6.一種根據權利要...
【專利技術屬性】
技術研發人員:付健,閔憲偉,崔成,周慶勇,
申請(專利權)人:浪潮云信息技術股份公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。