System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及植物病害識別,具體而言,涉及一種基于無監督類別增量學習的植物病害識別方法、系統及存儲介質。
技術介紹
1、植物葉片在感染病害時通常會形成多樣化、復雜化的病斑,因此基于可見光圖像的植物病害檢測通常使用葉片病害圖像作為檢測樣本,對此進行病害的識別與診斷。然而,在植物病害診斷領域的實際應用中,有時會面臨新類別的診斷需求。
2、傳統的深度學習模型在實際應用中,植物病害圖像的標注需要專業人士進行標注,所以大多數植物病害圖像是沒有標簽的。如果新類別數據中沒有標簽標注時傳統的類別增量學習策略會失效,所以需要一種無監督類別增量學習的植物病害圖像分類方法。
3、目前在植物病害檢測領域,無監督類別增量學習的研究較少,還未形成體系。現有的方法大多數都采用基于聚類的算法生成新增類別的偽標簽,該算法要求在整個增量學習過程中每個任務新增的類別數量保持不變,且要求所有的新增數據都屬于新類。傳統的深度學習模型更新方法是利用舊類別數據與新類別數據一起重新訓練模型,這種更新方法不能滿足實時更新和優化的應用需求,時效性較差。如果只采用新類別數據更新模型參數會存在災難性遺忘的問題,即模型完全忘記先前學習到的植物病害特征。因此亟需面向植物病害檢測的類別增量學習策略,使模型能夠在吸收新知識的同時保留舊知識。
技術實現思路
1、本專利技術要解決的技術問題是:
2、現有的深度學習模型不能滿足模型的實時更新和優化的應用需求,時效性較差,且存在新類別數據中沒有標簽標注時類別增量學習策
3、本專利技術為解決上述技術問題所采用的技術方案:
4、本專利技術提供了一種基于無監督類別增量學習的植物病害識別方法,包括如下步驟:
5、s1、采集植物病害圖像數據集,將數據集按類別劃分為多個階段的類別集;
6、s2、利用混合重放算法將當前任務的圖像和從舊類別數據的緩存區中統一采樣選擇的隨機圖像之間進行插值,生成合成樣本;
7、s3、構建simsiam模型,模型包括兩個相同的神經網絡分支,兩個分支共享參數,每個分支包括特征提取模塊、投影頭和預測頭;將合成樣本的兩個隨機增強視圖輸入simsiam模型進行訓練,基于兩個網絡分支的負余弦相似度構建損失函數,多階段的訓練所述simsiam模型;
8、s4、從訓練集中隨機選擇一部分數據作為記憶數據集,將記憶數據集和測試集輸入到simsiam網絡提取特征,計算記憶數據集圖像特征與每個測試集圖像特征的距離,找出距離最近的k個樣本,生成對應的特征標簽,對模型性能進行評估;
9、s5、采用訓練后的simsiam模型對植物病害進行分類。
10、進一步地,s1中將數據集按類別劃分為多個階段的類別集,具體為,將數據集按類別均等的劃分為多個增量任務。
11、進一步地,s1中將數據集按類別劃分為多個階段的類別集,具體為,將總類別數目的一半作為初始任務,剩余類別均等地劃分成多個任務。
12、進一步地,s2中合成樣本的生成過程為:
13、
14、其中,λ為插值系數,為合成樣本,xj,m~m表示從緩沖區m中使用統一采樣選擇的樣本,xi,t表示當前任務。
15、進一步地,s3中合成樣本的兩個隨機增強視圖的獲取方法為采用兩種不同的數據增強方式,包括隨機采用旋轉、加噪聲、縮放或翻轉方式,獲取兩個數據增強圖像。
16、進一步地,s3中的模型訓練過程中,引入停止梯度機制,即訓練過程中只對一個分支計算梯度,而對另一個分支使用停止梯度機制,不進行參數更新,構建的損失函數為:
17、
18、其中,為余弦相似度,和分別為兩個分支經預測頭映射得到特征,和分別為兩個分支經提取模塊得到的分支向量。
19、進一步地,s4中計算記憶數據集圖像特征與每個測試集圖像特征的距離,包括計算記憶數據集圖像特征與每個測試集圖像特征的歐氏距離、曼哈頓距離、切比雪夫距離或者馬氏距離。
20、本專利技術提供一種基于無監督類別增量學習的植物病害識別系統,該系統具有與上述技術方案任一項技術方案所述方法的步驟對應的程序模塊,運行時執行上述的基于無監督類別增量學習的植物病害識別方法中的步驟。
21、本專利技術提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序配置為由處理器調用時實現上述技術方案中任一項所述的基于無監督類別增量學習的植物病害識別方法中的步驟。
22、相較于現有技術,本專利技術的有益效果是:
23、本專利技術一種基于無監督類別增量學習的植物病害識別方法,基于采集的植物病害葉片圖像,利用simsiam模型提取無監督場景下的植物病害的圖像特征,解決了標注大量的病害圖像的耗時且成本高昂的問題,結合混合重放算法利用隨機插值生成新類別數據的合成樣本,使得模型在訓練過程中持續適應無標簽的新類別數據,實現植物病害檢測模型自主的持續更新和優化,滿足對新增病害類別的診斷需求;并能夠進一步提高分類的精度和魯棒性,減少因數據變化導致的分類誤差。
24、本專利技術simsiam模型簡化了對比學習的框架,減少對大規模負樣本對比或復雜的數據增強策略的依賴,在不適用負樣本的情況下,通過最大化同一幅圖像的不同增強視圖之間的相似度學習圖像的特征表示,實現高效、準確的無監督圖像特征提取。
本文檔來自技高網...【技術保護點】
1.一種基于無監督類別增量學習的植物病害識別方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,S1中將數據集按類別劃分為多個階段的類別集,具體為,將數據集按類別均等的劃分為多個增量任務。
3.根據權利要求1所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,S1中將數據集按類別劃分為多個階段的類別集,具體為,將總類別數目的一半作為初始任務,剩余類別均等地劃分成多個任務。
4.根據權利要求2或3所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,S2中合成樣本的生成過程為:
5.根據權利要求4所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,S3中合成樣本的兩個隨機增強視圖的獲取方法為采用兩種不同的數據增強方式,包括隨機采用旋轉、加噪聲、縮放或翻轉方式,獲取兩個數據增強圖像。
6.根據權利要求1所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,S3中的模型訓練過程中,引入停止梯度機制,即訓練過程中只對一個分支計算梯度,而對另一
7.根據權利要求5或6所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,S4中計算記憶數據集圖像特征與每個測試集圖像特征的距離,包括計算記憶數據集圖像特征與每個測試集圖像特征的歐氏距離、曼哈頓距離、切比雪夫距離或者馬氏距離。
8.一種基于無監督類別增量學習的植物病害識別系統,其特征在于,該系統具有與上述權利要求1~7任一項權利要求所述方法的步驟對應的程序模塊,運行時執行上述的基于無監督類別增量學習的植物病害識別方法中的步驟。
9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序配置為由處理器調用時實現權利要求1~7中任一項所述的基于無監督類別增量學習的植物病害識別方法中的步驟。
...【技術特征摘要】
1.一種基于無監督類別增量學習的植物病害識別方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,s1中將數據集按類別劃分為多個階段的類別集,具體為,將數據集按類別均等的劃分為多個增量任務。
3.根據權利要求1所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,s1中將數據集按類別劃分為多個階段的類別集,具體為,將總類別數目的一半作為初始任務,剩余類別均等地劃分成多個任務。
4.根據權利要求2或3所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,s2中合成樣本的生成過程為:
5.根據權利要求4所述的基于無監督類別增量學習的植物病害識別方法,其特征在于,s3中合成樣本的兩個隨機增強視圖的獲取方法為采用兩種不同的數據增強方式,包括隨機采用旋轉、加噪聲、縮放或翻轉方式,獲取兩個數據增強圖像。
6.根據權利要求1所述的基于無監...
【專利技術屬性】
技術研發人員:尹振東,韓淑璐,李大森,趙延龍,張洪駿,
申請(專利權)人:哈爾濱工業大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。