System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于人工智能及計算機視覺領域,具體涉及一種基于粒球計算和對比學習的圖像標簽噪聲學習方法。
技術介紹
1、近年來,深度神經網絡模型因其強大的特征表示與學習能力在諸多領域取得巨大成功,同時深度神經網絡模型的性能表現往往依賴于高質量的標注數據。產業界有句諺語把人工智能描述為“有多少人工(即標注)就有多少智能”,說明了數據標注對人工智能的重要性不言而喻。對數據的標注通常有人工標注與模型自動標注兩種方式,前者受標注人員專業領域知識水平,數據質量甚至是惡意的數據投毒等諸多因素制約不可避免的產生一定比例的錯誤標注數據(標簽噪聲);后者的標注模型存在自身的精度以及“模式坍塌”等因素的影響,同樣不可避免產生一定比例的錯誤標注數據(標簽噪聲)。過多的錯誤標注標數據(標簽噪聲)會導致訓練集的數據分布發生變化甚至混亂,從而引發相關任務中模型性能下降,甚至產生特定的傾向性判別。
2、當前針對標簽噪聲主要有兩類解決方案即噪聲容納和噪聲過濾。噪聲容納是指通過建立對錯誤標注樣本不太敏感的魯棒性算法模型,從而弱化標簽噪聲對模型的影響;其代表有魯棒損失函數、正則化等。例如,魯棒損失函數通過在目標函數中設計對噪聲更穩定的優化策略來減少噪聲樣本的負面影響,而正則化技術則通過約束模型復雜度來避免因噪聲數據過擬合。然而,噪聲容納方法通常需要對噪聲特性做出假設,當實際情況與假設不一致時,其性能可能會大幅下降。噪聲過濾則是通過算法將數據中的噪聲樣本清除或修正后再返回模型進行訓練;其代表有集成學習,自適應學習等技術。例如,集成學習方法通過對多個學習器進行投
3、綜上所述,目前這兩類方法在應對以深度神經網絡模型為代表的海量數據訓練樣本中的標簽噪聲問題時仍顯不足。這主要是因為兩類方法對任務場景、數據分布以及噪聲特性具有較強的依賴性,在實際應用中往往需要針對具體問題進行定制化設計,缺乏足夠的通用性。因此,亟需一種對標簽噪聲具有魯棒性的通用表示學習方法來解決該問題。
技術實現思路
1、為解決上述技術問題,本專利技術提出了一種基于粒球計算和對比學習的圖像標簽噪聲學習方法。該方法包括:獲取圖片數據并對其進行預處理,將預處理好的圖片數據輸入到訓練好的圖像標簽噪聲學習模型中,得到圖像分類的結果;
2、所述圖像標簽噪聲學習網絡的訓練過程包括:
3、s1:獲取圖像訓練數據集,分別經預處理得到兩個強數據增強樣本集和一個弱數據增強樣本集;
4、s2:利用第一特征學習器對第一強數據增強樣本xs1提取第一特征zs1;利用第二特征學習器對第二強數據增強樣本xs2提取第二特征zs2;利用第一特征學習器對弱數據增強樣本xw提取第三特征zw;
5、s3:將第三特征zw輸入粒球計算層,在特征級別上進行多粒度劃分,生成若干個聚類簇,每個聚類簇對應一個粒球樣本,根據簇內樣本的特征矩陣和標簽計算得到粒球樣本的特征矩陣及其標簽;
6、s4:將所述粒球樣本的特征矩陣及其標簽輸入分類層,得到圖像分類結果p;根據圖像分類結果和粒球樣本的標簽計算得到交叉熵損失
7、s5:將第一特征zs1輸入預測層,得到第一預測特征qs1;基于第一預測特征qs1和第二特征zs2,以所述圖像分類結果p作為指示函數計算同一類別樣本的預測的概率分布與目標表征分布之間的對比損失
8、s6:根據所述對比損失和交叉熵損失加權得到總損失根據該總損失反向傳播優化所述圖像標簽噪聲學習網絡。
9、本專利技術的有益效果為:本專利技術在圖像標簽噪聲學習網絡的訓練過程中,通過在特征學習器和分類器中間嵌入粒球計算層,將輸入的原始樣本轉換成粒球樣本,使圖像標簽噪聲學習網絡能夠利用樣本的特征空間信息提高該網絡對標簽噪聲的魯棒性;本專利技術采用對比學習框架提取樣本特征,并使用基于粒球改良的對比損失函數計算對比損失,使該網絡能夠在有標簽噪聲的情況下更好地捕捉樣本間的相似性和差異性。相比于現有技術,本專利技術高效利用樣本的特征空間語義信息,在無需額外的數據或進一步優化的情況下,實現一種通用、穩定且高性能的魯棒性特征表示方法。
本文檔來自技高網...【技術保護點】
1.一種基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,包括:
2.根據權利要求1所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,所述粒球計算層的通用描述為:
3.根據權利要求1所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,所述粒球樣本的特征具體為:
4.根據權利要求1所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,將第一特征ZS1輸入預測層,得到第一預測特征QS1;基于第一預測特征QS1和第二特征ZS2,計算所述同類樣本第一預測特征向量和第二特征的余弦相似度,并基于該余弦相似度定義樣本對(xi,xj)的初始對比損失函數,其中,xi表示第i個輸入樣本,xj表示第j個輸入樣本,且i≠j。
5.根據權利要求4所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,所述余弦相似度的計算公式為:
6.根據權利要求5所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,所述樣本對(xi,xj)的初始對比損失函數為:
7.根據權利要求6所述的基
8.根據權利要求7所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,進一步改進所述樣本對(xi,xj)的初始對比損失函數,其具體為:
9.根據權利要求1所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,包括:根據所述對比損失和交叉熵損失加權得到總損失該總損失的計算公式為:
...【技術特征摘要】
1.一種基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,包括:
2.根據權利要求1所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,所述粒球計算層的通用描述為:
3.根據權利要求1所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,所述粒球樣本的特征具體為:
4.根據權利要求1所述的基于粒球計算和對比學習的圖像標簽噪聲學習方法,其特征在于,將第一特征zs1輸入預測層,得到第一預測特征qs1;基于第一預測特征qs1和第二特征zs2,計算所述同類樣本第一預測特征向量和第二特征的余弦相似度,并基于該余弦相似度定義樣本對(xi,xj)的初始對比損失函數,其中,xi表示第i個輸入樣本,xj表示第j個輸入樣本,且i≠j。
5.根據權利要求...
【專利技術屬性】
技術研發人員:朱浩,戴大偉,夏書銀,王國胤,
申請(專利權)人:重慶郵電大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。