System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于圖像分類,更為具體地講,涉及一種無約束的訓練后量化圖像分類方法。
技術介紹
1、基于transformer的模型越來越多地被用在各種視覺領域,尤其在圖像分類方面取得了很大的進步。然而,這些成功伴隨著巨大的計算需求,導致大量的內存使用、高功耗和推理延遲的增加。因此,在資源受限的邊緣設備上部署這些圖像分類transformer模型變得非常具有挑戰性,限制了其實際應用。為了應對這些效率瓶頸,模型壓縮技術得到了廣泛研究,其中包括蒸餾、剪枝和量化。在這些技術中,模型量化表現出顯著的優勢,尤其是在低成本部署和實時推理至關重要的實際場景中。
2、模型量化將權重和運行時激活函數輸出壓縮為低比特格式表示。在圖像分類中訓練量后化(post-training?quantization,ptq)是其中最受歡迎的量化方法之一,它只需少量未標注的樣本即可校準量化參數,而無需重新訓練模型。兩種常用的ptq量化器是均勻量化器和log2量化器,都可以通過簡單的量化過程實現高效推理。均勻量化器需要相等的量化范圍,而log2量化器要求量化范圍滿足倍增關系,這些量化范圍的限制對量化產生了一定的約束。盡管大多數transformer模型的權重可以有效被量化并保持較低的量化誤差,但由于高方差使得模型激活無法保持準確性。特別是在softmax和非線性激活層中,這些分布對模型圖像分類的準確性至關重要。因此,有必要去除這些約束限制,開發更靈活和強大的量化器。使得圖像分類transformer模型在使用更少參數的情況下達到更好的分類效果。
>技術實現思路
1、本專利技術的目的在于克服現有技術的不足,提供一種無約束的訓練后量化圖像分類方法,允許基于激活分布進行靈活的量化,而不受限于固定的量化范圍,從而提高圖像分類模型在量化壓縮后的性能。
2、為了實現上述專利技術目的,本專利技術無約束的訓練后量化圖像分類方法包括以下步驟:
3、s1:對于訓練好的圖像分類transformer模型,根據實際情況確定該圖像分類模型中需要量化的網絡層數量n,記第i層待量化網絡層輸入特征圖的通道數為di,待量化特征向量為待量化特征為xi,j,i=1,2,…,n,j=1,2,…,di,待量化權重向量為待量化權重為wi,j;
4、s2:采用均勻量化求解得到每層網絡層權重的量化值ag和量化邊界bg,g=1,2,…,g,g表示權重的量化區間數量;
5、s3:獲取實際的若干張樣本圖像,將其輸入訓練好的圖像分類transformer模型,然后求解如下量化優化問題得到每層待量化網絡層待量化特征的量化值和量化邊界;
6、
7、其中,σ2表示量化誤差,x表示待量化參數,表示待量化參數x的反量化值,p(x)表示待量化參數x的出現概率,k表示參數的量化區間數量,ak、bk分別表示第k個量化區間的量化值和量化邊界,k=1,2,…,k;
8、s4:將待分類圖像輸入圖像分類transformer模型,當網絡層為量化網絡層時,將其輸入特征圖和權重根據對應的量化值和量化邊界量化至整數值,得到量化輸入特征圖和量化權重然后將量化輸入特征圖進行反量化得到反量化輸入特征圖然后求解得到作為輸出特征圖進行輸出,完成圖像分類。
9、本專利技術無約束的訓練后量化圖像分類方法,對于訓練好的圖像分類transformer模型,根據實際需要確定需要量化的網絡層,確定待量化特征和待量化權重,先采用均勻量化求解得到每層網絡層權重的量化值和量化邊界,然后在校準階段獲取實際的若干張樣本圖像并將其輸入訓練好的圖像分類transformer模型,得到每張樣本圖像的每個待量化特征值,然后求解量化優化問題得到每層待量化網絡層待量化特征的量化值和量化邊界,最后在推理階段將待分類圖像輸入圖像分類transformer模型對待量化特征和權重分別進行量化,完成圖像分類。
10、本專利技術具有以下有益效果:
11、1)本專利技術提出了無約束訓練后量化圖像分類方法,設計了量化優化問題,采用基于激活分布特性進行的可變量化范圍,可以通過迭代優化量化范圍減少誤差;
12、2)本專利技術提出了使用查找表進行矩陣乘法的方法,以加速無約束訓練后量化方法中的量化矩陣乘法;
13、3)在各種transformer網絡和圖像分類任務上的廣泛實驗表明,本專利技術具有靈活性和有效性。
本文檔來自技高網...【技術保護點】
1.一種無約束的訓練后量化圖像分類方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的訓練后量化圖像分類方法,其特征在于,所述步驟S3中量化優化問題的求解方法如下:
3.根據權利要求2所述的訓練后量化圖像分類方法,其特征在于,所述步驟S2.1中量化值ak的初始化采用如下公式:
4.根據權利要求1所述的訓練后量化圖像分類方法,其特征在于,所述步驟S4中對反量化輸入特征圖進行偏移校正,具體方法為:
5.根據權利要求1所述的訓練后量化圖像分類方法,其特征在于,所述的計算采用查找表矩陣乘法實現,具體方法為:
【技術特征摘要】
1.一種無約束的訓練后量化圖像分類方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的訓練后量化圖像分類方法,其特征在于,所述步驟s3中量化優化問題的求解方法如下:
3.根據權利要求2所述的訓練后量化圖像分類方法,其特征在于,所述步驟s2.1中量化值...
【專利技術屬性】
技術研發人員:許輝,李夢琦,金正權,郭智慧,趙家銘,曾鵬鵬,邵杰,
申請(專利權)人:電子科技大學深圳高等研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。