System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及人工智能,具體涉及一種目標(biāo)檢測的方法及計算設(shè)備。
技術(shù)介紹
1、隨著深度學(xué)習(xí)技術(shù)和人工智能計算設(shè)備的快速發(fā)展,越來越多的目標(biāo)檢測模型在社會應(yīng)用中得到廣泛部署。然而,這些模型中通常包含大量參數(shù)和計算量,這會嚴(yán)重影響模型在推理階段的運行性能。因此,針對該問題的模型優(yōu)化方法應(yīng)運而生,其中參數(shù)量化技術(shù)是其中一項重要、有效的模型壓縮方法。
2、參數(shù)量化技術(shù)通過將模型參數(shù)由高精度的浮點類型轉(zhuǎn)換為低精度的整數(shù)類型,從而降低模型存儲空間,加快模型推理速度。根據(jù)是否需要額外的訓(xùn)練操作,參數(shù)量化可以分為量化感知訓(xùn)練(qat)和訓(xùn)練后量化(ptq)。其中,qat在訓(xùn)練過程中模擬量化操作,通過訓(xùn)練讓權(quán)重適應(yīng)量化帶來的誤差,因此qat產(chǎn)生的模型預(yù)測效果更好,但其量化流程需要較多的訓(xùn)練數(shù)據(jù)和較大的訓(xùn)練開銷;ptq?是基于已訓(xùn)練好的浮點模型進行量化,不需要進行額外的訓(xùn)練操作,只需要利用少量的校驗數(shù)據(jù)來收集激活(即測試數(shù)據(jù))的最值信息,就可以實現(xiàn)對模型權(quán)重和激活的量化操作,因此,ptq方法更適用于數(shù)據(jù)量和運行時間受限的場景。受計算開銷的影響,大部分硬件設(shè)備在應(yīng)用部署時會采用逐層量化方法,在對檢測網(wǎng)絡(luò)進行逐層量化時發(fā)現(xiàn),在對其混合輸出(即共享卷積的輸出結(jié)果)進行量化后模型的準(zhǔn)確率會大幅下降。
3、為此,需要一種技術(shù)方案,能夠解決檢測網(wǎng)絡(luò)中混合輸出結(jié)果量化損失嚴(yán)重的問題,節(jié)省模型的量化調(diào)優(yōu)時間。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)旨在提供用于目標(biāo)檢測的方法及計算設(shè)備,能夠解決檢測網(wǎng)絡(luò)中
2、根據(jù)本專利技術(shù)的一方面,提供一種目標(biāo)檢測的方法,所述方法包括:
3、將模型的共享卷積層進行拆分,得到第一卷積層和第二卷積層;
4、將中間特征經(jīng)過所述第一卷積層計算得到預(yù)測框輸出;
5、將所述中間特征經(jīng)過所述第二卷積層計算得到分類輸出;
6、對所述預(yù)測框輸出和所述分類輸出進行逐層量化操作;
7、利用逐層量化后的卷積網(wǎng)絡(luò)對輸入的圖片進行目標(biāo)檢測,輸出為目標(biāo)檢測結(jié)果。
8、根據(jù)一些實施例,將模型的共享卷積層進行拆分,得到第一卷積層和第二卷積層,包括:
9、將所述共享卷積層的權(quán)重沿輸出通道維度拆分出回歸權(quán)重;
10、根據(jù)所述回歸權(quán)重,將所述共享卷積層復(fù)制得到所述第一卷積層,所述第一卷積層為回歸卷積層,所述回歸卷積層中只包含回歸權(quán)重。
11、根據(jù)一些實施例,將模型的共享卷積層進行拆分,得到第一卷積層和第二卷積層,包括:
12、將所述共享卷積層的權(quán)重沿輸出通道維度拆分出分類權(quán)重;
13、根據(jù)所述分類權(quán)重,將所述共享卷積層復(fù)制得到所述第二卷積層,所述第二卷積層為分類卷積層,所述分類卷積層中只包含分類權(quán)重。
14、根據(jù)一些實施例,對所述預(yù)測框輸出和所述分類輸出進行逐層量化操作,包括:
15、通過第一量化策略收集模型中間特征的第一最值信息對;
16、通過第二量化策略收集模型權(quán)重的第二最值信息對;
17、基于所述第一最值信息對和所述第二最值信息對得到第一量化參數(shù)、第二量化參數(shù)、第三量化參數(shù)和第四量化參數(shù);
18、根據(jù)所述第一量化參數(shù)、所述第二量化參數(shù)、所述第三量化參數(shù)和所述第四量化參數(shù),進行逐層量化操作,所述逐層量化操作包括量化操作和反量化操作。
19、根據(jù)一些實施例,基于所述第一最值信息對和所述第二最值信息對得到第一量化參數(shù)、第二量化參數(shù)、第三量化參數(shù)和第四量化參數(shù),包括:
20、用所述第一最值信息對的最大值和最小值的差值,與量化位寬的最大值的比值作為所述第一量化參數(shù);
21、用所述第二最值信息對的最大值和最小值的差值,與量化位寬的最大值的比值作為所述第二量化參數(shù)。
22、根據(jù)一些實施例,基于所述第一最值信息對和所述第二最值信息對得到第一量化參數(shù)、第二量化參數(shù)、第三量化參數(shù)和第四量化參數(shù),還包括:
23、對所述第一最值信息對的最小值,與所述第一量化參數(shù)的比值進行取整操作,作為第一數(shù)值;
24、選取所述第一數(shù)值與所述量化位寬最大值中最小的值,作為第二數(shù)值;
25、判斷所述第二數(shù)值大于零,則將所述第二數(shù)值作為所述第三量化參數(shù);
26、對所述第二最值信息對的最小值,與所述第二量化參數(shù)的比值進行取整操作,作為第三數(shù)值;
27、選取所述第三數(shù)值與所述量化位寬最大值中最小的值,作為第四數(shù)值;
28、判斷所述第四數(shù)值大于零,則將所述第四數(shù)值作為所述第四量化參數(shù)。
29、根據(jù)一些實施例,根據(jù)所述第一量化參數(shù)、所述第二量化參數(shù)、所述第三量化參數(shù)和所述第四量化參數(shù),進行逐層量化操作,所述逐層量化操作包括量化操作和反量化操作,包括:
30、計算所述中間特征與所述第一量化參數(shù)的比值,作為第五數(shù)值;
31、計算所述第五數(shù)值與所述第三量化參數(shù)的相加和,作為第六數(shù)值;
32、對所述第六數(shù)值進行取整操作;
33、對所述第六數(shù)值、所述量化位寬的最大值和所述量化位寬的最小值,進行截斷操作,得到第七數(shù)值;
34、所述第七數(shù)值作為所述中間特征經(jīng)過所述量化操作的結(jié)果;
35、所述第七數(shù)值與所述第三量化參數(shù)的差值,與所述第一量化參數(shù)的乘積,作為所述中間特征經(jīng)過所述反量化操作的結(jié)果。
36、根據(jù)一些實施例,根據(jù)所述第一量化參數(shù)、所述第二量化參數(shù)、所述第三量化參數(shù)和所述第四量化參數(shù),進行逐層量化操作,還包括:
37、計算所述權(quán)重與所述第二量化參數(shù)的比值,作為第八數(shù)值;
38、計算所述第八數(shù)值與所述第四量化參數(shù)的相加和,作為第九數(shù)值;
39、對所述第九數(shù)值進行取整操作;
40、對所述第九數(shù)值、所述量化位寬的最大值和所述量化位寬的最小值,進行截斷操作,得到第十?dāng)?shù)值;
41、所述第十?dāng)?shù)值作為所述權(quán)重經(jīng)過所述量化操作的結(jié)果;
42、所述第十?dāng)?shù)值與所述第四量化參數(shù)的差值,與所述第二量化參數(shù)的乘積,作為所述權(quán)重經(jīng)過所述反量化操作的結(jié)果。
43、根據(jù)本專利技術(shù)的另一方面,提供一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上任一項所述的方法。
44、根據(jù)本專利技術(shù)的另一方面,提供一種計算設(shè)備,包括:
45、處理器;以及
46、存儲器,存儲有計算機程序,當(dāng)所述計算機程序被所述處理器執(zhí)行時,實現(xiàn)如上任一項所述的方法。
47、根據(jù)本專利技術(shù)的實施例,通過將模型的共享卷積層進行拆分,得到第一卷積層和第二卷積層,將中間特征經(jīng)過第一卷積層計算得到預(yù)測框輸出,經(jīng)過第二卷積層計算得到分類輸出,最后進行逐層量化操作。本專利技術(shù)采用分頭量化技術(shù),即把混合輸出分為回歸頭和分類頭兩部分分別進行量化操作,可以本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種目標(biāo)檢測的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將模型的共享卷積層進行拆分,得到第一卷積層和第二卷積層,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,將模型的共享卷積層進行拆分,得到第一卷積層和第二卷積層,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對所述預(yù)測框輸出和所述分類輸出進行逐層量化操作,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,基于所述第一最值信息對和所述第二最值信息對得到第一量化參數(shù)、第二量化參數(shù)、第三量化參數(shù)和第四量化參數(shù),包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,基于所述第一最值信息對和所述第二最值信息對得到第一量化參數(shù)、第二量化參數(shù)、第三量化參數(shù)和第四量化參數(shù),還包括:
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述第一量化參數(shù)、所述第二量化參數(shù)、所述第三量化參數(shù)和所述第四量化參數(shù),進行逐層量化操作,所述逐層量化操作包括量化操作和反量化操作,包括:
8.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述第一量化參數(shù)、
9.一種計算機程序產(chǎn)品,其特征在于,包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-8中任一項所述的方法。
10.一種計算設(shè)備,其特征在于,包括:
...【技術(shù)特征摘要】
1.一種目標(biāo)檢測的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將模型的共享卷積層進行拆分,得到第一卷積層和第二卷積層,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,將模型的共享卷積層進行拆分,得到第一卷積層和第二卷積層,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,對所述預(yù)測框輸出和所述分類輸出進行逐層量化操作,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,基于所述第一最值信息對和所述第二最值信息對得到第一量化參數(shù)、第二量化參數(shù)、第三量化參數(shù)和第四量化參數(shù),包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,基于所述第一最值信息對...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:馬志偉,熊超,牛昕宇,
申請(專利權(quán))人:深圳鯤云信息科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。