System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)涉及計(jì)算機(jī)視覺(jué),更具體的說(shuō)是涉及一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法。
技術(shù)介紹
1、目標(biāo)檢測(cè)是計(jì)算機(jī)視覺(jué)領(lǐng)域的重要課題,目前已被廣泛應(yīng)用于自動(dòng)駕駛、視頻監(jiān)控等
近年來(lái),強(qiáng)化學(xué)習(xí)已經(jīng)確立了其在機(jī)器人和智能代理等領(lǐng)域的重要地位。
2、基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法主要分為one-stage和two-stage兩種。one-stage方法是一次性生成檢測(cè)框和分類(lèi)預(yù)測(cè),犧牲一定的精度來(lái)?yè)Q取更快的檢測(cè)速度。two-stage方法是先生成檢測(cè)框,然后進(jìn)行分類(lèi),犧牲一定的速度來(lái)?yè)Q取更高的精度。為了保證較高的檢測(cè)精度,以及生成區(qū)域建議和與其相應(yīng)的視覺(jué)特征表示,大多數(shù)現(xiàn)有方法采用two-stage方法。一般情況下,two-stage方法是首先采用區(qū)域生成網(wǎng)絡(luò)(region?proposal?network,rpn)結(jié)構(gòu)生成感興趣區(qū)域,然后對(duì)感興趣區(qū)域進(jìn)行分類(lèi),并且微調(diào)它們的定位精度。
3、強(qiáng)化學(xué)習(xí)是指讓智能體在探索環(huán)境時(shí),根據(jù)經(jīng)驗(yàn)采取最佳動(dòng)作,給予最高獎(jiǎng)勵(lì)。簡(jiǎn)言之,強(qiáng)化學(xué)習(xí)是以經(jīng)驗(yàn)驅(qū)動(dòng)的能夠自主學(xué)習(xí)的框架。而深度強(qiáng)化學(xué)習(xí)是將深度學(xué)習(xí)的表征學(xué)習(xí)能力與現(xiàn)有的強(qiáng)化學(xué)習(xí)方法相結(jié)合。
4、針對(duì)傳統(tǒng)基于強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)算法中對(duì)于小目標(biāo)和多目標(biāo)的圖像漏檢問(wèn)題,提出一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,來(lái)解決現(xiàn)有技術(shù)存在的困難,是本領(lǐng)域技術(shù)人員亟需解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本專(zhuān)利技術(shù)提供了一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,用于解決現(xiàn)有技術(shù)中存在的技
2、為了實(shí)現(xiàn)上述目的,本專(zhuān)利技術(shù)提供如下技術(shù)方案:
3、一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,包括以下步驟:
4、獲取采樣視頻;
5、根據(jù)采樣視頻獲取采樣圖像,得到圖像樣本集;
6、構(gòu)建粗檢測(cè)器模型,對(duì)得到的圖像樣本集進(jìn)行粗檢測(cè),得到粗檢測(cè)后圖像樣本集的檢測(cè)結(jié)果;
7、根據(jù)深度神經(jīng)網(wǎng)絡(luò)構(gòu)建強(qiáng)化學(xué)習(xí)智能體,通過(guò)馬爾科夫決策過(guò)程訓(xùn)練強(qiáng)化學(xué)習(xí)智能體;
8、利用yolov5模型對(duì)訓(xùn)練后的強(qiáng)化學(xué)習(xí)智能體進(jìn)行目標(biāo)檢測(cè)。
9、上述的方法,可選的,采樣圖像為采樣視頻中的關(guān)鍵幀。
10、上述的方法,可選的,構(gòu)建粗檢測(cè)器模型的具體內(nèi)容為:
11、采用yolov4目標(biāo)檢測(cè)算法或faster?r-cnn目標(biāo)檢測(cè)算法構(gòu)建粗檢測(cè)器。
12、上述的方法,可選的,yolov4目標(biāo)檢測(cè)算法具體為:
13、對(duì)圖像樣本集進(jìn)行cnn特征提取,并同時(shí)進(jìn)行分類(lèi)和邊界框回歸;
14、faster?r-cnn目標(biāo)檢測(cè)算法具體為:
15、利用分類(lèi)網(wǎng)絡(luò)預(yù)先對(duì)圖像樣本集進(jìn)行特征提取,然后通過(guò)邊界框回歸方法進(jìn)行識(shí)別和定位目標(biāo)物體。
16、上述的方法,可選的,根據(jù)深度神經(jīng)網(wǎng)絡(luò)構(gòu)建強(qiáng)化學(xué)習(xí)智能體的具體內(nèi)容為:
17、將得到的粗檢測(cè)后圖像樣本集的檢測(cè)結(jié)果作為強(qiáng)化學(xué)習(xí)智能體的輸入,通過(guò)深度神經(jīng)網(wǎng)絡(luò)對(duì)圖像邊界框進(jìn)行狀態(tài)編碼,強(qiáng)化學(xué)習(xí)智能體輸出一個(gè)n維向量;
18、根據(jù)強(qiáng)化學(xué)習(xí)智能體的輸入和輸出,構(gòu)建強(qiáng)化學(xué)習(xí)智能體。
19、上述的方法,可選的,n維向量代表強(qiáng)化學(xué)習(xí)智能體對(duì)圖像邊界框進(jìn)行調(diào)整的n個(gè)動(dòng)作的價(jià)值。
20、上述的方法,可選的,馬爾科夫決策過(guò)程的具體內(nèi)容為:
21、對(duì)采集過(guò)程中的每個(gè)時(shí)間步獲得的即時(shí)獎(jiǎng)勵(lì)都乘以一個(gè)折扣因子γ,則從t時(shí)刻開(kāi)始到t時(shí)刻結(jié)束時(shí),獎(jiǎng)勵(lì)之和為:
22、其中,rt為累計(jì)獎(jiǎng)勵(lì),γ為折扣因子且滿(mǎn)足γ∈(0,1]。
23、上述的方法,可選的,訓(xùn)練強(qiáng)化學(xué)習(xí)智能體的具體內(nèi)容為:
24、根據(jù)得到的粗檢測(cè)后圖像樣本集的檢測(cè)結(jié)果,以一個(gè)圖像作為一次情節(jié)對(duì)圖像邊界框進(jìn)行調(diào)整;其中,當(dāng)前狀態(tài)為圖像粗檢測(cè)結(jié)果,通過(guò)神經(jīng)網(wǎng)絡(luò)輸出的動(dòng)作進(jìn)行圖像邊界框的調(diào)整,到達(dá)下一個(gè)狀態(tài),根據(jù)得到的累積獎(jiǎng)勵(lì)完成強(qiáng)化學(xué)習(xí)智能體的訓(xùn)練。
25、上述的方法,可選的,利用yolov5模型對(duì)訓(xùn)練后的強(qiáng)化學(xué)習(xí)智能體進(jìn)行目標(biāo)檢測(cè)的具體內(nèi)容為:
26、利用yolov5模型對(duì)圖像邊界框進(jìn)行最佳調(diào)整并與訓(xùn)練后的強(qiáng)化學(xué)習(xí)智能體結(jié)合,得到目標(biāo)檢測(cè)結(jié)果。
27、經(jīng)由上述的技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本專(zhuān)利技術(shù)公開(kāi)提供了一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其有益效果為:
28、本專(zhuān)利技術(shù)根據(jù)深度神經(jīng)網(wǎng)絡(luò)構(gòu)建強(qiáng)化學(xué)習(xí)智能體,通過(guò)馬爾科夫決策過(guò)程訓(xùn)練強(qiáng)化學(xué)習(xí)智能體,并對(duì)訓(xùn)練后的強(qiáng)化學(xué)習(xí)智能體進(jìn)行目標(biāo)檢測(cè),進(jìn)一步提高基于深度學(xué)習(xí)的目標(biāo)檢測(cè)結(jié)果,得到精準(zhǔn)的目標(biāo)檢測(cè)結(jié)果,提升目標(biāo)檢測(cè)的智能程度和檢測(cè)精度,為目標(biāo)檢測(cè)的研究提供有力的幫助。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,采樣圖像為采樣視頻中的關(guān)鍵幀。
3.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,構(gòu)建粗檢測(cè)器模型的具體內(nèi)容為:
4.根據(jù)權(quán)利要求3所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,YOLOv4目標(biāo)檢測(cè)算法具體為:
5.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,根據(jù)深度神經(jīng)網(wǎng)絡(luò)構(gòu)建強(qiáng)化學(xué)習(xí)智能體的具體內(nèi)容為:
6.根據(jù)權(quán)利要求5所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,N維向量代表強(qiáng)化學(xué)習(xí)智能體對(duì)圖像邊界框進(jìn)行調(diào)整的N個(gè)動(dòng)作的價(jià)值。
7.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,馬爾科夫決策過(guò)程的具體內(nèi)容為:
8.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,訓(xùn)練強(qiáng)化學(xué)習(xí)智能體的具體內(nèi)容為:
9.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的
...【技術(shù)特征摘要】
1.一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,采樣圖像為采樣視頻中的關(guān)鍵幀。
3.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,構(gòu)建粗檢測(cè)器模型的具體內(nèi)容為:
4.根據(jù)權(quán)利要求3所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,yolov4目標(biāo)檢測(cè)算法具體為:
5.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)檢測(cè)方法,其特征在于,根據(jù)深度神經(jīng)網(wǎng)絡(luò)構(gòu)建強(qiáng)化學(xué)習(xí)智能體的具體內(nèi)容...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:韓偉,劉強(qiáng),盛中松,張開(kāi)久,樊建偉,鄭重遠(yuǎn),龔曉雪,王根營(yíng),黃鑫,王軍,黃政,宋淼,
申請(qǐng)(專(zhuān)利權(quán))人:北京電子科技職業(yè)學(xué)院,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。