【技術(shù)實現(xiàn)步驟摘要】
本申請涉及計算機視覺
,尤其涉及一種車輛識別方法及裝置。
技術(shù)介紹
目前,在識別圖片中的具體內(nèi)容時,通常是包括如下步驟:第一步,在圖片中檢測感興趣物體的位置,比如:若要進行車輛的識別則需要先使用一個檢測器將這輛車從圖片中找出來,檢測器的輸出結(jié)果為該車在圖片上的坐標;第二步,將該車按照坐標位置從原圖中剪切下來,將剪切后的圖片放到分類器中,分類器的輸出結(jié)果為這輛車的識別結(jié)果。在第二步中,通常是將輸入的原始圖片像素值轉(zhuǎn)化為人工定義的特征(human-engineeredfeatures),比如:尺度不變特征變換(SIFT,Scale-invariantfeaturetransform)、方向梯度直方圖(HOG,HistogramofOrientedGradient)特征等,然后將這些變換得到的特征放入分類器中進行分類,最終得到物體的識別結(jié)果。采用這種方式進行識別,由于分類算法是基于人工定義的特征進行分類,使用的模型通常只包含一個提取特征的隱含層,特征往往不足以刻畫和區(qū)分物體,導致識別的準確率較低。現(xiàn)有技術(shù)不足在于:采用現(xiàn)有的方式識別物體準確率較低。
技術(shù)實現(xiàn)思路
本申請實施例提出了一種車輛識別方法及裝置,以解決現(xiàn)有技術(shù)中的物體識別方法識別物體的準確率較低的技術(shù)問題。本申請實施例提供了一種車輛識別方法,包括如下步驟:獲取待識別車輛圖像;利用預先訓練得到的深度學習網(wǎng)絡(luò)識別所述待識別 ...
【技術(shù)保護點】
一種車輛識別方法,其特征在于,包括如下步驟:獲取待識別車輛圖像;利用預先訓練得到的深度學習網(wǎng)絡(luò)識別所述待識別車輛圖像;所述深度學習網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)包括卷積層、池化層和全連接層,所述卷積層的后面連接所述池化層,所述池化層后面連接所述全連接層,最后的全連接層上的每個輸出節(jié)點為所述車輛圖像的車輛屬性概率;根據(jù)所述車輛屬性概率確定所述待識別車輛圖像的車輛屬性信息。
【技術(shù)特征摘要】
1.一種車輛識別方法,其特征在于,包括如下步驟:
獲取待識別車輛圖像;
利用預先訓練得到的深度學習網(wǎng)絡(luò)識別所述待識別車輛圖像;所述深度學
習網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)包括卷積層、池化層和全連接層,所述卷積層的后面連接所
述池化層,所述池化層后面連接所述全連接層,最后的全連接層上的每個輸出
節(jié)點為所述車輛圖像的車輛屬性概率;
根據(jù)所述車輛屬性概率確定所述待識別車輛圖像的車輛屬性信息。
2.如權(quán)利要求1所述的方法,其特征在于,所述深度學習網(wǎng)絡(luò)的訓練步驟
具體包括:
獲取帶有標記的車輛圖像樣本;所述標記包括車輛的屬性信息;
利用預先設(shè)置有初始參數(shù)的深度學習網(wǎng)絡(luò)對所述車輛圖像樣本進行分類;
根據(jù)所述深度學習網(wǎng)絡(luò)輸出結(jié)果與所述車輛的屬性信息之間的差異逐層
反傳至所述深度學習網(wǎng)絡(luò),訓練所述深度學習網(wǎng)絡(luò)的參數(shù)。
3.如權(quán)利要求2所述的方法,其特征在于,所述利用預先設(shè)置有初始參數(shù)
的深度學習網(wǎng)絡(luò)對所述車輛圖像樣本進行分類具體為:利用預先設(shè)置有初始參
數(shù)的卷積核與所述車輛圖像樣本進行卷積計算;經(jīng)過池化層的池化操作以及全
連接層的全連接操作,得到所述車輛圖像樣本的車輛屬性概率;
所述根據(jù)所述深度學習網(wǎng)絡(luò)輸出結(jié)果與所述車輛的屬性信息之間的差異
逐層反傳至所述深度學習網(wǎng)絡(luò),訓練所述深度學習網(wǎng)絡(luò)的參數(shù),具體為:當所
述車輛屬性概率與所述車輛的屬性信息之間存在差異時,調(diào)整所述卷積核中的
參數(shù),直至輸出的車輛屬性概率與所述車輛的屬性信息相符。
4.如權(quán)利要求2所述的方法,其特征在于,所述訓練所述深度學習網(wǎng)絡(luò)的
參數(shù)具體為使用深度網(wǎng)絡(luò)訓練工具caffe進行訓練,所述caffe的參數(shù)包括:基
礎(chǔ)學習率范圍為0.0001~0.01,學習動量范圍為0.9~0.99,權(quán)重懲罰系數(shù)范圍為
0.0001~0.001。
5.如權(quán)利要求1所述的方法,其特征在于,所述深度學習網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)
具體包括5個卷積層、5個池化層和3個全連接層,每個卷積層后面連接所述
池化層,所述池化層后面連接下一個卷積層,在最后一個池化層后面順次連接
3個全連接層,最后一個全連接層的輸出個數(shù)為車輛屬性分類的數(shù)目。
6.如權(quán)利要求1所述的方法,其特征在于,所述利用預先訓練得到的深度
學習網(wǎng)絡(luò)識別所述待識別車輛圖像具體為:
在卷積層,將所述待識別車輛圖像與預先訓練得到的卷積核進行卷積計
算,輸出一個或多個特征圖像;
在池化層,對所述卷積層的輸出進行池化操作;
在全連接層,對所述上一層的輸出進行全連接操作,所述最后的全連接層
的節(jié)點個數(shù)與車輛屬性分類的數(shù)目相同;
對所述最后的全連接層的輸出進行分類,得到車輛屬性概率。
7.如權(quán)利要求1所述的方法,其特征在于,在獲取待識別車輛圖像之后、
在所述利用預先訓練得到的深度學習網(wǎng)絡(luò)識別所述待識別車輛圖像之前,進一
步包括:
對所述待識別車輛圖像進行預處理;
所述預處理至少包括以下一種操作:旋轉(zhuǎn)、直方圖均衡、白平衡、鏡像操
作、隨機剪切、中心化、均值化、調(diào)整大小resize。
8.一種車輛識別裝置,其特征在于,包...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:丁鵬,
申請(專利權(quán))人:北京格靈深瞳信息技術(shù)有限公司,
類型:發(fā)明
國別省市:北京;11
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。