System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及一種基于dse-yolo?v3的水果目標識別方法,屬于人工智能。
技術介紹
1、我國是世界重要的水果產量大國,采后處理是水果加工業龐大的作業環節。分揀技術是水果采后處理過程中的關鍵技術,而傳統的水果分揀設備普遍采用固定孔徑篩選、重量稱量的機械式分揀方法,存在設備使用率低、易對水果表面造成損傷、勞動力成本高等問題,直接影響水果產業的發展。隨著機器視覺的迅速發展,智能分揀機器人逐漸替代機械分揀,基于深度學習的目標識別方法也廣泛應用于水果采摘和分揀領域,為水果采后智能化處理提供了有效手段。為了解決分揀設備能夠在不同季節用于不同類別水果的分揀,提高設備利用率和工作效率,實現水果準確快速識別和高效可靠分揀,提高重疊、遮擋水果目標識別的魯棒性,研究一種快速精準的水果目標識別策略具有重要的應用價值和現實意義。
2、目標識別的主流網絡:
3、模型大致分為單階段模型(one-stage)與兩階段模型(two-stage)。two-stage代表有r-cnn系列,該類方法先提取候選區域的特征信息,再通過檢測網絡對候選區域的目標位置和類別作出預測,計算復雜度相對較高,但檢測精度相比傳統算法性能有很大提高;one-stage代表有yolo系列,該類方法基于回歸思想,不用產生候選框,直接通過網絡模型使用端到端(端到端是指從輸入原始數據到輸出最終結果的整個過程中,不需要進行多個階段的獨立處理或人工干預,由一個統一的模型自動完成所有任務)的方式輸出目標的位置和類別,因此識別速度更快,與two-stage檢測模型相比,檢測
4、在水果采后處理過程中,要想實現機器人自動分揀目標,首先需要對水果的種類、位置進行準確的識別和定位。深度學習算法具有極強的特征提取能力,突破了傳統檢測方法依賴人工設計特征的限制,因此在實際應用中往往具有更好的泛化能力,適用于多種類別水果的目標識別任務。隨著對神經網絡檢測實時性能的要求,redmon等提出了yolo、yolo9000和yolo?v3目標識別網絡模型。yolo?v3是yolo系列的第三代版本,在目標識別準精度和速率方面相對于其他目標識別方法具有很大優勢,應用于多領域場景,故本專利技術選取one-stage模型中的yolo?v3作為水果目標識別的基礎架構。
5、水果目標識別的快速精準性是影響分揀機器人高效作業的重要因素,yolo?v3模型在網絡結構和參數方面還有一定的改進空間。一方面yolo?v3網絡復雜,參數量龐大,計算機運行成本較高;另一方面在識別多水果目標、部分目標存在重疊或遮擋等場景下,易出現漏檢和誤檢的情況,使得在復雜場景下水果圖像的識別效果不佳。
6、針對上述問題(水果采后分揀目標單一、識別精度和速率有待提升,提高重疊、遮擋水果目標識別的魯棒性的問題),為了實現水果采后準確快速識別和高效可靠分揀,本專利技術設計了dse-yolo?v3網絡,以蘋果、橙子和桃子三類常見水果建立混合數據集,并擴增樣本。通過引入深度可分離卷積和通道注意力機制中的senet模塊,并減少殘差單元的循環次數,優化anchor?box數目。該方法有效減少模型參數量和計算量,同時融合不同尺度的淺層和深層信息,以提高重疊、遮擋水果目標識別的魯棒性。
技術實現思路
1、本專利技術針對水果采后分揀目標單一、識別精度和速率有待提升,提高重疊、遮擋水果目標識別的魯棒性的問題,提出一種基于dse-yolo?v3的水果目標識別方法。該方法通過自制混合數據集,對yolo?v3網絡結構進行優化,命名dse-yolo?v3網絡。dse-yolo?v3網絡通過引入深度可分離卷積替代標準卷積,在殘差單元中嵌入通道注意力機制,并減少殘差單元的循環次數,優化anchor?box數目。該方法實現了水果目標的準確識別和可靠分揀,可為水果產業智能化采后分揀提供必要的技術支撐。
2、為解決上述技術問題,本專利技術采用的技術方案為:
3、一種基于dse-yolo?v3的水果目標識別方法,包括以下步驟:
4、步驟1,水果目標的數據集構建;
5、步驟2,建立dse-yolo?v3網絡模型,采用深度可分離卷積dsc和通道注意力senet模塊,并減少殘差單元的循環次數,優化anchor?box數目;
6、步驟3,dse-yolo?v3網絡模型構建:dse-yolo?v3網絡模型包含主干網絡dse-darknet和特征提取架構new-fpn;主干網絡dse-resn是構建的5個注意力殘差模塊,由dpbl和des-res_unit構成,n為注意力殘差單元的循環次數;在特征提取架構new-fpn中,將convset中的3×3cbl替換成dpbl,得到新的卷積集合,命名new-conv?set;
7、步驟4,識別大、中、小三個尺度的水果目標:水果圖像數據輸入到dse-yolo?v3網絡模型中,經主干網絡dse-darknet和new-fpn架構,得到13×13、26×26、52×52三個尺度的特征圖,分別識別大、中、小三個尺度的水果目標;
8、主干網絡dse-darknet第5個注意力殘差模塊輸出的特征圖經一系列卷積后以13×13的尺度y1進行第一次目標識別,之后又上采樣與第4個注意力殘差模塊輸出的特征圖融合,經一系列卷積后以26×26的尺度y2進行第二次目標識別,同時再上采樣與第3個注意力殘差模塊輸出的特征圖融合,經一系列卷積后以52×52的尺度y3進行第三次目標識別;
9、步驟5,訓練dse-yolo?v3網絡模型;
10、步驟6,確定水果目標識別模型的評價指標;
11、步驟7,測試效果驗證。
12、優選地,步驟1選擇蘋果、橙子和桃子作為目標識別對象;
13、水果目標的數據集構建方法包括以下內容:
14、a,自制混合數據集,在線增強擴充數據集樣本:
15、構建網絡和實拍圖像的水果混合數據集,按照70%、20%和10%的比例對數據集進行隨機劃分,訓練集、驗證集和測試集的比例為7:2:1;
16、對訓練集進行在線增強,對圖像隨機進行平移、旋轉、椒鹽噪聲操作,獲得處理后的數據集圖像;
17、b,使用labelimg工具對處理后的數據集圖像進行標注:
18、將標注的數據信息保存為txt格式文件,通過在水果圖像中繪制外接矩形框標注不同類別的水果,標注數據包含水果目標的類別和位置信息,位置信息包括矩形框的寬度、高度以及中心點的橫縱坐標。
19、優選地,深度可分離卷積dsc分解為深度卷積dc和逐點卷積pc兩個操作;
20、dc是對每個輸入通道單獨執行卷積操作,
21、pc將dc的輸出采用1×1的卷積核執行通道調整工作。
22、優選地,在殘差單元中嵌入通道注意力senet模塊,得到注意力殘差單元,卷積前向通道由1×1的cbl,dpbl及senet模塊構成,命名dse-res本文檔來自技高網...
【技術保護點】
1.一種基于DSE-YOLO?v3的水果目標識別方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的方法,其特征在于,步驟1選擇蘋果、橙子和桃子作為目標識別對象;
3.根據權利要求2所述的方法,其特征在于,深度可分離卷積DSC分解為深度卷積DC和逐點卷積PC兩個操作;
4.根據權利要求3所述的方法,其特征在于,在殘差單元中嵌入通道注意力SENet模塊,得到注意力殘差單元,卷積前向通道由1×1的CBL,DPBL及SENet模塊構成,命名DSE-Res_unit;
5.根據權利要求4所述的方法,其特征在于,步驟5中,模型訓練在AMD?Ryzen72700CPU、16GB?RAM、NVIDIA?RTX?2070的配置環境下,使用Linux?Ubuntu16.04操作系統下的PyTorch深度學習框架進行模型加速訓練;
6.根據權利要求5所述的方法,其特征在于,步驟6中,將平均精度AP、平均精度均值mAP作為水果目標識別精度的評價指標,每秒識別水果圖像的幀數FPS作為水果圖像識別速度的評價指標。
7.根據權利要
8.采用權利要求1~7任意一項所述的方法的水果目標識別系統。
9.采用權利要求8所述的水果目標識別系統的水果分揀設備,其特征在于,水果分揀設備包括智能分揀機器人。
10.根據權利要求1~7任意一項所述的方法在不同季節不同類別水果分揀中的應用。
...【技術特征摘要】
1.一種基于dse-yolo?v3的水果目標識別方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的方法,其特征在于,步驟1選擇蘋果、橙子和桃子作為目標識別對象;
3.根據權利要求2所述的方法,其特征在于,深度可分離卷積dsc分解為深度卷積dc和逐點卷積pc兩個操作;
4.根據權利要求3所述的方法,其特征在于,在殘差單元中嵌入通道注意力senet模塊,得到注意力殘差單元,卷積前向通道由1×1的cbl,dpbl及senet模塊構成,命名dse-res_unit;
5.根據權利要求4所述的方法,其特征在于,步驟5中,模型訓練在amd?ryzen72700cpu、16gb?ram、nvidia?rtx?2070的配置環境下,使用linux?ubuntu16.04操作系統下的pytor...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。