本發明專利技術公開了一種深度學習圖像識別輸入所用張量的生成方法及其應用,通過環形排列多光源照明或與此機理類似的結構照明,生成的同一目標物體不同模式的高維度圖像張量,對圖像張量在第三維做傅里葉變換或進行其他形式的級數展開,只保留其幅值信息,而過濾相位信息。取幅值從低頻到高頻排列,組成新的特征向量,在有效降低張量維度的同時保留主要的特征,生成表面檢測深度學習圖像算法的張量輸入。該方法能有效保留圖像有效信息,同時減少張量輸入維度,加快表面檢測深度學習網絡的訓練和推理,從而提高表面檢測的檢測速度和精度,實現實時檢測,提高目標產品的合格率。
【技術實現步驟摘要】
一種深度學習圖像識別輸入所用張量的生成方法及其應用
本專利技術涉及圖像識別
,具體為一種深度學習圖像識別輸入所用張量的生成方法及其應用。
技術介紹
工業產品的表面缺陷直接影響產品外觀的質量,表面檢測技術在工業領域上的應用也越來越受到人們的重視。傳統表面檢測的方法依賴于人工進行,但人工缺陷檢測存在勞動強度過強、工作效率低、檢測準確性不高、容易受到主觀因素影響等缺點,使得基于機器視覺的主動缺陷檢測替代傳統人工檢測已經成為了重要趨勢。傳統的機器視覺的表面檢測方法基于圖像分割和特征提取算法,但這些分割和特征提取算法計算比較復雜,分割效果與圖像相關,沒有一種通用的分割算法可以實現所有圖像的分割和特征提取處理,通常難以對圖像進行實時檢測。近年來,深度學習在機器視覺領域得到廣泛的應用,深度學習網絡能夠從大量樣本集中學習數據本質特征,基于深度學習的圖像表面缺陷檢測方法也得到了應用發展。為了獲取高質量的表面圖像,提高深度學習表面檢測算法的穩定性和可靠性。機器視覺解決方案普遍采用環形排列多光源照明,或與此機理類似的結構照明,通過多次拍攝所得同一目標物體不同模式的圖像組成高維度圖像張量作為網絡輸入向量。但是由此生成的高維度圖像張量使得訓練數據集過于龐大,同時提高深度學習網絡算法訓練的難度,降低了算法運行的效率,難以滿足實時性的要求。故此需要提供一種可以更加有效地訓練深度學習表面檢測算法,降低訓練數據集大小,提高深度學習檢測算法的推理速度,實現表面質量實時檢測的方案。
技術實現思路
本專利技術的目的是為了提供一種用于表面檢測的深度學習圖像識別輸入張量的生成方法及其應用,用于解決基于深度學習表面檢測算法輸入圖像張量維度過大、檢測效率不高的問題。為了達到上述目的,本專利技術采用以下方案:一種深度學習圖像識別輸入所用張量的生成方法及其應用,包括以下步驟:S1:通過拍攝不同的光照模式下獲取所拍攝目標表面的圖像張量數據;S2:對所獲取的目標表面圖像預處理;S3:對已預處理的表面圖像融合組成高維度的輸入圖像張量;S4:對得到的高維度的輸入圖像張量進行傅立葉變換,生產新的輸入張量。作為本專利技術優選的方案,所述步驟S1具體包括以下步驟:s11:通過設置環形排列多光源照明的光源結構對目標表面進行光照;s12:將目標表面光照進行改變不同模式;s13:對同一目標物體進行多次不同光照模式的拍照,得到多個表面圖像;s14:將步驟s13進行一個循環,獲得的表面圖像構成圖像輸入張量。作為本專利技術優選的方案,所述步驟S2具體包括以下步驟:s21:將所獲取的表面圖像轉換成灰度圖像;s22:采用中值濾波法對所獲取的灰度圖像進行處理,通過數字信號處理技術將噪音濾除,通過多種濾波技術結合對目標表面圖像數據進行濾波處理,對圖像數據傳輸過程中引入的噪聲和非缺陷噪聲進行去噪處理;s23:將步驟s13中不同光照模式下獲取的表面圖像按照步驟s21和s21進行處理。作為本專利技術優選的方案,所述步驟S4具體包括以下步驟:s41:將進行傅立葉變換后新的輸入張量從低頻到高頻排列幅值作為新的輸入張量,獲取頻域所對應的幅度譜,對高維度的圖像張量在第三維利用傅里葉變換算法或進行其他形式的級數展開,獲取圖像張量的頻譜信息;s42:根據頻譜信息獲取圖像張量的頻率分布信息,只保留其幅值信息,忽略傅里葉系數的相位信息,在保留圖像張量的主要特征減少冗余的圖像信息;其中:取幅值從低到高頻排列{S1,S2,…,Sk},作為新的特征表示,生成新的輸入張量,新生成的輸入圖像張量用于深度神經網絡模型的訓練和推理。一種深度學習圖像識別輸入所用張量的生成方法生產的深度學習圖像識別輸入所用張量的應用,該深度學習圖像識別輸入所用張量應用于低維度表面圖像數據集的搜集。進一步的,所述低維度表面圖像數據集的搜集包括:利用環形排列多光源照明方式,采集多個輸入圖像數據,生成深度神經網絡的訓練集,通過上述圖像張量生成方法將原圖像數據進行處理變換,生成新的圖像張量,可以有效地降低訓練數據集的大小。一種深度學習圖像識別輸入所用張量的生成方法生產的深度學習圖像識別輸入所用張量的應用,該深度學習圖像識別輸入所用張量應用于低維度表面圖像張量的深度神經網絡的推理。進一步的,所述低維度表面圖像張量的深度神經網絡的推理包括:通過將實時采集的圖像數據進行處理變換,生成新的圖像張量,輸入訓練好的深度神經網絡進行推理,輸出目標表面質量的檢測結果,得到低維度的表面圖像張量的深度神經網絡的推理方法。綜上所述,本專利技術相對于現有技術其有益效果是:本專利技術通過上述的神經網絡的輸入張量的生成方法,將傳統的高維度表面圖像張量輸入,生成更加適合訓練深度卷積神經網絡模型的輸入圖像張量,以訓練得到深度神經網絡模型,同時提高深度學習算法的推理速度。生成的圖像張量在神經網絡的訓練和推理中都得到高效地利用。附圖說明圖1為本專利技術一個實施例的深度學習圖像識別輸入所用張量的生成流程圖。圖2為本專利技術一個實施例的深度學習圖像生成張量的深度神經網絡模型訓練流程圖。圖3為本專利技術一個實施例的深度學習圖像生成張量的深度學習算法推理流程圖。具體實施方式以下具體實施內容提供用于實施本專利技術的多種不同實施例或實例。當然,這些僅為實施例或實例且不希望具限制性。另外,在不同實施例中可能使用重復標號標示,如重復的數字及/或字母。這些重復是為了簡單清楚的描述本專利技術,不代表所討論的不同實施例及/或結構之間有特定的關系。此外,其中可能用到與空間相關的用詞,像是“在…下方”、“下側”、“由內而外”、“上方”、“上側”及類似的用詞,這些關系詞為了便于描述附圖中一個(些)元件或特征與另一個(些)元件或特征之間的關系,這些空間關系詞包括使用中或操作中的裝置之不同方位,以及附圖中所描述的方位。裝置可能被轉向不同方位(旋轉90度或其他方位),則其中使用的空間相關形容詞也可相同地照著解釋,因此不能理解為對本專利技術的限制,術語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術特征的數量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括一個或者更多個該特征。下面結合附圖說明和具體實施方式對本專利技術作進一步描述:如圖1所示的一種深度學習圖像識別輸入所用張量的生成方法,包括以下步驟:。S1:通過拍攝不同的光照模式下獲取所拍攝目標表面的圖像張量數據;其中,所述步驟S1具體包括以下步驟:s11:通過設置環形排列多光源照明的光源結構對目標表面進行光照;s12:將目標表面光照進行改變不同的光照模式;s13:對同一目標物體進行多次不同光照模式的拍照,得到多個表面圖像;s14:將步驟s13進行一個循環,獲得的表面圖像構成圖像輸入張量。S2:對所獲取的目標表面圖像預處理;其中所述步驟S2具體包括以下步驟:本文檔來自技高網...
【技術保護點】
1.一種深度學習圖像識別輸入所用張量的生成方法,其特征在于,包括以下步驟:/nS1:通過拍攝不同的光照模式下獲取所拍攝目標表面的圖像張量數據;/nS2:對所獲取的目標表面圖像預處理;/nS3:對已預處理的表面圖像融合組成高維度的輸入圖像張量;/nS4:對得到的高維度的輸入圖像張量進行傅立葉變換,生產新的輸入張量。/n
【技術特征摘要】
1.一種深度學習圖像識別輸入所用張量的生成方法,其特征在于,包括以下步驟:
S1:通過拍攝不同的光照模式下獲取所拍攝目標表面的圖像張量數據;
S2:對所獲取的目標表面圖像預處理;
S3:對已預處理的表面圖像融合組成高維度的輸入圖像張量;
S4:對得到的高維度的輸入圖像張量進行傅立葉變換,生產新的輸入張量。
2.根據權利要求1所述的一種深度學習圖像識別輸入所用張量的生成方法,其特征在于,所述步驟S1具體包括以下步驟:
s11:通過設置環形排列多光源照明的光源結構對目標表面進行光照;
s12:將目標表面光照進行改變不同的光照模式;
s13:對同一目標物體進行多次不同光照模式的拍照,得到多個表面圖像;
s14:將步驟s13進行一個循環,獲得的表面圖像構成圖像輸入張量。
3.根據權利要求2所述的一種深度學習圖像識別輸入所用張量的生成方法,其特征在于所述步驟S2具體包括以下步驟:
s21:將所獲取的表面圖像轉換成灰度圖像;
s22:采用中值濾波法對所獲取的灰度圖像進行處理,通過數字信號處理技術將噪音濾除;
s23:將步驟s13中不同光照模式下獲取的表面圖像按照步驟s21和s21進行處理。
4.根據權利要求1所述的一種深度學習圖像識別輸入所用張量的生成方法,其特征在于所述步驟S4具體包括以下步驟:
s41:將進行傅立葉變換后新的輸入張量從低頻到...
【專利技術屬性】
技術研發人員:苑杰,徐維超,彭斌,馮永生,
申請(專利權)人:中山易美杰智能科技有限公司,
類型:發明
國別省市:廣東;44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。