System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及計算機,具體涉及預測人物圖像分類的方法、裝置、計算機設備及存儲介質。
技術介紹
1、為了保證實驗室的安全性,工作人員在進入實驗室之前需要進行穿著檢查,確認工作人員是否按規范穿戴了必要的防護裝備,如實驗服、安全鞋、防護眼鏡及手套等。傳統的檢查方式一般是通過管理人員檢查實現的。
2、隨著機器視覺與人工智能技術的飛速進步,可以通過對工作人員進行自動拍照,并根據拍照得到的圖像進行自動識別,以完成工作人員的穿著檢查操作。其中,識別圖像的具體過程是:從圖像中提取每一個像素的顏色特征指標值,進而根據每一個像素的顏色特征指標值,在圖像中確定出感興趣區域(region?of?interest,roi),再根據預構建的穿著規范識別模型和roi中的每一個像素的顏色特征指標值,得到預測結果。
3、由于實驗室光照條件不同,在不同的光照下同一種衣服的顏色也會不同,導致預測結果不準確。
技術實現思路
1、有鑒于此,本專利技術提供了一種預測人物圖像分類的方法、裝置、計算機設備、存儲介質及程序產品,以解決相關技術中預測結果不準確的問題。
2、第一方面,本專利技術提供了一種預測人物圖像分類的方法,所述方法包括:
3、獲取目標人物圖像;
4、根據預構建的多種特征類別的特征提取模型,從所述目標人物圖像中提取出每一個像素在多種所述特征類別下分別對應的圖像特征指標值;
5、根據每一個所述像素在多種所述特征類別下分別對應的圖像特征指標值,以及
6、根據與每一個所述像素對應的綜合圖像特征指標值、預構建的聚類模型、預設長度和預設寬度,從所述目標人物圖像中選取出多個目標像素;
7、根據與每一個所述目標像素對應的綜合圖像特征指標值,構建第一特征矩陣;
8、將所述第一特征矩陣輸入到預構建的目標分類模型中,得到與所述目標人物圖像對應的預測分類結果。
9、本專利技術提供的一種預測人物圖像分類的方法,具有如下優點:
10、本方案可以從目標人物圖像中提取多個維度的圖像信息(即多種特征類別的圖像特征指標值)。這些多維度的信息能夠更全面地描述圖像中的每個像素,從而提供更豐富的細節。不同特征類別之間存在互補性。例如,顏色特征可能在某些情況下不夠準確,而紋理特征則能提供額外的信息。通過結合多種特征,可以彌補單一特征的不足,提高整體的識別精度。
11、在一種可選的實施方式中,所述目標分類模型包括多個殘差塊、注意力機制模塊、全局池化層、第一激活函數,以及與每一個所述殘差塊對應的第一卷積層;
12、所述將所述第一特征矩陣輸入到預構建的目標分類模型中,得到與所述目標人物圖像對應的預測分類結果,包括:
13、將第一輸入矩陣輸入目標殘差塊中,得到所述目標殘差塊輸出的第一輸出矩陣,其中,所述目標殘差塊為多個所述殘差塊中的任一個殘差塊,當所述目標殘差塊為多個所述殘差塊中排序為第一的殘差塊時,所述目標輸入矩陣為所述第一特征矩陣;
14、將所述第一輸入矩陣輸入到與所述目標殘差塊對應的所述第一卷積層中,得到所述第一卷積層輸出的第二輸出矩陣;
15、對所述第一輸出矩陣和所述第二輸出矩陣進行殘差連接運算,得到第三輸出矩陣;
16、當所述目標殘差塊并非為多個所述殘差塊中排序最靠后的殘差塊時,將所述第三輸出矩陣作為所述第一輸入矩陣輸入到排序在所述目標殘差塊之后的下一個殘差塊;
17、或者,
18、當所述目標殘差塊為多個所述殘差塊中排序為最后的殘差塊時,將所述第三輸出矩陣輸入到所述注意力機制模塊中進行特征提取,得到所述注意力機制模塊輸出的目標特征向量;
19、將所述目標特征向量輸入到所述全局池化層中,得到所述全局池化層中輸出的目標分類指標值;
20、將所述目標分類指標值輸入到所述第一激活函數中,得到所述第一激活函數輸出的預測分類結果。
21、具體地,殘差塊通過引入殘差連接,有效解決了深層網絡中的梯度消失問題。在訓練過程中,殘差連接允許梯度直接從較深的層傳遞到較淺的層,從而加速收斂和提高模型性能。并且,殘差塊可以學習到更復雜的特征表示,因為它們不僅學習原始特征,還學習殘差特征。這種雙重學習機制使得模型能夠更準確地捕捉到圖像中的細微變化。注意力機制模塊可以自動學習圖像中最重要的區域,并賦予這些區域更高的權重。這有助于模型忽略背景噪聲和其他不相關的部分,專注于關鍵特征,從而提高分類的準確性。全局池化層將特征圖的每個通道壓縮成一個數值,減少了模型的參數量,從而降低了過擬合的風險。并且,全局池化層通過聚合特征圖中的信息,保留了每個通道的最重要特征,有助于模型更好地進行分類。通過第一激活函數引入了非線性變換,使得模型能夠學習到更復雜的特征表示,使得模型能夠更好地擬合復雜的數據分布,提高分類的準確性。通過多個殘差塊的堆疊,模型可以逐層提取不同層次的特征,從低級的邊緣和紋理特征到高級的語義特征,形成一個層次化的特征表示。
22、在一種可選的實施方式中,所述殘差塊中包括多個濾波器、歸一化層和第二激活函數,且所述殘差塊中包括的所述濾波器的數量為2n+2,其中,n為所述殘差塊的排序,2n+2個濾波器中的2n+1個濾波器構成所述殘差塊中的第二卷積層,2n+2個濾波器中剩余的2n+1個濾波器構成所述殘差塊中的第三卷積層;
23、所述將第一輸入矩陣輸入目標殘差塊中,得到所述目標殘差塊輸出的第一輸出矩陣,包括:
24、通過所述第二卷積層中包括的多個所述濾波器對所述第一輸入矩陣進行特征提取,得到第二特征矩陣;
25、將所述第二特征矩陣輸入到所述歸一化層中進行歸一化處理,得到第三特征矩陣;
26、將所述第三特征矩陣輸入到所述第二激活函數中,得到第四特征矩陣;
27、通過所述第三卷積層中包括的多個所述濾波器對所述第四特征矩陣進行特征提取,得到所述第一輸出矩陣。
28、具體地,每個殘差塊中的濾波器數量為2n+2,使得模型在不同層次上具有不同數量的濾波器,能夠更靈活地提取不同尺度的特征。每個殘差塊包含兩個卷積層(第二卷積層和第三卷積層),每個卷積層負責提取不同層次的特征。這種多階段的特征提取方式使得模型能夠更細致地捕捉到圖像中的復雜模式。歸一化層可以加速模型的訓練過程,減少內部協變量偏移,使得每一層的輸入分布更加穩定,從而加快收斂速度。另外,歸一化層有助于提高模型的泛化能力。
29、在一種可選的實施方式中,多種所述特征類別的特征提取模型包括顏色特征提取模型、紋理特征提取模型和輪廓特征提取模型;
30、所述根據預構建的多種特征類別的特征提取模型,從所述目標人物圖像中提取出每一個所述像素在多種所述特征類別下分別對應的圖像特征指標值,包括:
31、將所述目標人物圖像輸入到所述顏色特征提取模型中,得到本文檔來自技高網...
【技術保護點】
1.一種預測人物圖像分類的方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述目標分類模型包括多個殘差塊、注意力機制模塊、全局池化層、第一激活函數,以及與每一個所述殘差塊對應的第一卷積層;
3.根據權利要求2所述的方法,其特征在于,所述殘差塊中包括多個濾波器、歸一化層和第二激活函數,且所述殘差塊中包括的所述濾波器的數量為2n+2,其中,n為所述殘差塊的排序,2n+2個濾波器中的2n+1個濾波器構成所述殘差塊中的第二卷積層,2n+2濾波器個中剩余的2n+1個濾波器構成所述殘差塊中的第三卷積層;
4.根據權利要求1至3任一項所述的方法,其特征在于,多種所述特征類別的特征提取模型包括顏色特征提取模型、紋理特征提取模型和輪廓特征提取模型;
5.根據權利要求4所述的方法,其特征在于,與顏色特征對應的預設權重值、與輪廓特征對應的預設權重值、與紋理特征對應的預設權重值依次降低。
6.根據權利要求1至3任一項所述的方法,其特征在于,所述根據每一個所述像素在多種所述特征類別下分別對應的圖像特征指標值,以及與每一
7.根據權利要求1至3任一項所述的方法,其特征在于,所述根據與每一個所述像素對應的綜合圖像特征指標值、預構建的聚類模型、預設長度和預設寬度,從所述目標人物圖像中選取出多個目標像素,包括:
8.一種預測人物圖像分類的裝置,其特征在于,所述裝置包括:
9.一種計算機設備,其特征在于,包括:
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機指令,所述計算機指令用于使計算機執行權利要求1至7中任一項所述的預測人物圖像分類的方法。
...【技術特征摘要】
1.一種預測人物圖像分類的方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述目標分類模型包括多個殘差塊、注意力機制模塊、全局池化層、第一激活函數,以及與每一個所述殘差塊對應的第一卷積層;
3.根據權利要求2所述的方法,其特征在于,所述殘差塊中包括多個濾波器、歸一化層和第二激活函數,且所述殘差塊中包括的所述濾波器的數量為2n+2,其中,n為所述殘差塊的排序,2n+2個濾波器中的2n+1個濾波器構成所述殘差塊中的第二卷積層,2n+2濾波器個中剩余的2n+1個濾波器構成所述殘差塊中的第三卷積層;
4.根據權利要求1至3任一項所述的方法,其特征在于,多種所述特征類別的特征提取模型包括顏色特征提取模型、紋理特征提取模型和輪廓特征提取模型;
5.根據權利要求4所述的方法,其特征在于,與顏色特征對應的預設權重值、與輪廓...
【專利技術屬性】
技術研發人員:諸葛瑞琛,王武軍,徐基法,
申請(專利權)人:蘇州元腦智能科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。