System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
【國外來華專利技術】
本專利技術大體上涉及計算機技術。例如,本專利技術涉及圖像處理。又如,本專利技術涉及一種用于進行年齡估計的方法和設備。
技術介紹
1、人類和/或人臉識別廣泛應用于計算機視覺。例如,在機器學習技術的幫助下,可以從圖像或視頻中檢測出人體和/或人臉。基于檢測到的人體和/或人臉,可以估計出人的年齡。各種基于機器學習的技術方案(例如,神經網絡)已經用于基于檢測到的人體和/或人臉進行年齡估計。估計出的年齡可以用于各種應用場景,例如提供經過審查的搜索結果、過濾虐待兒童的內容以及限制向未成年人(未成年)提供服務。
技術實現思路
1、傳統的年齡估計以人臉和/或未遮蓋的人體為基礎。當由于阻擋或遮擋等原因而檢測不到人臉或未遮蓋的人體時,年齡估計就無法進行,因為沒有有效的輸入。
2、鑒于上述內容,有必要改進年齡估計方法。
3、本專利技術的目的是,即使在人類的圖像中沒有檢測到人臉或未遮蓋的人體時,也能方便地進行年齡估計。本專利技術的目的是,根據服裝進行年齡估計。
4、這些和其它目的通過獨立權利要求的主題來實現。其它實現方式在從屬權利要求、說明書和附圖中是顯而易見的。
5、本專利技術的第一方面提供了一種用于年齡估計的方法。所述方法由設備執行,包括以下步驟:
6、-獲取人類的圖像;
7、-從所述圖像中裁剪出一個或多個身體部位;
8、-從所述裁剪出的一個或多個身體部位中分割出衣服,以獲取衣服圖像;
9、-從所述衣服圖像中
10、-將所述衣服圖像作為輸入提供給神經網絡模型;
11、-獲取所述神經網絡模型的輸出,其中,所述神經網絡模型的所述輸出指示所述人類的年齡類別。
12、可選地,人類的圖像可以是照片,也可以是視頻的一幀。圖像(或視頻)可以由上述設備的攝像頭獲取。可替代地,圖像可以由上述設備從外部源(例如,通過通信鏈路)獲取。
13、可選地,一個或多個身體部位可以包括人類軀干和四肢中的一個或多個。四肢可以包括人類手臂和腿中的一個或多個。裁剪出的一個或多個身體部位可以完全被衣服遮蓋,也可以部分被衣服遮蓋。
14、可選地,分割到的衣服可以理解為服裝,而且還可以包括人類佩戴的裝飾品。
15、可選地,人類的年齡類別可以包括兩個或兩個以上年齡組。例如,兩個或兩個以上年齡組可以包括未成年人(未滿18歲)和成年人(滿18歲或以上)。可替代地,兩個或兩個以上年齡組可以包括兒童、青少年(adolescence/teen)、成年人和老年人。
16、上述第一方面提供的方法可以根據服裝高效進行年齡估計。這樣,即使在人類的圖像中沒有檢測到人臉或未遮蓋的人體時,上述方法也能方便地進行年齡估計。
17、在所述第一方面的一種實現方式中,所述神經網絡模型可以基于18層殘差神經網絡(18-layer?residual?neural?network,resnet-18)模型。
18、可選地,神經網絡模型可以共享resnet-18模型的類似架構。resnet-18的架構可以提供令人滿意的性能和極低的錯誤率。
19、在所述第一方面的一種實現方式中,所述神經網絡模型可以包括三個卷積層和三個特征細化塊(feature?refinement?block,frb)。所述獲取所述神經網絡模型的輸出的步驟可以包括:
20、-從所述三個卷積層的三個輸出中提取所述衣服圖像的三個特征表示;
21、-將所述三個特征表示作為輸入提供給所述三個特征細化塊,以從所述三個特征細化塊的所述三個輸出中獲取三個細化特征。
22、可選地,每個frb可以用于壓縮和重新校準提取到的特征。每個frb用于在訓練階段從不同的塊特征中學習加權向量。加權向量會用作注意力向量,在推理階段重新校準三個卷積層的輸出的特征。這樣,可以選出對小物體分類有用的特征。frb最后可以與全局最大池化連接,以捕獲全局背景信息并得到壓縮后的特征向量。
23、在所述第一方面的一種實現方式中,所述方法還可以包括:將所述三個細化特征與所述三個卷積層中的第一個卷積層的輸出進行級聯,以獲取所述衣服圖像的最終特征表示。
24、可選地,這三個細化特征可以先進行逐元素相乘,然后進行級聯。
25、在所述第一方面的一種實現方式中,所述神經網絡模型還可以包括全連接(fully-connected,fc)層。所述方法還可以包括:
26、-將所述衣服的所述最終特征表示作為輸入提供給所述全連接層;
27、-獲取所述全連接層的輸出作為所述神經網絡模型的所述輸出。
28、在所述第一方面的一種實現方式中,所述人類的所述圖像可以不包括所述人類的臉部。
29、可選地,人類的臉部可能不是完全可見的。可替代地,人類的臉部的圖像質量可能較差,因此無法根據臉部進行年齡估計。
30、本專利技術的第二方面提供了一種用于年齡估計的設備。所述設備用于:
31、-獲取人類的圖像;從所述圖像中裁剪出一個或多個身體部位;
32、-從所述裁剪出的一個或多個身體部位中分割出衣服,以獲取衣服圖像;
33、-從所述衣服圖像中去除背景像素;
34、-將所述衣服圖像作為輸入提供給在所述設備中實現的神經網絡模型;
35、-獲取所述神經網絡模型的輸出,其中,所述神經網絡模型的所述輸出指示所述人類的年齡類別。
36、在所述第二方面的一種實現方式中,所述神經網絡模型可以基于resnet-18模型。
37、在所述第二方面的一種實現方式中,所述神經網絡模型可以包括三個卷積層和三個特征細化塊,為了獲取所述神經網絡模型的所述輸出,所述設備用于:
38、-從所述三個卷積層的三個輸出中提取所述衣服圖像的三個特征表示;
39、-將所述三個特征表示作為輸入提供給所述三個特征細化塊,以從所述三個特征細化塊的所述三個輸出中獲取三個細化特征。
40、在所述第二方面的一種實現方式中,所述設備還可以用于將所述三個細化特征與所述三個卷積層中的第一個卷積層的輸出進行級聯,以獲取所述衣服圖像的最終特征表示。
41、在所述第二方面的一種實現方式中,所述神經網絡模型可以包括全連接層,所述設備還可以用于:
42、-將所述衣服的所述最終特征表示作為輸入提供給所述全連接層;
43、-獲取所述全連接層的輸出作為所述神經網絡模型的所述輸出。
44、在所述第二方面的一種實現方式中,所述人類的所述圖像可以不包括所述人類的臉部。
45、上述第二方面提供的設備能夠根據服裝高效進行年齡估計。這樣,即使在人的圖像中沒有檢測到人臉或未遮蓋的人體時,上述設備也能夠進行年齡估計。
46、本專利技術的第三方面提供了一種包括程序代碼的計算機程序。所述程序代碼用于執行根據第一方面或其任一實現本文檔來自技高網...
【技術保護點】
1.一種用于年齡估計的方法(900),其特征在于,所述方法包括:
2.根據權利要求1所述的方法(900),其特征在于,所述神經網絡模型(140)基于18層殘差神經網絡(18-layer?residual?neural?network,ResNet-18)模型。
3.根據權利要求1或2所述的方法(900),其特征在于,所述神經網絡模型(140)包括三個卷積層和三個特征細化塊,所述獲取(906)所述神經網絡模型的輸出(150)包括:
4.根據權利要求3所述的方法(900),其特征在于,所述方法還包括:將所述三個細化特征與所述三個卷積層中的第一個卷積層的輸出進行級聯,以獲取所述衣服圖像(130)的最終特征表示。
5.根據權利要求4所述的方法(900),其特征在于,所述神經網絡模型(140)包括全連接層(144),所述方法還包括:
6.根據權利要求1至5中任一項所述的方法(900),其特征在于,所述人類的所述圖像(110)不包括所述人類的臉部。
7.一種用于年齡估計的設備(100),其特征在于,所述設備(100)用于
8.根據權利要求7所述的設備(100),其特征在于,所述神經網絡模型(140)基于18層殘差神經網絡(18-layer?residual?neural?network,ResNet-18)模型。
9.根據權利要求7或8所述的設備(100),其特征在于,所述神經網絡模型(140)包括三個卷積層和三個特征細化塊,為了獲取所述神經網絡模型的所述輸出(150),所述設備用于:
10.根據權利要求9所述的設備(100),其特征在于,所述設備還用于將所述三個細化特征與所述三個卷積層中的第一個卷積層的輸出進行級聯,以獲取所述衣服圖像(130)的最終特征表示。
11.根據權利要求10所述的設備(100),其特征在于,所述神經網絡模型(140)包括全連接層,所述設備還用于:
12.根據權利要求7至11中任一項所述的設備(100),其特征在于,所述人類的所述圖像(110)不包括所述人類的臉部。
13.一種包括指令的計算機程序產品,其特征在于,當所述程序由計算機執行時,所述指令使得所述計算機執行根據權利要求1至6中任一項所述的方法。
...【技術特征摘要】
【國外來華專利技術】
1.一種用于年齡估計的方法(900),其特征在于,所述方法包括:
2.根據權利要求1所述的方法(900),其特征在于,所述神經網絡模型(140)基于18層殘差神經網絡(18-layer?residual?neural?network,resnet-18)模型。
3.根據權利要求1或2所述的方法(900),其特征在于,所述神經網絡模型(140)包括三個卷積層和三個特征細化塊,所述獲取(906)所述神經網絡模型的輸出(150)包括:
4.根據權利要求3所述的方法(900),其特征在于,所述方法還包括:將所述三個細化特征與所述三個卷積層中的第一個卷積層的輸出進行級聯,以獲取所述衣服圖像(130)的最終特征表示。
5.根據權利要求4所述的方法(900),其特征在于,所述神經網絡模型(140)包括全連接層(144),所述方法還包括:
6.根據權利要求1至5中任一項所述的方法(900),其特征在于,所述人類的所述圖像(110)不包括所述人類的臉部。
7.一種用于年齡估計的設備(100),其特征在于,所述設備(100)用于:<...
【專利技術屬性】
技術研發人員:穆罕默德恩納迪爾·齊格姆,阿卜德努爾·哈迪德,
申請(專利權)人:華為技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。