一種人臉數據的采集方法、裝置、計算機可讀介質及系統,所述人臉數據的采集方法包括:獲取包含人臉數據的視頻文件;利用人臉跟蹤算法對所述視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據。應用上述方案,可以以較低的成本采集大規模的人臉數據。
【技術實現步驟摘要】
人臉數據的采集方法、裝置、計算機可讀介質及系統
本專利技術實施例涉及人臉采集領域,尤其涉及一種人臉數據的采集方法、裝置、計算機可讀介質及系統。
技術介紹
由于人臉識別技術具有方便、安全等優點,越來越受到人們的青睞,對人臉識別技術的研究也越來越多。在實際研究中,基于深度學習方法的人臉識別技術需要大量的訓練數據。目前獲取人臉訓練數據的方法有兩種方案:1、通過互聯網下載人臉數據,例如首先確定姓名信息等關鍵字,然后利用搜索引擎抓取相應的圖片獲得人臉數據。該方案的缺點是獲得人臉數據可能包含不同年齡、不同裝扮的數據,需要耗費大量的人力成本進行后期整理,尤其是美女明星長得都很相似,很難進行區分。2、設置人臉采集的設施對真實的人臉數據進行采集,該方案的缺點是如果規模較小,采集的人臉數量較少,無法滿足深度學習算法的需求,如果規模較大,成本太高。
技術實現思路
本專利技術解決的技術問題是如何以較低的成本采集大規模的人臉數據。為解決上述技術問題,本專利技術實施例提供一種人臉數據的采集方法,所述方法包括:獲取包含人臉數據的視頻文件;利用人臉跟蹤算法對所述視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據。可選地,所述利用人臉跟蹤算法對所述視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據,包括:提取所述視頻文件的第一幀作為當前幀;從所述當前幀,直至所述視頻文件的倒數第二幀,迭代執行如下步驟:基于當前幀數據對應的人臉,生成新的人臉標識,所述新的人臉標識對應當前幀數據;利用人臉跟蹤算法判斷后一幀數據對應的人臉與當前幀數據對應的人臉是否為同一個,如果后一幀數據對應的人臉與當前幀數據對應的人臉為同一個,則將后一幀數據增加至所述新的人臉標識對應的數據中;如果后一幀數據對應的人臉與當前幀數據對應的人臉不一致,則提取后一幀作為更新后的所述當前幀。可選地,所述人臉數據的采集方法,還包括:利用人臉識別算法對所述生成的不同人臉標識對應的數據進行處理,將識別算法識別為同一人臉的多個不同人臉標識對應的數據進行合并,生成合并后的不同人臉標識對應的數據。可選地,所述人臉數據的采集方法,還包括:通過人工方式對合并后的不同人臉標識對應的數據進行審核,將屬于同一人臉的多個不同人臉標識對應的數據進行合并,將同一個人臉標識對應的不同人臉的數據進行拆分,生成更新后的不同人臉標識對應的數據。可選地,所述人臉數據的采集方法,還包括:采集特殊場合下的人員的人臉數據。本專利技術實施例提供一種人臉數據的采集裝置,包括:獲取單元,適于獲取包含人臉數據的視頻文件;生成單元,適于利用人臉跟蹤算法對所述視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據。可選地,所述生成單元,包括:提取子單元,適于提取所述視頻文件的第一幀作為當前幀;迭代子單元,包括生成模塊和判斷模塊,適于由生成模塊和判斷模塊從所述當前幀,直至所述視頻文件的倒數第二幀,迭代執行數據處理,其中:所述生成模塊,適于基于當前幀數據對應的人臉,生成新的人臉標識,所述新的人臉標識對應當前幀數據;所述判斷模塊,適于利用人臉跟蹤算法判斷后一幀數據對應的人臉與當前幀數據對應的人臉是否為同一個,如果后一幀數據對應的人臉與當前幀數據對應的人臉為同一個,則將后一幀數據增加至所述新的人臉標識對應的數據中;如果后一幀數據對應的人臉與當前幀數據對應的人臉不一致,則提取后一幀作為更新后的所述當前幀。可選地,所述人臉數據的采集裝置還包括:第一識別單元,適于利用人臉識別算法對所述生成的不同人臉標識對應的數據進行處理,將識別算法識別為同一人臉的多個不同人臉標識對應的數據進行合并,生成合并后的不同人臉標識對應的數據。可選地,所述人臉數據的采集裝置還包括:第二識別單元,適于通過人工方式對合并后的不同人臉標識對應的數據進行審核,將屬于同一人臉的多個不同人臉標識對應的數據進行合并,將同一個人臉標識對應的不同人臉的數據進行拆分,生成更新后的不同人臉標識對應的數據。可選地,所述人臉數據的采集裝置,還包括:采集單元,適于采集特殊場合下的人員的人臉數據。本專利技術實施例提供一種計算機可讀介質,其上存儲有計算機指令,所述計算機指令運行時執行上述任一種所述方法對應的步驟。本專利技術實施例提供一種采集系統,包括存儲器和處理器,所述存儲器上存儲有能夠在所述處理器上運行的計算機指令,所述處理器運行所述計算機指令時執行上述任一種所述方法對應的步驟。與現有技術相比,本專利技術實施例的技術方案具有以下有益效果:本專利技術實施例通過利用人臉跟蹤算法對視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據。一方面,利用人臉跟蹤算法對不同人臉對應的數據進行分離,成本較低,不需要耗費大量的人力成本進行后期整理;另一方面,通過直接從視頻文件中提取出不同的人臉數據,可以實現大規模的采集,成本較低。進一步地,通過采集特殊場景下的人員的人臉數據。例如,通過采集安檢卡口身份證上的圖片,不僅擴充了人臉數據的樣本分布,也方便以后的數據整理。附圖說明圖1是本專利技術實施例提供的一種人臉數據的采集方法的流程圖;圖2是本專利技術實施例提供的一種人臉數據的采集裝置的示意圖。具體實施方式目前獲取人臉訓練數據的方法有兩種方案:1、通過互聯網下載人臉數據,例如首先確定姓名信息等關鍵字,然后利用搜索引擎抓取相應的圖片獲得人臉數據。該方案的缺點是獲得人臉數據可能包含不同年齡、不同裝扮的數據,需要耗費大量的人力成本進行后期整理,尤其是美女明星長得都很相似,很難進行區分。2、設置人臉采集的設施對真實的人臉數據進行采集,該方案的缺點是如果規模較小,采集的人臉數量較少,無法滿足深度學習算法的需求,如果規模較大,成本太高。本專利技術實施例通過利用人臉跟蹤算法對視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據。一方面,利用人臉跟蹤算法對不同人臉對應的數據進行分離,成本較低,不需要耗費大量的人力成本進行后期整理;另一方面,通過直接從視頻文件中提取出不同的人臉數據,可以實現大規模的采集,成本較低。為使本專利技術的上述目的、特征和有益效果能夠更為明顯易懂,下面結合附圖對本專利技術的具體實施例做詳細的說明。參見圖1,本專利技術實施例提供的一種人臉數據的采集方法包括如下步驟:S101,獲取包含人臉數據的視頻文件。在具體實施中,可以通過多種途徑獲取包含人臉數據的視頻文件,例如,可以通過Internet網絡下載公開的允許使用的視頻文件,也可以從正規渠道購買光盤獲取視頻文件,只要對所述視頻文件的獲取和使用合法,本專利技術實施例不做限制。在具體實施中,可以獲取一個包含人臉數據的視頻文件,也可以獲取多個包含人臉數據的視頻文件,視頻文件越多,生成的人臉數據越多,相應的處理也越多,可以根據實際需求選擇合適的視頻文件個數,本專利技術實施例不做限制。S102,利用人臉跟蹤算法對所述視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據。在具體實施中,由于視頻文件中的人臉數據是連貫的,因此相鄰幀的人臉相似度很高,而且姿勢的分布也比較均勻,很容易進行跟蹤。故可以利用人臉跟蹤算法對所述視頻文件前后幀的人臉進行跟蹤,將同一個人臉對應的數據進行合并,不同人臉的數據進行分離,生成不同人臉標識對應的數據。在本專利技術一實施例中,可以提取所述視頻文件的第一幀本文檔來自技高網...
【技術保護點】
1.一種人臉數據的采集方法,其特征在于,包括:獲取包含人臉數據的視頻文件;利用人臉跟蹤算法對所述視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據。
【技術特征摘要】
1.一種人臉數據的采集方法,其特征在于,包括:獲取包含人臉數據的視頻文件;利用人臉跟蹤算法對所述視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據。2.根據權利要求1所述的人臉數據的采集方法,其特征在于,所述利用人臉跟蹤算法對所述視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據,包括:提取所述視頻文件的第一幀作為當前幀;從所述當前幀,直至所述視頻文件的倒數第二幀,迭代執行如下步驟:基于當前幀數據對應的人臉,生成新的人臉標識,所述新的人臉標識對應當前幀數據;利用人臉跟蹤算法判斷后一幀數據對應的人臉與當前幀數據對應的人臉是否為同一個,如果后一幀數據對應的人臉與當前幀數據對應的人臉為同一個,則將后一幀數據增加至所述新的人臉標識對應的數據中;如果后一幀數據對應的人臉與當前幀數據對應的人臉不一致,則提取后一幀作為更新后的所述當前幀。3.根據權利要求1所述的人臉數據的采集方法,其特征在于,還包括:利用人臉識別算法對所述生成的不同人臉標識對應的數據進行處理,將識別算法識別為同一人臉的多個不同人臉標識對應的數據進行合并,生成合并后的不同人臉標識對應的數據。4.根據權利要求1至3任一項所述的人臉數據的采集方法,其特征在于,還包括:通過人工方式對合并后的不同人臉標識對應的數據進行審核,將屬于同一人臉的多個不同人臉標識對應的數據進行合并,將同一個人臉標識對應的不同人臉的數據進行拆分,生成更新后的不同人臉標識對應的數據。5.根據權利要求1所述的人臉數據的采集方法,其特征在于,還包括:采集特殊場合下的人員的人臉數據。6.一種人臉數據的采集裝置,其特征在于,包括:獲取單元,適于獲取包含人臉數據的視頻文件;生成單元,適于利用人臉跟蹤算法對所述視頻文件中不同人臉對應的數據進行分離,生成不同人臉標識對應的數據。7.根據權利要求6所述...
【專利技術屬性】
技術研發人員:趙文忠,顧紅旗,
申請(專利權)人:上海銀晨智能識別科技有限公司,
類型:發明
國別省市:上海,31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。