本申請提供一種數據標注方法及裝置,該方法包括:預先獲取標注人員的特征畫像;從標注系統獲取待處理的標注任務;對標注任務進行預處理,得到預處理任務以及預處理任務的任務特征標簽;根據任務特征標簽和特征畫像,為預處理任務匹配目標標注人員;將預處理任務分配至目標標注人員進行數據標注處理;接收目標標注人員針對預處理任務交付的標注數據。可見,該方法能夠實現個性化標注任務分配,有利于提高標注人員標注效率和質量,從而提升了數據標注效率。效率。效率。
【技術實現步驟摘要】
一種數據標注方法及裝置
[0001]本申請涉及數據處理
,具體而言,涉及一種數據標注方法及裝置。
技術介紹
[0002]目前,現有標注圖片分配機制無法針對每一名標注人員的工作特征做到差異化分配,導致針對不同場景、不同對象的標注、分類任務等被平均的分配給了所有人。但實際上不同的標注人員針對上述工作場景的效率和質量都是不同的,可見,現有的標注任務統一分配機制很大程度上制約了標注效率和標注質量的提高,從而降低了數據標注效率。
技術實現思路
[0003]本申請實施例的目的在于提供一種數據標注方法及裝置,能夠實現個性化標注任務分配,有利于提高標注人員標注效率和質量,從而提升了數據標注效率。
[0004]本申請實施例第一方面提供了一種數據標注方法,包括:預先獲取標注人員的特征畫像;從標注系統獲取待處理的標注任務;對所述標注任務進行預處理,得到預處理任務以及所述預處理任務的任務特征標簽;根據所述任務特征標簽和所述特征畫像,為所述預處理任務匹配目標標注人員;將所述預處理任務分配至所述目標標注人員進行數據標注處理;接收所述目標標注人員針對所述預處理任務交付的標注數據;其中,所述預先獲取標注人員的特征畫像,包括:收集標注人員標注時的圖形數據、所述標注人員對應的標簽數據及所述標注人員對應的合格率數據;根據所述圖形數據、所述標簽數據以及所述合格率數據對每個所述標注人員進行特征分析,得到每個所述標注人員對應的特征畫像。
[0005]在上述實現過程中,該方法可以優先預先獲取標注人員的特征畫像;并從標注系統獲取待處理的標注任務;然后,再對標注任務進行預處理,得到預處理任務以及預處理任務的任務特征標簽;再根據任務特征標簽和特征畫像,為預處理任務匹配目標標注人員;再后,將預處理任務分配至目標標注人員進行數據標注處理;最后,再接收目標標注人員針對預處理任務交付的標注數據。可見,實施這種實施方式,能夠實現個性化標注任務分配,有利于提高標注人員標注效率和質量,從而提升了數據標注效率。
[0006]進一步地,所述對所述標注任務進行預處理,得到預處理任務以及所述預處理任務的任務特征標簽,包括:根據所述特征畫像計算每個所述標注人員對應對所述標注任務進行標注處理的處理通過率;識別所述標注任務,得到所述標注任務的數據規格,其中,所述數據規格包括所述
標注任務的數據長度、所述標注任務的數據寬度、所述標注任務的數據長寬比、所述標注任務的數據顏色比例;根據所述處理通過率和所述數據規格生成所述標注任務的任務標簽;將所述任務標簽和所述標注任務傳輸至調度器,生成預處理任務以及所述預處理任務的任務特征標簽。
[0007]進一步地,所述方法還包括:檢測所述標注數據中是否存在不合格數據;如果否,則提交所述標注數據至目標系統。
[0008]進一步地,所述方法還包括:當判斷出所述標注數據中存在不合格數據時,獲取所述標注數據中的不合格數據和合格數據;將所述不合格數據重新加入調度器,以重新獲取所述目標標注人員針對所述不合格數據提交的重新標注數據;當所述重新標注數據檢測合格時,匯總所述重新標注數據和所述合格數據并存儲。
[0009]本申請實施例第二方面提供了一種數據標注裝置,所述數據標注裝置包括:第一獲取單元,用于預先獲取標注人員的特征畫像;第二獲取單元,用于從標注系統獲取待處理的標注任務;預處理單元,用于對所述標注任務進行預處理,得到預處理任務以及所述預處理任務的任務特征標簽;匹配單元,用于根據所述任務特征標簽和所述特征畫像,為所述預處理任務匹配目標標注人員;分配單元,用于將所述預處理任務分配至所述目標標注人員進行數據標注處理;接收單元,用于接收所述目標標注人員針對所述預處理任務交付的標注數據;其中,所述第一獲取單元包括:收集子單元,用于收集標注人員標注時的圖形數據、所述標注人員對應的標簽數據及所述標注人員對應的合格率數據;特征分析子單元,用于根據所述圖形數據、所述標簽數據以及所述合格率數據對每個所述標注人員進行特征分析,得到每個所述標注人員對應的特征畫像。
[0010]在上述實現過程中,該裝置可以通過第一獲取單元來預先獲取標注人員的特征畫像;通過第二獲取單元從標注系統獲取待處理的標注任務;通過預處理單元對標注任務進行預處理,得到預處理任務以及預處理任務的任務特征標簽;通過匹配單元來根據任務特征標簽和特征畫像,為預處理任務匹配目標標注人員;通過分配單元將預處理任務分配至目標標注人員進行數據標注處理;通過接收單元接收目標標注人員針對預處理任務交付的標注數據。可見,實施這種實施方式,能夠實現個性化標注任務分配,有利于提高標注人員標注效率和質量,從而提升了數據標注效率。
[0011]進一步地,所述預處理單元包括:計算子單元,用于根據所述特征畫像計算每個所述標注人員對應對所述標注任務進行標注處理的處理通過率;
識別子單元,用于識別所述標注任務,得到所述標注任務的數據規格,其中,所述數據規格包括所述標注任務的數據長度、所述標注任務的數據寬度、所述標注任務的數據長寬比、所述標注任務的數據顏色比例;生成子單元,用于根據所述處理通過率和所述數據規格生成所述標注任務的任務標簽;以及將所述任務標簽和所述標注任務傳輸至調度器,生成預處理任務以及所述預處理任務的任務特征標簽。
[0012]進一步地,所述數據標注裝置還包括:檢測單元,用于檢測所述標注數據中是否存在不合格數據;提交單元,用于在所述標注數據中不存在不合格數據時,提交所述標注數據至目標系統。
[0013]進一步地,所述數據標注裝置還包括:第三獲取單元,用于在所述標注數據中存在不合格數據時,獲取所述標注數據中的不合格數據和合格數據;加入單元,用于將所述不合格數據重新加入調度器,以重新獲取所述目標標注人員針對所述不合格數據提交的重新標注數據;匯總單元,用于當所述重新標注數據檢測合格時,匯總所述重新標注數據和所述合格數據并存儲。
[0014]本申請實施例第三方面提供了一種電子設備,包括存儲器以及處理器,所述存儲器用于存儲計算機程序,所述處理器運行所述計算機程序以使所述電子設備執行本申請實施例第一方面中任一項所述的數據標注方法。
[0015]本申請實施例第四方面提供了一種計算機可讀存儲介質,其存儲有計算機程序指令,所述計算機程序指令被一處理器讀取并運行時,執行本申請實施例第一方面中任一項所述的數據標注方法。
附圖說明
[0016]為了更清楚地說明本申請實施例的技術方案,下面將對本申請實施例中所需要使用的附圖作簡單地介紹,應當理解,以下附圖僅示出了本申請的某些實施例,因此不應被看作是對范圍的限定,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他相關的附圖。
[0017]圖1為本申請實施例提供的一種數據標注方法的流程示意圖;圖2為本申請實施例提供的一種數據標注裝置的結構示意圖。
具體實施方式
[0018]下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行描述。
[0019]應本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種數據標注方法,其特征在于,包括:預先獲取標注人員的特征畫像;從標注系統獲取待處理的標注任務;對所述標注任務進行預處理,得到預處理任務以及所述預處理任務的任務特征標簽;根據所述任務特征標簽和所述特征畫像,為所述預處理任務匹配目標標注人員;將所述預處理任務分配至所述目標標注人員進行數據標注處理;接收所述目標標注人員針對所述預處理任務交付的標注數據;所述預先獲取標注人員的特征畫像,包括:收集標注人員標注時的圖形數據、所述標注人員對應的標簽數據及所述標注人員對應的合格率數據;根據所述圖形數據、所述標簽數據以及所述合格率數據對每個所述標注人員進行特征分析,得到每個所述標注人員對應的特征畫像。2.根據權利要求1所述的數據標注方法,其特征在于,所述對所述標注任務進行預處理,得到預處理任務以及所述預處理任務的任務特征標簽,包括:根據所述特征畫像計算每個所述標注人員對應對所述標注任務進行標注處理的處理通過率;識別所述標注任務,得到所述標注任務的數據規格,其中,所述數據規格包括所述標注任務的數據長度、所述標注任務的數據寬度、所述標注任務的數據長寬比、所述標注任務的數據顏色比例;根據所述處理通過率和所述數據規格生成所述標注任務的任務標簽;將所述任務標簽和所述標注任務傳輸至調度器,生成預處理任務以及所述預處理任務的任務特征標簽。3.根據權利要求1所述的數據標注方法,其特征在于,所述方法還包括:檢測所述標注數據中是否存在不合格數據;如果否,則提交所述標注數據至目標系統。4.根據權利要求3所述的數據標注方法,其特征在于,所述方法還包括:當判斷出所述標注數據中存在不合格數據時,獲取所述標注數據中的不合格數據和合格數據;將所述不合格數據重新加入調度器,以重新獲取所述目標標注人員針對所述不合格數據提交的重新標注數據;當所述重新標注數據檢測合格時,匯總所述重新標注數據和所述合格數據并存儲。5.一種數據標注裝...
【專利技術屬性】
技術研發人員:胡明,司金輝,王凱,
申請(專利權)人:創新奇智合肥科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。