System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及圖像識(shí)別和數(shù)據(jù)處理,尤其涉及一種基于帶噪數(shù)據(jù)的圖像識(shí)別方法和裝置。
技術(shù)介紹
1、已有技術(shù)中,進(jìn)行醫(yī)療影像等圖像識(shí)別時(shí),多會(huì)利用人工智能識(shí)別系統(tǒng)。在搭建人工智能識(shí)別系統(tǒng)時(shí),需要收集大量的目標(biāo)數(shù)據(jù),并對(duì)收集到的數(shù)據(jù)經(jīng)領(lǐng)域?qū)<一蛳嚓P(guān)標(biāo)注人員進(jìn)行精準(zhǔn)標(biāo)注。但是,對(duì)于相同的標(biāo)注數(shù)據(jù),不同的標(biāo)注人員可給出不同的標(biāo)注結(jié)果。例如,在自然數(shù)據(jù)集中,若一張圖像中含有不同的物體,如貓,老虎,獅子等,由于主觀因素的影響,標(biāo)注人員可能出現(xiàn)數(shù)據(jù)的漏標(biāo)和誤標(biāo)注現(xiàn)象,造成標(biāo)注數(shù)據(jù)集中包含標(biāo)注錯(cuò)誤的標(biāo)注信息。尤其對(duì)于醫(yī)學(xué)數(shù)據(jù)來(lái)講,由于領(lǐng)域的專業(yè)性等特殊因素,同一批數(shù)據(jù)不同的標(biāo)注人員可能會(huì)有不同的標(biāo)注結(jié)果,造成標(biāo)注數(shù)據(jù)庫(kù)的歧義,嚴(yán)重影響了標(biāo)注數(shù)據(jù)的純凈度和可靠性,導(dǎo)致識(shí)別模型的性能大幅度下降,輸出錯(cuò)誤的識(shí)別結(jié)果,限制了識(shí)別模型的實(shí)際應(yīng)用。并且,在識(shí)別模型的訓(xùn)練過(guò)程中,通常會(huì)假設(shè)訓(xùn)練數(shù)據(jù)集標(biāo)注完全正確,無(wú)任何標(biāo)注錯(cuò)誤,未考慮訓(xùn)練數(shù)據(jù)庫(kù)含有錯(cuò)誤標(biāo)注的情形,同時(shí),現(xiàn)有技術(shù)采用的方法通常將難以識(shí)別的樣本作為噪聲樣本進(jìn)行處理,標(biāo)注錯(cuò)誤的數(shù)據(jù)以及高價(jià)值的難以識(shí)別的樣本誤當(dāng)作噪聲樣本處理均會(huì)影響訓(xùn)練得到的識(shí)別模型的準(zhǔn)確性。
2、鑒于此,本專利技術(shù)提供一種基于帶噪數(shù)據(jù)的圖像識(shí)別方法和裝置,以解決現(xiàn)有技術(shù)中由于樣本類型識(shí)別和標(biāo)注不夠準(zhǔn)確而導(dǎo)致的訓(xùn)練出的識(shí)別模型準(zhǔn)確性較差的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)提供一種基于帶噪數(shù)據(jù)的圖像識(shí)別方法和裝置,以解決現(xiàn)有技術(shù)中由于樣本類型識(shí)別和標(biāo)注不夠準(zhǔn)確而導(dǎo)致的訓(xùn)練出
2、本專利技術(shù)提供一種基于帶噪數(shù)據(jù)的圖像識(shí)別方法,所述方法包括:
3、獲取待識(shí)別的原始圖像;
4、將所述待識(shí)別的原始圖像輸入預(yù)先訓(xùn)練的分類識(shí)別模型,得到所述分類識(shí)別模型輸出的圖像識(shí)別結(jié)果;
5、其中,所述分類識(shí)別模型是基于深度學(xué)習(xí)模型,利用預(yù)先構(gòu)建的圖像樣本數(shù)據(jù)集進(jìn)行訓(xùn)練得到的,所述圖像樣本數(shù)據(jù)集包括干凈樣本數(shù)據(jù)集和噪聲樣本數(shù)據(jù)集;
6、所述干凈樣本數(shù)據(jù)集包括在原始數(shù)據(jù)樣本中篩除難以分類樣本集合后得到的干凈樣本集合,以及所述難以分類樣本集合經(jīng)過(guò)噪聲識(shí)別模型篩選后得到的難以識(shí)別樣本集合;
7、所述噪聲樣本數(shù)據(jù)集是所述難以分類樣本集合經(jīng)過(guò)所述噪聲識(shí)別模型篩選后得到的噪聲樣本集合構(gòu)成的,所述難以分類樣本集合是利用原始數(shù)據(jù)樣本集合通過(guò)多模型交互算法進(jìn)行迭代篩選得到的。
8、在一些實(shí)施例中,利用原始數(shù)據(jù)樣本通過(guò)多模型交互算法進(jìn)行迭代篩選,得到所述難以分類樣本,具體包括:
9、將目標(biāo)樣本輸入第一分類模型,以得到所述第一分類模型輸出的該目標(biāo)樣本屬于目標(biāo)類別標(biāo)簽的第一概率;
10、在所述第一概率小于第一概率閾值的情況下,將該目標(biāo)樣本輸入第二分類模型,以得到所述第二分類模型輸出的該目標(biāo)樣本屬于目標(biāo)類標(biāo)簽的第二概率;
11、在所述第二概率小于第二概率閾值的情況下,則確定所述目標(biāo)樣本為難以分類樣本;
12、將原始數(shù)據(jù)樣本集合中的每個(gè)所述原始數(shù)據(jù)樣本依次作為目標(biāo)樣本進(jìn)行迭代,以得到所述原始數(shù)據(jù)樣本集合中的所有難以分類樣本。
13、在一些實(shí)施例中,將目標(biāo)樣本輸入第一分類模型,以得到所述第一分類模型輸出的該目標(biāo)樣本屬于目標(biāo)類別標(biāo)簽的第一概率,之后還包括:
14、在所述第一概率大于第一概率閾值的情況下,將所述目標(biāo)樣本劃入所述干凈樣本集合。
15、在一些實(shí)施例中,得到所述第二分類模型輸出的該目標(biāo)樣本屬于目標(biāo)類標(biāo)簽的第二概率,之后還包括:
16、在所述第二概率大于第二概率閾值的情況下,將所述目標(biāo)樣本劃入所述干凈樣本集合。
17、在一些實(shí)施例中,所述難以分類樣本集合經(jīng)過(guò)所述噪聲識(shí)別模型篩選后,得到噪聲樣本集合,具體包括:
18、將所述難以分類樣本集合中的每個(gè)樣本分別輸入所述噪聲識(shí)別模型的第一子模型和第二子模型,以得到所述第一子模型輸出的第一子概率和所述第二子模型輸出的第二子概率;
19、根據(jù)貢獻(xiàn)度計(jì)算所述第一子概率和所述第二子概率的加權(quán)值;
20、在所述加權(quán)值大于第三概率的情況下,判定該樣本為噪聲樣本。
21、在一些實(shí)施例中,所述第一子模型是利用類別概率為預(yù)設(shè)區(qū)間內(nèi)的樣本集合和類別標(biāo)簽進(jìn)行訓(xùn)練得到的;所述預(yù)設(shè)區(qū)間內(nèi)的樣本集合是將干凈樣本集合和在干凈樣本集合中抽取的模擬噪聲樣本集合輸入模擬識(shí)別模型后得到的;
22、所述第二子模型是利用每個(gè)樣本在每輪迭代中的預(yù)測(cè)概率作為輸入,以期望最大化最為優(yōu)化目標(biāo)進(jìn)行優(yōu)化訓(xùn)練得到的。
23、本專利技術(shù)還提供一種基于帶噪數(shù)據(jù)的圖像識(shí)別裝置,所述裝置包括:
24、圖像獲取單元,用于獲取待識(shí)別的原始圖像;
25、結(jié)果輸出單元,用于將所述待識(shí)別的原始圖像輸入預(yù)先訓(xùn)練的分類識(shí)別模型,得到所述分類識(shí)別模型輸出的圖像識(shí)別結(jié)果;
26、其中,所述分類識(shí)別模型是基于深度學(xué)習(xí)模型,利用預(yù)先構(gòu)建的圖像樣本數(shù)據(jù)集進(jìn)行訓(xùn)練得到的,所述圖像樣本數(shù)據(jù)集包括干凈樣本數(shù)據(jù)集和噪聲樣本數(shù)據(jù)集;
27、所述干凈樣本數(shù)據(jù)集包括在原始數(shù)據(jù)樣本中篩除難以分類樣本集合后得到的干凈樣本集合,以及所述難以分類樣本集合經(jīng)過(guò)噪聲識(shí)別模型篩選后得到的難以識(shí)別樣本集合;
28、所述噪聲樣本數(shù)據(jù)集是所述難以分類樣本集合經(jīng)過(guò)所述噪聲識(shí)別模型篩選后得到的噪聲樣本集合構(gòu)成的,所述難以分類樣本集合是利用原始數(shù)據(jù)樣本集合通過(guò)多模型交互算法進(jìn)行迭代篩選得到的。
29、本專利技術(shù)還提供一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如上所述的方法。
30、本專利技術(shù)還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。
31、本專利技術(shù)還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的方法。
32、本專利技術(shù)提供的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,通過(guò)獲取待識(shí)別的原始圖像,將所述待識(shí)別的原始圖像輸入預(yù)先訓(xùn)練的分類識(shí)別模型,即可得到所述分類識(shí)別模型輸出的圖像識(shí)別結(jié)果;其中,所述分類識(shí)別模型是基于深度學(xué)習(xí)模型,利用預(yù)先構(gòu)建的圖像樣本數(shù)據(jù)集進(jìn)行訓(xùn)練得到的,所述圖像樣本數(shù)據(jù)集包括干凈樣本數(shù)據(jù)集和噪聲樣本數(shù)據(jù)集;所述干凈樣本數(shù)據(jù)集包括在原始數(shù)據(jù)樣本中篩除難以分類樣本集合后得到的干凈樣本集合,以及所述難以分類樣本集合經(jīng)過(guò)噪聲識(shí)別模型篩選后得到的難以識(shí)別樣本集合;所述噪聲樣本數(shù)據(jù)集是所述難以分類樣本集合經(jīng)過(guò)所述噪聲識(shí)別模型篩選后得到的噪聲樣本集合構(gòu)成的,所述難以分類樣本集合是利用原始數(shù)據(jù)樣本集合通過(guò)多模型交互算法進(jìn)行迭代篩選得到的。
33、這樣,本專利技術(shù)所提供的方法和裝置,利用多模型相互交互,篩選出數(shù)據(jù)中存在的可能的噪聲數(shù)據(jù),并克服難樣本數(shù)據(jù)對(duì)噪聲數(shù)據(jù)挖掘的本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,利用原始數(shù)據(jù)樣本通過(guò)多模型交互算法進(jìn)行迭代篩選,得到所述難以分類樣本,具體包括:
3.根據(jù)權(quán)利要求2所述的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,將目標(biāo)樣本輸入第一分類模型,以得到所述第一分類模型輸出的該目標(biāo)樣本屬于目標(biāo)類別標(biāo)簽的第一概率,之后還包括:
4.根據(jù)權(quán)利要求2所述的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,得到所述第二分類模型輸出的該目標(biāo)樣本屬于目標(biāo)類標(biāo)簽的第二概率,之后還包括:
5.根據(jù)權(quán)利要求1所述的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,所述難以分類樣本集合經(jīng)過(guò)所述噪聲識(shí)別模型篩選后,得到噪聲樣本集合,具體包括:
6.根據(jù)權(quán)利要求5所述的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,所述第一子模型是利用類別概率為預(yù)設(shè)區(qū)間內(nèi)的樣本集合和類別標(biāo)簽進(jìn)行訓(xùn)練得到的;所述預(yù)設(shè)區(qū)間內(nèi)的樣本集合是將干凈樣本集合和在干凈樣本集合中抽取的模擬噪聲樣本集合輸入模擬識(shí)別模型后得到的;
7.一種基
8.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至6任一項(xiàng)所述的方法。
9.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6任一項(xiàng)所述的方法。
...【技術(shù)特征摘要】
1.一種基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,利用原始數(shù)據(jù)樣本通過(guò)多模型交互算法進(jìn)行迭代篩選,得到所述難以分類樣本,具體包括:
3.根據(jù)權(quán)利要求2所述的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,將目標(biāo)樣本輸入第一分類模型,以得到所述第一分類模型輸出的該目標(biāo)樣本屬于目標(biāo)類別標(biāo)簽的第一概率,之后還包括:
4.根據(jù)權(quán)利要求2所述的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,得到所述第二分類模型輸出的該目標(biāo)樣本屬于目標(biāo)類標(biāo)簽的第二概率,之后還包括:
5.根據(jù)權(quán)利要求1所述的基于帶噪數(shù)據(jù)的圖像識(shí)別方法,其特征在于,所述難以分類樣本集合經(jīng)過(guò)所述噪聲識(shí)別模型篩選后,得到噪聲樣本集合,具體包括:
6.根據(jù)權(quán)利要求5所述的基于帶...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李柏蕤,連荷清,陳磊,
申請(qǐng)(專利權(quán))人:北京小蠅科技有限責(zé)任公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。