本發(fā)明專利技術(shù)屬于圖像篡改檢測領(lǐng)域,提出了一種基于不確定性引導(dǎo)的圖像篡改檢測方法。該檢測方法基于不確定性學(xué)習(xí)引導(dǎo)的圖像篡改檢測網(wǎng)絡(luò),在不確定性的指導(dǎo)下,可以專注于細化受圖像固有噪聲和壓縮偽影等影響的低置信度區(qū)域,并且當(dāng)面對未學(xué)習(xí)的操作技術(shù)或后處理方法時,通過使得高置信度圖像塊引導(dǎo)低置信度圖像塊進行篡改特征學(xué)習(xí),從而挖掘篡改區(qū)域和真實區(qū)域之間的差異。域之間的差異。域之間的差異。
【技術(shù)實現(xiàn)步驟摘要】
一種基于不確定性引導(dǎo)的圖像篡改檢測方法
[0001]本專利技術(shù)涉及圖像篡改檢測領(lǐng)域,尤其涉及一種基于不確定性引導(dǎo)的圖像篡改檢測方法。
技術(shù)介紹
[0002]由于圖像編輯技術(shù)以及智能篡改工具的發(fā)展,人們可以很方便得偽造出大量逼真的虛假圖片。從而產(chǎn)生不同乃至相反的圖像語義,對個人隱私保護、信息安全帶來極大的挑戰(zhàn)。
[0003]早期的圖像篡改檢測方法均基于手工特征,如色彩濾波數(shù)組(Color Filter Array, CFA)、噪聲不一致性(NOise Inconsistency, NOI)、在離散余弦變換(Discrete Cosine Transform, DCT)系數(shù)中所隱藏的二次量化細節(jié)、錯誤等級分析(Error Level Analysis, ELA)。由于這些方法過分依賴與先驗知識,基于這些手工特征的算法往往具有較低的準(zhǔn)確性、魯棒性和泛化性,且這些方法無法應(yīng)對在不斷升級迭代的圖像篡改技術(shù)。
[0004]近年,許多基于深度學(xué)習(xí)的方法,尤其是基于卷積神經(jīng)網(wǎng)絡(luò)的方法被提出,這些方法可以準(zhǔn)確地以像素級檢測被篡改的圖片。但是,絕大多數(shù)方法致力于檢測特定類型的篡改方法,如拼接、復(fù)制移動、去除等。為了設(shè)計出可以處理多種篡改類型的像素級檢測方法,許多研究者設(shè)計了基于深度學(xué)習(xí)的模型。大多數(shù)深度學(xué)習(xí)方法使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)、長
?
短期記憶模塊(LSTM)或注意力模塊來挖掘隱藏在圖像中的篡改痕跡。
[0005]目前使用的基于深度學(xué)習(xí)的常見圖像篡改檢測算法普遍存在以下缺點:(1)魯棒性不足:圖像的篡改區(qū)域往往與其他區(qū)域具有較高的不一致性,且邊緣會具有大量的偽影,現(xiàn)有方法普遍通過捕捉邊緣偽影來定位篡改的區(qū)域。但是當(dāng)圖像遭到精細的后處理攻擊后,邊緣偽影將會被很大程度得減弱,導(dǎo)致邊緣偽影檢測分支幾乎失效,無法區(qū)分正常物體邊緣和篡改區(qū)域的偽影。
[0006](2)應(yīng)對未知的能力不足:現(xiàn)有方法在跨篡改方式檢測、跨數(shù)據(jù)集檢測上不具備高準(zhǔn)確性。當(dāng)現(xiàn)有方法在應(yīng)對未學(xué)習(xí)過的篡改手段、后處理手段或者數(shù)據(jù)分布時,由于未針對相應(yīng)手段的偽影表現(xiàn)形式、噪聲分布特點、語義對象屬性進行學(xué)習(xí),易產(chǎn)生誤判和不完整的區(qū)域檢測結(jié)果,甚至在預(yù)測錯誤的區(qū)域上給出高置信度的檢測結(jié)果。
技術(shù)實現(xiàn)思路
[0007]針對現(xiàn)有技術(shù)中的不足,本專利技術(shù)引入不確定性估計方法,研究不確定性引導(dǎo)的圖像篡改檢測。本專利技術(shù)設(shè)計了一個不確定性學(xué)習(xí)引導(dǎo)的圖像篡改檢測網(wǎng)絡(luò)(UGNet),在此基礎(chǔ)上,提出了一種基于不確定性引導(dǎo)的圖像篡改檢測方法,該方法在不確定性的指導(dǎo)下,可以專注于細化受圖像固有噪聲和壓縮偽影等影響的低置信度區(qū)域,并且當(dāng)面對未學(xué)習(xí)的操作技術(shù)或后處理方法時,通過使得高置信度圖像塊引導(dǎo)低置信度圖像塊進行篡改特征學(xué)習(xí),從而挖掘篡改區(qū)域和真實區(qū)域之間的差異。
[0008]本專利技術(shù)的技術(shù)方案具體如下:
一種基于不確定性引導(dǎo)的圖像篡改檢測方法,其特征在于,包括以下步驟:S1,搭建圖像篡改檢測網(wǎng)絡(luò),所述圖像篡改檢測網(wǎng)絡(luò)包括不確定性估計網(wǎng)絡(luò)和不確定性引導(dǎo)的精修網(wǎng)絡(luò),所述不確定性估計網(wǎng)絡(luò)包括集成四個MC Dropout塊的第一卷積編碼器
?
解碼器主干網(wǎng)絡(luò),所述不確定性引導(dǎo)的精修網(wǎng)絡(luò)包括第二卷積編碼器
?
解碼器主干網(wǎng)絡(luò)、不確定性引導(dǎo)圖卷積模塊和不確定性增強篡改注意力模塊;S2,將待檢測圖像輸入圖像篡改檢測網(wǎng)絡(luò),利用集成四個MC Dropout塊的第一卷積編碼器
?
解碼器主干網(wǎng)絡(luò)預(yù)測得到篡改區(qū)域的粗略掩碼,并估計出不確定性圖;S3,利用所述不確定性引導(dǎo)圖卷積模塊,將粗略掩碼、不確定性圖和待檢測圖像整合為有向帶權(quán)圖,之后經(jīng)過圖卷積和圖回構(gòu),得到特征權(quán)重矩陣;S4,利用所述不確定性增強篡改注意力模塊,從不確定性圖中提取噪聲特征,使用交叉注意力機制令噪聲特征與不確定性圖相互補充得到親和矩陣,最后經(jīng)過三個級聯(lián)的卷積模塊對親和矩陣進行整合得到輸出,并利用該輸出計算增強不確定性的二元交叉熵損失函數(shù);S5,將待檢測圖像輸入第二卷積編碼器
?
解碼器主干網(wǎng)絡(luò),使用S3得到的特征權(quán)重矩陣與S4得到的二元交叉熵損失函數(shù)進行不確定性引導(dǎo),最終得到精修的檢測結(jié)果。
[0009]優(yōu)選的,所述集成四個MC Dropout塊的第一卷積編碼器
?
解碼器主干網(wǎng)絡(luò)包括編碼器模塊和解碼器模塊,編碼器模塊用于提取篡改特征,解碼器模塊負責(zé)整合篡改特征,進行像素級篡改檢測;其中,編碼器模塊包括四個串聯(lián)的ResNet編碼器,每個ResNet編碼器后均設(shè)置有MC Dropout塊,解碼器模塊包括四個串聯(lián)的上采樣解碼器,每個上采樣解碼器后均設(shè)置有MC Dropout塊,上采樣解碼器與ResNet編碼器一一對應(yīng),且進行跳躍連接;所述第二卷積編碼器
?
解碼器主干網(wǎng)絡(luò)包括編碼器模塊和解碼器模塊;其中,編碼器模塊包括四個串聯(lián)的ResNet編碼器,解碼器模塊包括四個串聯(lián)的上采樣解碼器,上采樣解碼器與ResNet編碼器一一對應(yīng),且進行跳躍連接。
[0010]優(yōu)選的,所述S3,所述不確定性引導(dǎo)圖卷積模塊的處理流程為:S301,將不確定性圖、粗略掩碼、待檢測圖像整合,轉(zhuǎn)化為有向帶權(quán)圖;S302,使用密集模塊提升有向帶權(quán)圖中各個節(jié)點的特征數(shù);S303,使用級聯(lián)的三個圖卷積層促使節(jié)點間的信息交互與指導(dǎo);S304,將各個節(jié)點的特征進行整合壓縮,轉(zhuǎn)化為特征圖權(quán)重,與第二卷積編碼器
?
解碼器主干網(wǎng)絡(luò)的輸入特征圖進行點積和疊加,得到特征權(quán)重矩陣,跳躍連接到第二卷積編碼器
?
解碼器主干網(wǎng)絡(luò)的解碼器模塊。
[0011]優(yōu)選的,所述S301中轉(zhuǎn)化為有向帶權(quán)圖時,只允許低不確定性節(jié)點向相鄰的高不確定性節(jié)點連邊,節(jié)點i和節(jié)點j所連有向邊的計算公式為:其中U
i
和U
j
分別代表第 i 個節(jié)點和第j個節(jié)點所指示的圖像塊的像素平均不確定性,第i個節(jié)點 與第 j個節(jié)點是相鄰的節(jié)點,為有向帶權(quán)圖鄰接矩陣第 i 行第 j 列的
元素,為空集,即第i個節(jié)點和第j個節(jié)點之間不存在有向邊。
[0012]優(yōu)選的,升有向帶權(quán)圖中各個節(jié)點的特征數(shù),使得每個節(jié)點都含有五個特征:紅色通道特征、綠色通道特征、藍色通道特征、不確定性特征U
i
、粗略掩碼特征C
i
。
[0013]優(yōu)選的,所述S303中圖卷積層的計算公式為其中,是圖卷積網(wǎng)絡(luò)第l個隱藏層的輸入特征矩陣,是圖卷積網(wǎng)絡(luò)第l+1個隱藏層的輸入特征矩陣,,A是有向帶權(quán)圖的鄰接矩陣,是的對角度矩陣,是可學(xué)習(xí)的權(quán)重矩陣。
[0014]優(yōu)選的,所述所述S302中的密集模塊用于改變節(jié)點的特征維度:其中,是可學(xué)習(xí)的偏置矩陣,表示批歸一化函數(shù)。
[0015]優(yōu)選的,所述S4,不確定性增強篡改注意力模塊的處理流程為:S401,采用 Bayar 卷積,從輸入的不確定性圖中提取噪聲特征;S402,使用交叉注意力機制將噪聲特征與不確定性圖進行互相補充,得到噪聲特征與不確定性圖之間本文檔來自技高網(wǎng)...
【技術(shù)保護點】
【技術(shù)特征摘要】
1.一種基于不確定性引導(dǎo)的圖像篡改檢測方法,其特征在于,包括以下步驟:S1,搭建圖像篡改檢測網(wǎng)絡(luò),所述圖像篡改檢測網(wǎng)絡(luò)包括不確定性估計網(wǎng)絡(luò)和不確定性引導(dǎo)的精修網(wǎng)絡(luò),所述不確定性估計網(wǎng)絡(luò)包括集成四個MC Dropout塊的第一卷積編碼器
?
解碼器主干網(wǎng)絡(luò),所述不確定性引導(dǎo)的精修網(wǎng)絡(luò)包括第二卷積編碼器
?
解碼器主干網(wǎng)絡(luò)、不確定性引導(dǎo)圖卷積模塊和不確定性增強篡改注意力模塊;S2,將待檢測圖像輸入圖像篡改檢測網(wǎng)絡(luò),利用集成四個MC Dropout塊的第一卷積編碼器
?
解碼器主干網(wǎng)絡(luò)預(yù)測得到篡改區(qū)域的粗略掩碼,并估計出不確定性圖;S3,利用所述不確定性引導(dǎo)圖卷積模塊,將粗略掩碼、不確定性圖和待檢測圖像整合為有向帶權(quán)圖,之后經(jīng)過圖卷積和圖回構(gòu),得到特征權(quán)重矩陣;S4,利用所述不確定性增強篡改注意力模塊,從不確定性圖中提取噪聲特征,使用交叉注意力機制令噪聲特征與不確定性圖相互補充得到親和矩陣,最后經(jīng)過三個級聯(lián)的卷積模塊對親和矩陣進行整合得到輸出,并利用該輸出計算增強不確定性的二元交叉熵損失函數(shù);S5,將待檢測圖像輸入第二卷積編碼器
?
解碼器主干網(wǎng)絡(luò),使用S3得到的特征權(quán)重矩陣與S4得到的二元交叉熵損失函數(shù)進行不確定性引導(dǎo),最終得到精修的檢測結(jié)果。2. 根據(jù)權(quán)利要求1所述的一種基于不確定性引導(dǎo)的圖像篡改檢測方法,其特征在于,所述集成四個MC Dropout塊的第一卷積編碼器
?
解碼器主干網(wǎng)絡(luò)包括編碼器模塊和解碼器模塊,編碼器模塊用于提取篡改特征,解碼器模塊負責(zé)整合篡改特征,進行像素級篡改檢測;其中,編碼器模塊包括四個串聯(lián)的ResNet編碼器,每個ResNet編碼器后均設(shè)置有MC Dropout塊,解碼器模塊包括四個串聯(lián)的上采樣解碼器,每個上采樣解碼器后均設(shè)置有MC Dropout塊,上采樣解碼器與ResNet編碼器一一對應(yīng),且進行跳躍連接;所述第二卷積編碼器
?
解碼器主干網(wǎng)絡(luò)包括編碼器模塊和解碼器模塊;其中,編碼器模塊包括四個串聯(lián)的ResNet編碼器,解碼器模塊包括四個串聯(lián)的上采樣解碼器,上采樣解碼器與ResNet編碼器一一對應(yīng),且進行跳躍連接。3.根據(jù)權(quán)利要求1所述的一種基于不確定性引導(dǎo)的圖像篡改檢測方法,其特征在于,所述S3,所述不確定性引導(dǎo)圖卷積模塊的處理流程為:S301,將不確定性圖、粗略掩碼、待檢測圖像整合,轉(zhuǎn)化為有向帶權(quán)圖;S302,使用密集模塊提升有向帶權(quán)圖中各個節(jié)點的特征數(shù);S303,使用級聯(lián)的三個圖卷積層促使節(jié)點間的信息交互與指導(dǎo);S304,將各個節(jié)點的特征進行整合壓縮,轉(zhuǎn)化為特征圖權(quán)重,與第二卷積編碼器
?
解碼器主干網(wǎng)絡(luò)的輸入特征圖進行點積和疊...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王帥,林訊,汪浩然,徐子航,謝浩志,寇書瑞,
申請(專利權(quán))人:北京航空航天大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。