本發(fā)明專利技術(shù)公開了一種基于半監(jiān)督哈希的圖像檢索方法,主要解決現(xiàn)有技術(shù)檢索速度慢、占用內(nèi)存空間大、檢索結(jié)果不精確的問題。其實現(xiàn)步驟為:(1)提取原始圖像的底層特征,并對其作歸一化處理;(3)將歸一化數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù);(4)使用類標傳遞方法求訓(xùn)練數(shù)據(jù)的類標,根據(jù)類標產(chǎn)生編碼;(5)使用訓(xùn)練數(shù)據(jù)及其編碼訓(xùn)練支持向量機分類器;(6)使用支持向量機分類器對訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)分類,根據(jù)分類結(jié)果產(chǎn)生訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的編碼;(7)根據(jù)訓(xùn)練數(shù)據(jù)編碼和測試數(shù)據(jù)編碼之間的漢明距離得到檢索結(jié)果。本發(fā)明專利技術(shù)降低了內(nèi)存消耗,節(jié)省了檢索時間,提高了圖像檢索的準確性,可用于電子商務(wù)和移動終端設(shè)備的圖片搜索服務(wù)。
【技術(shù)實現(xiàn)步驟摘要】
基于半監(jiān)督哈希的圖像檢索方法
本專利技術(shù)屬于圖像處理領(lǐng)域,更進一步涉及圖像的檢索方法,可有效的對圖像進行編碼,提高圖像的檢索精度。
技術(shù)介紹
隨著計算機技術(shù)、數(shù)字多媒體技術(shù)及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,人們對信息檢索的需求也日益擴大。圖像作為信息的載體,含有豐富的內(nèi)容,給人們的生產(chǎn)和生活帶來了極大的便利。如何迅速有效的搜索到所需要的圖像,成為當(dāng)前的研究熱點之一。為了在大數(shù)據(jù)中快速有效地檢索到用戶所需要的圖像,人們對原始圖像進行編碼,用一定長度的哈希碼來表示圖像。由于計算機中數(shù)據(jù)的存儲及處理均是哈希碼,因此使用哈希碼能夠大大加快信息檢索速度。天格科技(杭州)有限公司提出的專利申請“一種基于局部敏感哈希的相似人臉快速檢索方法”(申請?zhí)枺?01310087561.5,公開號:CN103207898A)公開了一種基于局部敏感哈希的人臉圖像檢索方法。該方法通過人臉區(qū)域檢測、眼睛和嘴巴特征檢測和特征提取、膚色檢測、人臉膚色分布特征提取等步驟將圖像表示為人臉特征向量,然后利用局部敏感哈希方法對人臉特征向量構(gòu)建索引,從而提高查詢時的速度。該方法存在的不足是:局部敏感哈希方法是一種數(shù)據(jù)無關(guān)的哈希方法,隨機性很強,并且為了保證較好的檢索精度,需要的編碼位數(shù)很長,因此在實際應(yīng)用中有很大的限制。浙江大學(xué)提出的專利申請“基于稀疏降維的譜哈希索引方法”(申請?zhí)枺?01010196539.0,公開號:CN101894130A)公開了一種基于稀疏表達和拉普拉斯圖的哈希索引方法。該方法首先提取圖像底層特征,進一步通過聚類得到視覺單詞,然后利用有權(quán)重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐式空間到漢明空間的映射函數(shù),得到低維空間漢明向量。該方法用稀疏降維方式代替譜哈希的主成分分析降維方式,增加了結(jié)果的可解釋性。但是,該專利申請?zhí)岢龅姆椒ù嬖诘牟蛔阒幨牵涸摲椒ㄈ詻]有避免譜哈希模型中強制訓(xùn)練數(shù)據(jù)服從均勻分布的前提假設(shè),使其應(yīng)用價值受到限制。YunchaoGong和SvetlanaLazebnik在文章“IterativeQuantization:AProcrusteanApproachtoLearningBinaryCodes”(IEEEConferenceonComputerVisionandPatternRecognition,2011,pp.817-824)中提出一種迭代量化方法,該方法首先對圖像提取底層特征,然后使用主成分分析方法對底層特征降維,得到低維特征,然后對低維特征旋轉(zhuǎn)并量化得到圖像的編碼。該方法存在的不足是:該方法的前提假設(shè)是底層特征服從高斯分布,但實際數(shù)據(jù)可能并不服從高斯分布,并且該方法沒有使用數(shù)據(jù)的類標,從而使得檢索精度降低。
技術(shù)實現(xiàn)思路
本專利技術(shù)的目的在于針對上述已有技術(shù)的不足,提出一種基于半監(jiān)督哈希的圖像檢索方法,以節(jié)省哈希編碼的存儲空間,降低檢索的時間復(fù)雜度,有效提高圖像檢索的查準率與查全率。實現(xiàn)本專利技術(shù)的技術(shù)方案是:對原始圖像提取底層特征,通過類標傳遞對底層特征標記,使用支持向量機對標記后的底層特征分類,根據(jù)分類結(jié)果對圖像編碼,達到充分利用少量類標數(shù)據(jù),得到更為緊湊的哈希碼。其實現(xiàn)步驟包括如下:(1)從圖像數(shù)據(jù)庫中提取10000張原始圖像,對每一張原始圖像提取局部空間約束的全局頻率特征,得到每一張圖像的特征數(shù)據(jù);(2)對每一張圖像的特征數(shù)據(jù)做歸一化處理,得到歸一化數(shù)據(jù);(3)將所有圖像的歸一化數(shù)據(jù)隨機分成三部分:已標記的訓(xùn)練數(shù)據(jù)L、未標記的訓(xùn)練數(shù)據(jù)U、測試數(shù)據(jù)T,并對已標記的訓(xùn)練數(shù)據(jù)L標記類標HL,將已標記的訓(xùn)練數(shù)據(jù)L和未標記的訓(xùn)練數(shù)據(jù)U組合得到訓(xùn)練數(shù)據(jù)矩陣X;(4)根據(jù)訓(xùn)練數(shù)據(jù)矩陣X和已標記的訓(xùn)練數(shù)據(jù)的類標HL,使用類標傳遞方法求得未標記訓(xùn)練數(shù)據(jù)U的類標HU,將已標記的訓(xùn)練數(shù)據(jù)的類標HL和未標記訓(xùn)練數(shù)據(jù)的類標HU組合得到訓(xùn)練數(shù)據(jù)矩陣的類標H;(5)根據(jù)訓(xùn)練數(shù)據(jù)矩陣X及訓(xùn)練數(shù)據(jù)矩陣的類標H產(chǎn)生更新的訓(xùn)練數(shù)據(jù)的編碼B′;(6)使用訓(xùn)練數(shù)據(jù)矩陣X和更新的訓(xùn)練數(shù)據(jù)的編碼B′對K個支持向量機分類器進行訓(xùn)練,其中K表示編碼位數(shù);(7)使用訓(xùn)練得到的K個支持向量機分類器對訓(xùn)練數(shù)據(jù)X和測試數(shù)據(jù)T進行分類,根據(jù)分類結(jié)果得到訓(xùn)練數(shù)據(jù)X的哈希碼CX和測試數(shù)據(jù)T的哈希碼CT;(8)從測試數(shù)據(jù)的哈希碼CT中取一個測試數(shù)據(jù)的哈希碼t,計算該哈希碼t與訓(xùn)練數(shù)據(jù)的哈希碼CT之間的漢明距離,得到漢明距離向量;(9)對漢明距離向量中的數(shù)值按從小到大的順序進行排序,按順序輸出對應(yīng)的原始圖像,得到檢索結(jié)果。本專利技術(shù)與現(xiàn)有技術(shù)相比具有以下優(yōu)點:第一,本專利技術(shù)由于引入了基于類標傳遞的半監(jiān)督方法,克服了現(xiàn)有技術(shù)中對于類標數(shù)量不足而引起的精度下降的缺點,使得檢索精度更高。第二,本專利技術(shù)由于使用支持向量機分類器產(chǎn)生哈希碼,得到了更為緊湊的哈希碼,因此可以減少內(nèi)存空間的占用。第三,本專利技術(shù)由于使用漢明距離度量圖像間的相似度,可通過計算機很快的計算出漢明距離,因此加快了檢索速度。附圖說明圖1為本專利技術(shù)的實現(xiàn)流程圖;圖2為本專利技術(shù)與現(xiàn)有哈希方法在手寫數(shù)字數(shù)據(jù)庫下的仿真實驗結(jié)果圖;圖3為本專利技術(shù)與現(xiàn)有哈希方法在PIE人臉數(shù)據(jù)庫下的仿真實驗結(jié)果圖。具體實施方案下面結(jié)合附圖,對本專利技術(shù)實現(xiàn)的步驟和效果作進一步的詳細描述。參照圖1,本專利技術(shù)的實現(xiàn)步驟如下:步驟1,獲取原始圖像。從給定的圖像數(shù)據(jù)庫中提取10000張原始圖像,如果圖像數(shù)據(jù)庫中的圖像不足10000張,則取圖像數(shù)據(jù)庫中的所有圖像。步驟2,對每一張原始圖像提取局部空間約束的全局頻率特征,得到每一張圖像的特征數(shù)據(jù)。(2a)對每一張原始圖像3個顏色通道的像素值取均值,得到該原始圖像數(shù)據(jù)的灰度圖像;(2b)利用Gabor濾波器對灰度圖像進行4個尺度、8個方向的濾波,得到灰度圖像的32個特征圖;(2c)將每個特征圖分成大小為4×4的子網(wǎng)格,分別對每個子網(wǎng)格中的所有像素取均值,將該均值排列在一個向量中,得到這張圖像的特征數(shù)據(jù)。步驟3,對每一張圖像的特征數(shù)據(jù)做歸一化處理,得到歸一化數(shù)據(jù)。(3a)對所有圖像的特征數(shù)據(jù)求均值,用每一張圖像特征數(shù)據(jù)減去該均值,得到特征數(shù)據(jù)的中心化數(shù)據(jù);(3b)對中心化數(shù)據(jù)中的每一個向量除以該向量的模,得到特征數(shù)據(jù)的歸一化數(shù)據(jù)。步驟4,對所有圖像的歸一化數(shù)據(jù)隨機劃分。(4a)將所有圖像的歸一化數(shù)據(jù)隨機分成三部分:第一部分是已標記的訓(xùn)練數(shù)據(jù)L,第二部分是未標記的訓(xùn)練數(shù)據(jù)U,第三部分是測試數(shù)據(jù)T;(4b)將已標記的訓(xùn)練數(shù)據(jù)L的類標標記為HL;(4c)將已標記的訓(xùn)練數(shù)據(jù)L和未標記的訓(xùn)練數(shù)據(jù)U進行組合,得到訓(xùn)練數(shù)據(jù)矩陣X。步驟5,根據(jù)訓(xùn)練數(shù)據(jù)矩陣X和已標記的訓(xùn)練數(shù)據(jù)的類標HL,使用類標傳遞方法求得所有訓(xùn)練數(shù)據(jù)的類標H。(5a)建立初始標記矩陣Y,Y的行數(shù)與訓(xùn)練數(shù)據(jù)矩陣X的行數(shù)相同,Y的列數(shù)與已標記的訓(xùn)練數(shù)據(jù)的類標HL中的最大值相同,Y中的每一個元素均初始化為零;(5b)對于訓(xùn)練數(shù)據(jù)矩陣X的第i行為已標記、且其類標為c的訓(xùn)練數(shù)據(jù),將初始標記矩陣Y的第i行第c列的數(shù)賦值為1,從而得到更新的初始標記矩陣Y;(5c)求訓(xùn)練數(shù)據(jù)矩陣X的每兩行之間的歐氏距離d,根據(jù)相似度公式求得這兩行之間的相似度w,其中σ=0.9,將訓(xùn)練數(shù)據(jù)矩陣X中的每兩行之間的相似度組合成相似度矩陣W;(5d)對相似度矩陣W的每一行求和,將求和結(jié)果作為矩陣本文檔來自技高網(wǎng)...

【技術(shù)保護點】
一種基于半監(jiān)督哈希的圖像檢索方法,包括如下步驟:(1)從圖像數(shù)據(jù)庫中提取10000張原始圖像,對每一張原始圖像提取局部空間約束的全局頻率特征,得到每一張圖像的特征數(shù)據(jù);(2)對每一張圖像的特征數(shù)據(jù)做歸一化處理,得到歸一化數(shù)據(jù);(3)將所有圖像的歸一化數(shù)據(jù)隨機分成三部分:已標記的訓(xùn)練數(shù)據(jù)L、未標記的訓(xùn)練數(shù)據(jù)U、測試數(shù)據(jù)T,并對已標記的訓(xùn)練數(shù)據(jù)L標記類標HL,將已標記的訓(xùn)練數(shù)據(jù)L和未標記的訓(xùn)練數(shù)據(jù)U組合得到訓(xùn)練數(shù)據(jù)矩陣X;(4)根據(jù)訓(xùn)練數(shù)據(jù)矩陣X和已標記的訓(xùn)練數(shù)據(jù)的類標HL,使用類標傳遞方法求得未標記訓(xùn)練數(shù)據(jù)U的類標HU,將已標記的訓(xùn)練數(shù)據(jù)的類標HL和未標記訓(xùn)練數(shù)據(jù)的類標HU組合得到訓(xùn)練數(shù)據(jù)矩陣的類標H;(5)根據(jù)訓(xùn)練數(shù)據(jù)矩陣X及訓(xùn)練數(shù)據(jù)矩陣的類標H產(chǎn)生更新的訓(xùn)練數(shù)據(jù)的編碼B′;(6)使用訓(xùn)練數(shù)據(jù)矩陣X和更新的訓(xùn)練數(shù)據(jù)的編碼B′對K個支持向量機分類器進行訓(xùn)練,其中K表示編碼位數(shù);(7)使用訓(xùn)練得到的K個支持向量機分類器對訓(xùn)練數(shù)據(jù)X和測試數(shù)據(jù)T進行分類,根據(jù)分類結(jié)果得到訓(xùn)練數(shù)據(jù)X的哈希碼CX和測試數(shù)據(jù)T的哈希碼CT;(8)從測試數(shù)據(jù)的哈希碼CT中取一個測試數(shù)據(jù)的哈希碼t,計算該哈希碼t與訓(xùn)練數(shù)據(jù)的哈希碼CT之間的漢明距離,得到漢明距離向量;(9)對漢明距離向量中的數(shù)值按從小到大的順序進行排序,按順序輸出對應(yīng)的原始圖像,得到檢索結(jié)果。...
【技術(shù)特征摘要】
1.一種基于半監(jiān)督哈希的圖像檢索方法,包括如下步驟:(1)從圖像數(shù)據(jù)庫中提取10000張原始圖像,對每一張原始圖像提取局部空間約束的全局頻率特征,得到每一張圖像的特征數(shù)據(jù);(2)對每一張圖像的特征數(shù)據(jù)做歸一化處理,得到歸一化數(shù)據(jù);(3)將所有圖像的歸一化數(shù)據(jù)隨機分成三部分:已標記的訓(xùn)練數(shù)據(jù)L、未標記的訓(xùn)練數(shù)據(jù)U、測試數(shù)據(jù)T,并對已標記的訓(xùn)練數(shù)據(jù)L標記類標HL,將已標記的訓(xùn)練數(shù)據(jù)L和未標記的訓(xùn)練數(shù)據(jù)U組合得到訓(xùn)練數(shù)據(jù)矩陣X;(4)根據(jù)訓(xùn)練數(shù)據(jù)矩陣X和已標記的訓(xùn)練數(shù)據(jù)的類標HL,使用類標傳遞方法求得未標記訓(xùn)練數(shù)據(jù)U的類標HU,將已標記的訓(xùn)練數(shù)據(jù)的類標HL和未標記訓(xùn)練數(shù)據(jù)的類標HU組合得到訓(xùn)練數(shù)據(jù)矩陣的類標H;所述的使用類標傳遞方法求得未標記訓(xùn)練數(shù)據(jù)U的類標HU,按如下步驟進行:(4a)根據(jù)訓(xùn)練數(shù)據(jù)矩陣X建立初始化類標矩陣Y,初始化類標矩陣Y的每一行表示訓(xùn)練數(shù)據(jù)矩陣X的對應(yīng)行的類標:(4a1)初始化一個全零矩陣Y,Y的行數(shù)與訓(xùn)練數(shù)據(jù)矩陣X的行數(shù)相同,Y的列數(shù)與已標記的訓(xùn)練數(shù)據(jù)的類標HL中的最大值相同;(4a2)對于訓(xùn)練數(shù)據(jù)矩陣X的第i行為已標記、且其類標為c的訓(xùn)練數(shù)據(jù),將初始化類標矩陣Y的第i行第c列的數(shù)賦值為1;(4b)求訓(xùn)練數(shù)據(jù)矩陣X的每兩行之間的歐氏距離d,根據(jù)相似度公式求得這兩行之間的相似度w,其中σ=0.9,將訓(xùn)練數(shù)據(jù)矩陣X中的每兩行之間的相似度組合成相似度矩陣W;(4c)對相似度矩陣W的每一行求和,將求和結(jié)果作為矩陣的對角值,得到相似度矩陣的度矩陣D;(4d)根據(jù)相似度矩陣W和度矩陣D得到歸一化的相似度矩陣S:S=D-1/2WD-1/2(4e)根據(jù)相似度矩陣S和初始化類標矩陣Y得到類標矩陣F:F=(I-αS)-1Y其中I是單位矩陣,α是調(diào)節(jié)參數(shù),取值為0.9;(4f)求類標矩陣F的每一行的最大值所在位置,將最大值所在位置作為這一行所對應(yīng)的數(shù)據(jù)的類標,從而得到所有訓(xùn)練數(shù)據(jù)的類標,將其中的未標記訓(xùn)練數(shù)據(jù)對應(yīng)的類標取出,組成未標記訓(xùn)練數(shù)據(jù)的類標HU;(5)根據(jù)訓(xùn)練數(shù)據(jù)矩陣X及訓(xùn)練數(shù)據(jù)矩陣的類標H產(chǎn)生更新的訓(xùn)練數(shù)據(jù)的編碼B′;(6)使用訓(xùn)練數(shù)據(jù)矩陣X和更新的訓(xùn)練數(shù)據(jù)的編碼B′對K個支持向量機分類器進行訓(xùn)練,其中K表示編碼位數(shù);(7)使用訓(xùn)練得到的K個支持向量機分類器對訓(xùn)練數(shù)據(jù)X和測試數(shù)據(jù)T進行分類,根據(jù)分類結(jié)果得到訓(xùn)練數(shù)據(jù)X的哈希碼CX和測試數(shù)據(jù)T的哈希碼CT;(8)從測試數(shù)據(jù)的哈希碼...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李潔,高憲軍,王秀美,劉衛(wèi)芳,鄧成,王穎,寒冰,王斌,路文,
申請(專利權(quán))人:西安電子科技大學(xué),
類型:發(fā)明
國別省市:陜西;61
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。