【技術實現步驟摘要】
本申請總地涉及一種對象索引方法,尤其涉及用于快速把對象索引到數據庫中的對象索引方法。本申請還涉及應用該對象索引方法的對象搜索方法及對象索引系統。
技術介紹
當前存在大量的對象索引和搜索應用,對象如人臉、特定文本或音頻等。例如,應用視頻監控來捕獲并記錄大量公共、私有場所的視頻,這些場所比如,機場、火車站、超市、房間和其他有人或車等出現的場所。監控相機將在長時段捕獲許多對象并記錄到數據庫中,這也稱作索引過程,以使得人或車等的過去存在可被提取并檢查,這也稱作搜索過程。然而,手動檢查大量的視頻數據是極其費力費時的;并且在需要實時提取的許多情形中手動檢查方法是不適用的。例如,父母在機場盡快找到失散的孩子以免延誤國際旅行。在這種情況下,開發了實時人像提取系統以便短時間段內索引并提取目標對象。傳統的人像提取方法至少包括兩個主要過程,圖像索引和搜索。圖像索引過程包括:(1)特征計算,(2)基于特征的聚類,(3)基于聚類的分類。對應的圖像搜索過程包括:(1)相似度計算:比較查詢圖像與聚類中心的值,(2)聚類識別:識別具有最短距離的聚類,以及(3)圖像提取:從識別出的聚類中提取相似圖像。對于視頻監控應用,需要快速索引,以便可以實時搜索需要的人。對于快速索引,在一秒鐘可能存在許多人像。上述圖像的總索引時間應該比一秒短,否則快速索引系統就會阻塞,并且用于索引圖像的延遲時間將變得越來越長。日本專利公開JP5155025描述了一種用于進行人像索引的基于聚類的相似圖像搜索方法。首先,圖像被分類到最近的聚類中。然后,當該聚類的尺寸大于閾值時,讀取該聚類和附近聚類的所有節 ...
【技術保護點】
一種對象索引方法,其特征在于包括:初始化步驟,劃分至少一個第一數據容器和至少一個第二數據容器,以及使用第一數據索引器和第二數據索引器來分別初始化第一數據容器和第二數據容器,第一數據索引器和第二數據索引器分別用于填充第一和第二數據容器并構建第一數據容器和第二數據容器中的數據結構;第一索引步驟,使用第一數據索引器把特定對象的輸入的特征向量加入當前被填充的第一數據容器中;第二索引步驟,在當前被填充的第一數據容器中的數據尺寸已達閾值時,選擇另一個第一數據容器作為當前被填充的第一數據容器,并且在執行第一索引步驟的情況下,使用第二數據索引器把前一個填充的第一數據容器中的批量數據轉換到能夠使用的一個第二數據容器中;其中,該第一數據容器和第二數據容器的尺寸被設置為使得第二索引器把批量數據轉換到第二數據容器中的時段不大于第一索引器填充第一數據容器達到閾值的時段。
【技術特征摘要】
1.一種對象索引方法,其特征在于包括:初始化步驟,劃分至少一個第一數據容器和至少一個第二數據容器,以及使用第一數據索引器和第二數據索引器來分別初始化第一數據容器和第二數據容器,第一數據索引器和第二數據索引器分別用于填充第一和第二數據容器并構建第一數據容器和第二數據容器中的數據結構;第一索引步驟,使用第一數據索引器把特定對象的輸入的特征向量加入當前被填充的第一數據容器中;第二索引步驟,在當前被填充的第一數據容器中的數據尺寸已達閾值時,選擇另一個第一數據容器作為當前被填充的第一數據容器,并且在執行第一索引步驟的情況下,使用第二數據索引器把前一個填充的第一數據容器中的批量數據轉換到能夠使用的一個第二數據容器中;其中,該第一數據容器和第二數據容器的尺寸被設置為使得第二索引器把批量數據轉換到第二數據容器中的時段不大于第一索引器填充第一數據容器達到閾值的時段。2.根據權利要求1所述的對象索引方法,其中,第一數據索引器是分類索引器,初始化步驟包括通過在其中加載表征分類索引器的預定類別代表向量來初始化第一數據容器的加載步驟。3.根據權利要求2所述的對象索引方法,其中,第一數據容器是易失性數據容器。4.根據權利要求1至3之一所述的對象索引方法,其中,第二數據索引器包括聚類索引器,第二索引步驟包括使用聚類索引器來對前一個填充的第一數據容器中的批量數據進行轉換并且把轉換結果存儲到該第二數據容器中。5.根據權利要求4所述的對象索引方法,其中,第二數據索引器還包括倒排索引器,第二索引步驟還包括使用倒排索引器來對前一
\t個填充的第一數據容器中的批量數據進行轉換并且把轉換結果存儲到該第二數據容器中。6.根據權利要求1至3之一所述的對象索引方法,其中,第一數據容器是包括存儲特征向量的易失性數據容器和存儲用于恢復各特征向量的數據的非易失性數據容器的混合容器,第一數據索引器還包括針對同樣特征向量的用于該非易失性數據容器的第三數據索引器;初始化步驟還包括在第二索引步驟成功完成把當前填充的易失性數據容器中的批量數據轉換到第二數據容器中的情況下,釋放當前填充的易失性數據容器中的數據并且釋放相應的非易失性數據容器中的數據;否則,在最后的第一數據容器的非易失性數據容器中的數據可用的情況下,在初始化第一數據容器時根據所述數據恢復對應的易失性數據容器。7.根據權利要求2至3之一所述的對象索引方法,其中,預定類別代表向量包括聚類中心和倒排鍵中至少一種。8.根據權利要求7所述的對象索引方法,其中,加載步驟還包括隨機選擇預定類別代表向量。9.根據權利要求7所述的對象索引方法,其中,加載步驟還包括根據所選的預定類別代表向量模板來選擇預定類別代表向量的模板選擇步驟,預定類別代表向量模板是在相應的第二數據容器中的數據尺寸達到預定尺寸時分別根據相應的第二數據容器的數據單獨構建的。10.根據權利要求9所述的對象索引方法,其中,模板選擇步驟還包括根據當前填充的第一數據容器的初始化時間和各預定類別代表向量模板的構建時間來選擇預定類別代表向量模板的步驟。11.根據權利要求10所述的對象索引方法,其中,選擇其構建時間最接近當前填充的第一數據容器的初始化時間的預定類別代表向量模板。12.根據權利要求9所述的對象索引方法,其中,模板選擇步驟還包括根據與第一數據容器的應用場景相同的應用場景來選擇預定類
\t別代表向量模板的步驟。13.根據權利要求12所述的對象索引方法,其中,所述應用場景包括特定場所以及特別日期中至少一個。14.根據權利要求9所述的對象索引方法,其中,模板選擇步驟還包括根據在給定第一數據索引器的情況下第一數據容器中的向量的經驗分布來選擇預定類別代表向量模板的步驟。15.根據權利要求14所述的對象索引方法,其中,還包括選擇在該給定第一數據索引器的情況下使第一數據容器中的向量分布最均勻的預定類別代表向量模板。16.根據權利要求1至3之一所述的對象索引方法,其中,初始化步驟還包括在滿足以下條件之一時使用第一數據索引器來初始化第一數據容器:在第一數據容器中填充的數據尺寸達到閾值;以及第一數據容器中的填充時間長度達到預設長度。17.根據權利要求1所述的對象索引方法,其中,第一數據容器或第二數據容器包括以下中至少一個:易失性數據容器,非易失性數據容器,以及遠程數據容器。18.根據權利要求1所述的對象索引方法,其中,第一數據索引器或第二數據索引器包括以下中至少一個:順序索引器,分類索引器,聚類索引器,倒排索引器,樹索引器,以及哈希索引器。19.根據權利要求1所述的對象索引方法,其中,第二索引步驟還包括在當前被填充的第一數據容器的數據尺寸已達閾值時釋放該第一數據容器并且生成第一數據容器中的批量數據的備份。20.根據權利要求6所述的對象索引方法,其中,第三數據索引器是順序索引器并且用于恢復各特征向量的數據包括特征向量和標識特征向量所屬的分類的標識。21.一種對象索引設備,其特征在于包括:初始化裝置,被配置為劃分至少一個第一數據容器和至少一個第二數據容器,以及使用第一數據索引器和第二數據索引器來分別初始化第一數據容器和第二數據容器,第一數據索引器和第二數據索引器
\t分別用于填充第一和第二數據容器并構建第一數據容器和第二數據容器中的數據結構;第一索引裝置,被配置為使用第一數據索引器把特定對象的輸入的特征向量加入當前被填充的第一數據容器中;第二索引裝置,被配置為在當前被填充的第一數據容器中的數據...
【專利技術屬性】
技術研發人員:譚誠,黃耀海,李榮軍,那森,椎山弘隆,松下昌弘,
申請(專利權)人:佳能株式會社,
類型:發明
國別省市:日本;JP
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。