• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于多視角的數據子空間聚類方法技術

    技術編號:9356947 閱讀:185 留言:0更新日期:2013-11-21 00:07
    本發明專利技術公開一種基于多視角的數據子空間聚類方法,其包括:提取多視角數據庫中的多視角特征;對于所述多視角數據庫,選擇特定的線性重構表示方法,并確定所述線性重構表示方法相對應的正則化約束方式;確定所述多視角特征中每個視角特征的重構誤差權重;根據所選定的重構表示方法和所獲得的不同視角特征的重構誤差權重,學習得到對所述多視角數據庫中所有樣本進行重構的線性表示矩陣;所述線性表示矩陣用于表示數據庫中樣本之間的關系,元素值表示其所在行對應的樣本重構其所在列對應樣本的重構系數;將所述線性表示矩陣進行相應處理得到度量所述多視角數據庫中樣本相似性的親和矩陣;利用譜聚類算法對所述親和矩陣進行分割得到多視角數據子空間。

    【技術實現步驟摘要】
    一種基于多視角的數據子空間聚類方法
    本專利技術涉及模式識別
    ,尤其是一種基于多視角的數據子空間聚類方法。
    技術介紹
    現實中的數據往往具有多種視角。比如網頁數據既包含圖片信息,又包含文本信息;視頻數據同時包含音頻信息和圖片信息。多視角學習的根本任務是利用不同視角之間的互補信息來提高學習的性能。多視角聚類是多視角學習的一個基本任務,傳統的多視角聚類方法大多以譜聚類為基礎,在度量不同視角表示下的樣本點相似性時以歐氏距離為主。但是數據中的樣本點其本征表示往往處于不同的子空間中,其高維表示下樣本點的歐氏距離并不能有效的反映數據的結構信息。因此傳統的多視角聚類并不能有效地進行多視角子空間的聚類。
    技術實現思路
    鑒于以往的方法不能有效的滿足多視角的子空間聚類的需要,本專利技術提出了一種基于稀疏,低秩等約束的線性重構的方法來挖掘多視角數據內在結構的方法。該方法用不同的正則項來約束重構系數以便深入挖掘出子空間的結構,并且可以利用數據不同視角表示的互補信息進行多視角的子空間聚類。為了解決現有技術存在的空缺,本專利技術的目的是提供一種基于多視角的數據子空間聚類方法,包括步驟:步驟S1,提取多視角數據庫中的多視角特征;步驟S2,對于所述多視角數據庫,選擇特定的線性重構表示方法,并確定所述線性重構表示方法相對應的正則化約束方式;步驟S3,確定所述多視角特征中每個視角特征的重構誤差權重;步驟S4,根據所選定的重構表示方法和所獲得的不同視角特征的重構誤差權重,學習得到對所述多視角數據庫中所有樣本進行重構的線性表示矩陣;所述線性表示矩陣用于表示數據庫中樣本之間的關系,其元素值表示其所在行對應的樣本重構其所在列對應樣本的重構系數;步驟S5,將所述線性表示矩陣進行相應處理,得到度量所述多視角數據庫中樣本相似性的親和矩陣;步驟S6,利用譜聚類算法對所述親和矩陣進行分割,得到多視角數據子空間。本專利技術還公開了一種基于多視角的數據子空間聚類裝置,其包括:特征提取模塊,其用于提取多視角數據庫中的多視角特征;線性重構選擇模塊,其用于對于所述多視角數據庫,選擇特定的線性重構表示方法,并確定所述線性重構表示方法相對應的正則化約束方式;重構誤差權重確定模塊,其用于確定所述多視角特征中每個視角特征的重構誤差權重;線性表示矩陣獲取模塊,其用于根據所選定的重構表示方法和所獲得的不同視角特征的重構誤差權重,學習得到對所述多視角數據庫中所有樣本進行重構的線性表示矩陣;所述線性表示矩陣用于表示數據庫中樣本之間的關系,其元素值表示其所在行對應的樣本重構其所在列對應樣本的重構系數;親和矩陣獲取模塊,其用于將所述線性表示矩陣進行相應處理,得到度量所述多視角數據庫中樣本相似性的親和矩陣;多視角數據子空間聚類模塊,其用于利用譜聚類算法對所述親和矩陣進行分割,得到多視角數據子空間。本專利技術提出的上述方案能夠廣泛的應用于聚類分析問題。在上述方案中,首先提取數據集(包含若干子空間)不同視角下的特征;然后利用稀疏,低秩等約束的數據線性重構的方法求得每一個樣本點在不同視角下相同的重構系數。在確定重構系數時依據先驗信息,對不同視角的重構誤差給予不同的權重來衡量視角的重要性。最后通過所有數據點的重構系數構造度量數據相似性的親和矩陣(affinitymatrix),并利用通用的聚類算法分割此親和矩陣,完成子空間的聚類。該方法假設數據集中不同視角的數據共享相同的子空間結構,令樣本集中數據點在不同視角下具有相同的重構系數,以此來利用多視角數據信息的互補性。同時采用數據重構的方法有助于挖掘出數據中子空間的結構信息。本專利技術方法將不同約束的數據線性重構方法納入到統一的子空間聚類框架中,并提出了一種有效的算法進行目標函數的優化。根據本專利技術的方法,可以挖掘出同一子空間中樣本點的相似關系,并且盡可能減小不同子空間中樣本點的相似性。同時,可以利用數據集中樣本點不同視角描述的信息的互補性來增強子空間聚類的效果。附圖說明圖1是本專利技術中基于多視角的數據子空間聚類方法流程圖。圖2是本專利技術中在圖像和文本兩個視角下子空間聚類的具體模型圖。具體實施方式為使本專利技術的目的、技術方案和優點更加清楚明白,以下結合具體實施例,并參照附圖,對本專利技術進一步詳細說明。圖1是本專利技術基于多視角的數據子空間聚類方法流程圖,如圖1所示,該方法包括以下步驟:步驟S1,收集多視角數據組成的數據庫,多視角數據即同一數據有不同的表現形式,比如視頻數據可以由音頻和圖像流組成,圖片數據可以由圖像本身視覺信息和標記單詞信息組成。對不同視角的數據分別提取特征,如圖片視覺信息的GIST特征,標記單詞的詞頻特征等。步驟S2,針對不同的數據庫,選擇特定的線性重構表示方法,如稀疏表示或者低秩表示,進而確定相對應的正則化約束。在該步驟中,常用的線性重構方法可以是稀疏表示重構,低秩表示重構和嶺回歸表示重構。其對應的正則化約束分別為1范數約束,核范數約束和F范數約束。以Z表示步驟S3中的線性表示矩陣,則正則化約束寫為其對應的對線性表示矩陣的約束依次為||Z||1,||Z||*和通過對線性表示矩陣增加不同的正則化約束,使得線性表示矩陣滿足不同的特性,以挖掘出數據本身的結構信息。如增加核范數約束,使得所述矩陣滿足低秩的特點,以體現數據庫樣本多個子空間的結構信息。在選擇時一般選擇稀疏表示重構,因為其計算相對于低秩表示重構簡單,且效果上一般會優于嶺回歸表示重構。步驟S3,針對所提取的數據庫中不同視角的特征,根據先驗信息確定不同視角重構誤差的權重ωυ,即第υ視角的權重。這里先驗信息指的是不同視角特征對于數據表示能力的強弱。在該步驟中,對于不同視角數據重構的權重,一般高層語義特征的權重要大于底層語義特征的權重。比如標記詞的詞頻特征權重高于圖像的GIST特征的權重。步驟S4,根據S2中選擇的重構方法和S3中確定的不同視角重構誤差的權重對數據庫中的每一樣本在不同視角下學習得到相同的重構系數列向量,將所述列向量按求解順序排列,即得到所有樣本被數據庫中所有樣本進行重構的線性表示矩陣Z,所求矩陣反映了數據庫中樣本之間的關系,其元素值表示其所在行對應的樣本重構其所在列對應樣本的重構系數。在該步驟中,具體優化的目標函數為:其中,Xυ是數據庫X中第υ視角的特征矩陣,每一列表示一個樣本點的視角特征向量,為數據庫中第υ視角的重構誤差,γ為預設的比例系數,用于控制重構誤差項和正則項的比例。重構方法是線性重構,故稱Z為線性表示矩陣,其每一列為對應列的樣本點被以此視角下數據庫進行重構的重構系數。采用增廣拉格朗日乘子法優化上述問題,目標函數(1)等價為:其中,J為中間變量,Y為拉格朗日乘子項,μ為預定系數,初始為較小的正數,tr為trace的縮寫,即求矩陣的跡。對于優化目標(2),令μ逐漸增大,并交替求解J,Z和Y,直至優化目標收斂于Z=J,即可求得線性表示矩陣Z。首先初始化目標(2)相關參數,令Z和Y為同維度的全零矩陣,μ為較小的正數,如10-6,γ可取值為1。目標(2)優化的具體步驟如下:步驟S4.1,求解J:步驟S4.2,求解Z:tmp=2∑υωυ(Xυ)TXυ,Z=(tmp+μI)-1(tmp-Y+μJ)(4)其中,tmp為中間矩陣,I為與tmp矩陣維度相同的單位矩陣。步驟S4.3,更新μ:μ=min(ρ本文檔來自技高網...
    一種基于多視角的數據子空間聚類方法

    【技術保護點】
    一種基于多視角的數據子空間聚類方法,包括步驟:步驟S1,提取多視角數據庫中的多視角特征;步驟S2,對于所述多視角數據庫,選擇特定的線性重構表示方法,并確定所述線性重構表示方法相對應的正則化約束方式;步驟S3,確定所述多視角特征中每個視角特征的重構誤差權重;步驟S4,根據所選定的重構表示方法和所獲得的不同視角特征的重構誤差權重,學習得到對所述多視角數據庫中所有樣本進行重構的線性表示矩陣;所述線性表示矩陣用于表示數據庫中樣本之間的關系,其元素值表示其所在行對應的樣本重構其所在列對應樣本的重構系數;步驟S5,將所述線性表示矩陣進行相應處理,得到度量所述多視角數據庫中樣本相似性的親和矩陣;步驟S6,利用譜聚類算法對所述親和矩陣進行分割,得到多視角數據子空間。

    【技術特征摘要】
    1.一種基于多視角的數據子空間聚類方法,包括步驟:步驟S1,提取多視角數據庫中的多視角特征;步驟S2,對于所述多視角數據庫,選擇特定的線性重構表示方法,并確定所述線性重構表示方法相對應的正則化約束方式;步驟S3,確定所述多視角特征中每個視角特征的重構誤差權重;步驟S4,根據所選定的重構表示方法和所獲得的不同視角特征的重構誤差權重,構造待優化的目標函數,學習得到對所述多視角數據庫中所有樣本進行重構的線性表示矩陣;所述線性表示矩陣用于表示數據庫中樣本之間的關系,其元素值表示其所在行對應的樣本重構其所在列對應樣本的重構系數;步驟S5,將所述線性表示矩陣進行相應處理,得到度量所述多視角數據庫中樣本相似性的親和矩陣;步驟S6,利用譜聚類算法對所述親和矩陣進行分割,得到多視角數據子空間;其中,步驟S4中學習獲得線性表示矩陣的目標函數如下表示:其中,Xv是多視角數據庫中第v視角的特征矩陣,每一列表示一個樣本的視覺特征向量,為第v視角的重構誤差,表示矩陣C的F范數的平方,其值為矩陣C中所有元素平方和;γ為預設的比例系數,Z為所述線性表示矩陣,為線性表示矩陣的正則化約束表示;ωv為第v視角的權重。2.根據權利要求1所述的方法,其特征在于,所述步驟S2中,所述線性重構表示方法包括1范數約束的稀疏表示方法、核范數約束的低秩表示方法以及F范數約束的嶺回歸表示方法;其中1范數約束為||Z||1,計算矩陣Z中所有元素絕對值之和;核范數約束為||Z||*,計算矩陣Z奇異值之和;F范數約束為計算矩陣Z中所有元素平方和。3.根據權利要求1所述的方法,其特征在于,所述步驟S3中,根據不同視角特征對于數據表示能力的強弱確定視角特征的重構誤差權重。4.根據權利要求1所述的方法,其特征在于,所述步驟S4中,線性表示矩陣的每一列對應當前視角下樣本被數據庫所有樣本進行重構的系數列向量,每一列的元素值表示元素所在行所對應數據庫中的樣本的重構系數。5.根據權利要求1所述的方法,其特征在于,步驟S4中采用增廣拉格朗日乘子法優化所述線性表示矩陣的目標函數,得到優化后的所述線性表示矩陣的目標函數如下所示:其中,J為中間變量,Y為拉格朗日乘子項,μ為預設系數,tr為trace的縮寫,用于求矩陣的跡,其值為矩陣對角線元素之和,表示矩陣C的F范數的平方,其值為矩陣C中所有元素平方和。6.根據權利要求5所述的方法,其特征在于,步驟S4中所述優化后的目標函數如下求解:步驟S41,求解J:其中,表示矩陣C的F范數的平方,其值為矩陣C中所有元素平方和;步驟S42,求解Z:tmp=2∑v...

    【專利技術屬性】
    技術研發人員:王亮譚鐵牛赫然尹奇躍
    申請(專利權)人:中國科學院自動化研究所
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 在线精品自拍无码| 国产成人无码专区| 精品无码成人片一区二区98| 无码人妻一区二区三区在线视频| 亚洲另类无码专区丝袜| 日韩AV高清无码| 蜜芽亚洲av无码一区二区三区| 国产精品无码久久综合| 中文字幕久久久人妻无码 | 精品一区二区无码AV | 在线精品自偷自拍无码中文| 久久精品无码一区二区日韩AV| 97免费人妻无码视频| 亚洲av永久无码精品古装片| 人妻无码久久精品| mm1313亚洲国产精品无码试看 | 亚洲AV无码乱码在线观看富二代| 国产精品久久久久无码av| 亚洲真人无码永久在线| 亚洲AⅤ无码一区二区三区在线| 中文字幕av无码无卡免费| 亚洲AV无码成人精品区天堂| 国产激情无码一区二区三区| 18禁成年无码免费网站无遮挡| 最新无码专区视频在线| 久久精品中文无码资源站| 久久亚洲精品AB无码播放| 亚洲精品无码久久一线| 亚洲国产精品无码专区影院 | 日韩精品无码久久一区二区三| 无码专区人妻系列日韩精品少妇| 无码人妻AⅤ一区二区三区 | 久久久久久久久无码精品亚洲日韩| 亚洲va中文字幕无码久久不卡| 久久久久亚洲精品无码网址 | 久久久久亚洲AV无码永不| 国产AV巨作情欲放纵无码| 亚洲精品无码久久久久| 无码H肉动漫在线观看| 无码国产精品一区二区免费16 | 国产成人无码av|