【技術實現步驟摘要】
一種基于多視角的數據子空間聚類方法
本專利技術涉及模式識別
,尤其是一種基于多視角的數據子空間聚類方法。
技術介紹
現實中的數據往往具有多種視角。比如網頁數據既包含圖片信息,又包含文本信息;視頻數據同時包含音頻信息和圖片信息。多視角學習的根本任務是利用不同視角之間的互補信息來提高學習的性能。多視角聚類是多視角學習的一個基本任務,傳統的多視角聚類方法大多以譜聚類為基礎,在度量不同視角表示下的樣本點相似性時以歐氏距離為主。但是數據中的樣本點其本征表示往往處于不同的子空間中,其高維表示下樣本點的歐氏距離并不能有效的反映數據的結構信息。因此傳統的多視角聚類并不能有效地進行多視角子空間的聚類。
技術實現思路
鑒于以往的方法不能有效的滿足多視角的子空間聚類的需要,本專利技術提出了一種基于稀疏,低秩等約束的線性重構的方法來挖掘多視角數據內在結構的方法。該方法用不同的正則項來約束重構系數以便深入挖掘出子空間的結構,并且可以利用數據不同視角表示的互補信息進行多視角的子空間聚類。為了解決現有技術存在的空缺,本專利技術的目的是提供一種基于多視角的數據子空間聚類方法,包括步驟:步驟S1,提取多視角數據庫中的多視角特征;步驟S2,對于所述多視角數據庫,選擇特定的線性重構表示方法,并確定所述線性重構表示方法相對應的正則化約束方式;步驟S3,確定所述多視角特征中每個視角特征的重構誤差權重;步驟S4,根據所選定的重構表示方法和所獲得的不同視角特征的重構誤差權重,學習得到對所述多視角數據庫中所有樣本進行重構的線性表示矩陣;所述線性表示矩陣用于表示數據庫中樣本之間的關系,其元素值表示其所在 ...
【技術保護點】
一種基于多視角的數據子空間聚類方法,包括步驟:步驟S1,提取多視角數據庫中的多視角特征;步驟S2,對于所述多視角數據庫,選擇特定的線性重構表示方法,并確定所述線性重構表示方法相對應的正則化約束方式;步驟S3,確定所述多視角特征中每個視角特征的重構誤差權重;步驟S4,根據所選定的重構表示方法和所獲得的不同視角特征的重構誤差權重,學習得到對所述多視角數據庫中所有樣本進行重構的線性表示矩陣;所述線性表示矩陣用于表示數據庫中樣本之間的關系,其元素值表示其所在行對應的樣本重構其所在列對應樣本的重構系數;步驟S5,將所述線性表示矩陣進行相應處理,得到度量所述多視角數據庫中樣本相似性的親和矩陣;步驟S6,利用譜聚類算法對所述親和矩陣進行分割,得到多視角數據子空間。
【技術特征摘要】
1.一種基于多視角的數據子空間聚類方法,包括步驟:步驟S1,提取多視角數據庫中的多視角特征;步驟S2,對于所述多視角數據庫,選擇特定的線性重構表示方法,并確定所述線性重構表示方法相對應的正則化約束方式;步驟S3,確定所述多視角特征中每個視角特征的重構誤差權重;步驟S4,根據所選定的重構表示方法和所獲得的不同視角特征的重構誤差權重,構造待優化的目標函數,學習得到對所述多視角數據庫中所有樣本進行重構的線性表示矩陣;所述線性表示矩陣用于表示數據庫中樣本之間的關系,其元素值表示其所在行對應的樣本重構其所在列對應樣本的重構系數;步驟S5,將所述線性表示矩陣進行相應處理,得到度量所述多視角數據庫中樣本相似性的親和矩陣;步驟S6,利用譜聚類算法對所述親和矩陣進行分割,得到多視角數據子空間;其中,步驟S4中學習獲得線性表示矩陣的目標函數如下表示:其中,Xv是多視角數據庫中第v視角的特征矩陣,每一列表示一個樣本的視覺特征向量,為第v視角的重構誤差,表示矩陣C的F范數的平方,其值為矩陣C中所有元素平方和;γ為預設的比例系數,Z為所述線性表示矩陣,為線性表示矩陣的正則化約束表示;ωv為第v視角的權重。2.根據權利要求1所述的方法,其特征在于,所述步驟S2中,所述線性重構表示方法包括1范數約束的稀疏表示方法、核范數約束的低秩表示方法以及F范數約束的嶺回歸表示方法;其中1范數約束為||Z||1,計算矩陣Z中所有元素絕對值之和;核范數約束為||Z||*,計算矩陣Z奇異值之和;F范數約束為計算矩陣Z中所有元素平方和。3.根據權利要求1所述的方法,其特征在于,所述步驟S3中,根據不同視角特征對于數據表示能力的強弱確定視角特征的重構誤差權重。4.根據權利要求1所述的方法,其特征在于,所述步驟S4中,線性表示矩陣的每一列對應當前視角下樣本被數據庫所有樣本進行重構的系數列向量,每一列的元素值表示元素所在行所對應數據庫中的樣本的重構系數。5.根據權利要求1所述的方法,其特征在于,步驟S4中采用增廣拉格朗日乘子法優化所述線性表示矩陣的目標函數,得到優化后的所述線性表示矩陣的目標函數如下所示:其中,J為中間變量,Y為拉格朗日乘子項,μ為預設系數,tr為trace的縮寫,用于求矩陣的跡,其值為矩陣對角線元素之和,表示矩陣C的F范數的平方,其值為矩陣C中所有元素平方和。6.根據權利要求5所述的方法,其特征在于,步驟S4中所述優化后的目標函數如下求解:步驟S41,求解J:其中,表示矩陣C的F范數的平方,其值為矩陣C中所有元素平方和;步驟S42,求解Z:tmp=2∑v...
【專利技術屬性】
技術研發人員:王亮,譚鐵牛,赫然,尹奇躍,
申請(專利權)人:中國科學院自動化研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。