System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及多視圖聚類,尤其涉及一種增量深度的多視圖聚類方法。
技術介紹
1、隨著社交媒體平臺以及各式各樣拍攝工具的普及,圖像的產出速率顯著加快。由于能夠直觀且生動地傳遞大量信息,圖片在大數據時代成為了極為珍貴的資源。圖像聚類在圖像檢索、醫學影像分析等多個應用領域都能發揮重要作用。傳統的聚類算法在處理靜態不變的數據集時已經表現得相當出色,但在實際應用中,經常遇到的是動態變化的數據流,這些數據往往以塊或批次的形式陸續到達。比如社交媒體分析等領域,為了避免每次新數據到來都需要從頭開始聚類的過程,增量聚類算法顯得尤為重要。
2、在現有技術中,增量聚類通常結合在線學習和流式數據處理的理念,利用記憶機制來保留重要信息,從而在不斷變化的數據環境中保持模型的更新和適應性。此外,近年來深度學習技術的快速發展,為圖像聚類提供了更強大的特征提取能力,尤其是在處理高維和復雜數據時,深度生成模型如變分自編碼器(variational?autoencoder,vae)和生成對抗網絡(generative?adversarial?networks,gan)等方法為聚類任務開辟了新的視角,使得圖像聚類在多視圖學習和動態數據流中具備更高的靈活性和效率。
3、然而,在處理動態變化的數據時,聚類數量往往不固定,這使得傳統聚類方法面臨挑戰。此外,隨著多視圖數據的引入,不同視圖之間的異質性和信息冗余性進一步增加,使得聚類任務變得更加復雜。同時,模型在學習新數據時可能會遺忘舊數據的知識,導致信息損失。
技術實現思路>
1、本申請的目的在于提供一種增量深度的多視圖聚類方法,以解決現有技術中存在的現有聚類模型聚類數量不固定以及特征共享性能較差的技術問題。本申請提供的諸多技術方案中的優選技術方案所能產生的諸多技術效果詳見下文闡述。
2、為實現上述目的,本申請提供了以下技術方案:
3、本申請的第一方面提供的一種增量深度的多視圖聚類方法,包括:利用變分自編碼器提取多視圖數據的潛在變量,基于所述潛在變量得到重構數據,并基于所述重構數據計算所述變分自編碼器的損失函數的第一損失值;若所述第一損失值小于第一預設閾值,則利用所述變分自編碼器輸出的當前潛在變量更新dpmm模型的聚類參數,得到更新后的dpmm模型輸出的聚類標簽;將更新后的聚類標簽加入所述變分自編碼器的損失函數,得到總損失函數,若所述總損失函數的第二損失值小于第二預設閾值,則將所述聚類標簽作為所述多視圖數據的聚類結果輸出。
4、在一些實施例中,所述方法還包括:初始化所述變分自編碼器,為所述多視圖數據中的每一個視圖構建一個獨立編碼器和一個獨享解碼器;為所述多視圖數據構建一個共享編碼器和一個共享解碼器。
5、在一些實施例中,所述利用變分自編碼器提取多視圖數據的潛在變量,包括:利用對應的獨立編碼器對每個視圖進行編碼,得到特定潛在變量;利用所述共享編碼器對所有視圖進行編碼,生成共享潛在變量;利用所述獨享解碼器對所述特定潛在變量進行解碼,以及利用所述共享解碼器對所述共享潛在變量進行解碼,得到所述重構數據。
6、在一些實施例中,所述基于所述重構數據計算所述變分自編碼器的損失函數的第一損失值,包括:計算每個視圖的重構損失和kl散度損失;將所有視圖的重構損失和所述kl散度損失進行結合,得到所述第一損失值。
7、在一些實施例中,所述方法還包括:若所述第一損失值大于等于所述第一預設閾值,則利用反向傳播算法更新所述變分自編碼器的參數。
8、在一些實施例中,所述利用所述變分自編碼器輸出的當前潛在變量更新dpmm模型的聚類參數,包括:根據每個所述聚類標簽,重新計算每個聚類的聚類均值、協方差以及混合權重,并根據計算結果創建新的聚類和/或將聚類進行結合。
9、在一些實施例中,所述將更新后的聚類標簽加入所述變分自編碼器的損失函數,得到總損失函數,包括:利用所述聚類標簽的標簽信息,向所述變分自編碼器的損失函數添加聚類一致性損失,得到所述總損失函數。
10、在一些實施例中,所述方法還包括:若所述總損失函數的第二損失值大于等于所述第二預設閾值,則利用所述第二損失值更新所述變分自編碼器的損失函數。
11、本申請的第二方面提供一種計算機可讀的存儲介質,所述存儲介質上存儲有計算機程序,所述計算機程序被執行時實現如上所述的增量深度的多視圖聚類方法。
12、本申請的第三方面提供一種處理設備,包括:一個或多個處理器;存儲器,用于存儲一個或多個計算機程序,一個或多個所述處理器用于執行所述存儲器存儲的一個或多個計算機程序,以使一個或多個所述處理器執行如上所述的增量深度的多視圖聚類方法。
13、實施本申請上述技術方案中的一個技術方案,具有如下優點或有益效果:在本申請中,通過利用變分自編碼器來提取多視圖數據的潛在變量,利用潛在變量來更新dpmm模型(dirichlet?process?mixture?model,dirichlet過程混合模型)的聚類參數,最后利用dpmm模型輸出的聚類標簽來更新變分自編碼器的損失函數,以此來同時訓練變分自編碼器和dpmm模型,提高模型性能。在這種情況下,能夠更好地捕捉不同視圖數據的復雜分布,使得dpmm模型的聚類數量能夠保持穩定。同時,通過更新的聚類標簽來進一步訓練模型,能夠有效地利用已有信息進行新的學習過程,而無需重新訓練,適用于多種實際應用場景。
本文檔來自技高網...【技術保護點】
1.一種增量深度的多視圖聚類方法,其特征在于,包括:
2.根據權利要求1所述的增量深度的多視圖聚類方法,其特征在于,所述方法還包括:初始化所述變分自編碼器,為所述多視圖數據中的每一個視圖構建一個獨立編碼器和一個獨享解碼器;為所述多視圖數據構建一個共享編碼器和一個共享解碼器。
3.根據權利要求2所述的增量深度的多視圖聚類方法,其特征在于,所述利用變分自編碼器提取多視圖數據的潛在變量,包括:利用對應的獨立編碼器對每個視圖進行編碼,得到特定潛在變量;利用所述共享編碼器對所有視圖進行編碼,生成共享潛在變量;利用所述獨享解碼器對所述特定潛在變量進行解碼,以及利用所述共享解碼器對所述共享潛在變量進行解碼,得到所述重構數據。
4.根據權利要求1所述的增量深度的多視圖聚類方法,其特征在于,所述基于所述重構數據計算所述變分自編碼器的損失函數的第一損失值,包括:計算每個視圖的重構損失和KL散度損失;將所有視圖的重構損失和所述KL散度損失進行結合,得到所述第一損失值。
5.根據權利要求1所述的增量深度的多視圖聚類方法,其特征在于,所述方法還包括:若所述第
6.根據權利要求1所述的增量深度的多視圖聚類方法,其特征在于,所述利用所述變分自編碼器輸出的當前潛在變量更新DPMM模型的聚類參數,包括:根據每個所述聚類標簽,重新計算每個聚類的聚類均值、協方差以及混合權重,并根據計算結果創建新的聚類和/或將聚類進行結合。
7.根據權利要求1所述的增量深度的多視圖聚類方法,其特征在于,所述將更新后的聚類標簽加入所述變分自編碼器的損失函數,得到總損失函數,包括:利用所述聚類標簽的標簽信息,向所述變分自編碼器的損失函數添加聚類一致性損失,得到所述總損失函數。
8.根據權利要求1所述的增量深度的多視圖聚類方法,其特征在于,所述方法還包括:若所述總損失函數的第二損失值大于等于所述第二預設閾值,則利用所述第二損失值更新所述變分自編碼器的損失函數。
9.一種計算機可讀的存儲介質,其特征在于,所述存儲介質上存儲有計算機程序,所述計算機程序被執行時實現權利要求1-8任一項所述的增量深度的多視圖聚類方法。
10.一種處理設備,其特征在于,包括:
...【技術特征摘要】
1.一種增量深度的多視圖聚類方法,其特征在于,包括:
2.根據權利要求1所述的增量深度的多視圖聚類方法,其特征在于,所述方法還包括:初始化所述變分自編碼器,為所述多視圖數據中的每一個視圖構建一個獨立編碼器和一個獨享解碼器;為所述多視圖數據構建一個共享編碼器和一個共享解碼器。
3.根據權利要求2所述的增量深度的多視圖聚類方法,其特征在于,所述利用變分自編碼器提取多視圖數據的潛在變量,包括:利用對應的獨立編碼器對每個視圖進行編碼,得到特定潛在變量;利用所述共享編碼器對所有視圖進行編碼,生成共享潛在變量;利用所述獨享解碼器對所述特定潛在變量進行解碼,以及利用所述共享解碼器對所述共享潛在變量進行解碼,得到所述重構數據。
4.根據權利要求1所述的增量深度的多視圖聚類方法,其特征在于,所述基于所述重構數據計算所述變分自編碼器的損失函數的第一損失值,包括:計算每個視圖的重構損失和kl散度損失;將所有視圖的重構損失和所述kl散度損失進行結合,得到所述第一損失值。
5.根據權利要求1所述的增量深度的多視圖聚類方法,其特征在于,所述方法還包括:若所述第一損失值大...
【專利技術屬性】
技術研發人員:任亞洲,彭金鳳,陳新越,蒲曉蓉,
申請(專利權)人:電子科技大學深圳高等研究院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。