【技術實現步驟摘要】
聯邦聚類方法、裝置、中心服務器、系統和電子設備
[0001]本專利技術涉及聚類分析
,尤其涉及一種聯邦聚類方法、裝置、中心服務器、系統和電子設備。
技術介紹
[0002]聚類是將相似的對象通過靜態分類的方法分成不同的組別或者更多的子集,這樣讓在同一個子集中的成員對象都有相似的一些屬性。聚類算法在模式識別中主要應用于語音識別、字符識別等,在圖像處理中主要用于數據壓縮和信息檢索。橫向聯邦學習,是聯邦學習的一種分布式結構,旨在模型訓練和推理過程中保護數據擁有方的數據隱私,其中,各個分布式節點的數據特征相同,樣本空間不同。
[0003]由于基于機器學習的聯邦聚類方法的應用場景以及準確率比較有限,且無法表達出復雜的聚類關系。因此,現有技術中一般采用基于深度學習的聯邦聚類方法對數據進行聚類分析,其中,在橫向聯邦學習中,由于各個參與方共用一個聚類模型,從而導致中心服務器會將某一個參與方沒有的類別對應的聚類模型參數暴露給該參與方,無法保證各個參與方的數據隱私性。
[0004]因此,如何保證聯邦聚類分析過程中各個參與方的數據隱私性,是相關領域技術人員亟待解決的技術問題。
技術實現思路
[0005]本專利技術提供一種聯邦聚類方法、裝置、中心服務器、系統和電子設備,用以解決現有技術中無法保證聯邦聚類分析過程中各個參與方的數據隱私性的缺陷。
[0006]本專利技術提供一種聯邦聚類方法,包括:
[0007]獲取聯邦聚類模型,所述聯邦聚類模型包括目標主聚類網絡和至少兩個目標子聚類網絡,所述聯 ...
【技術保護點】
【技術特征摘要】
1.一種聯邦聚類方法,其特征在于,包括:獲取聯邦聚類模型,所述聯邦聚類模型包括目標主聚類網絡和至少兩個目標子聚類網絡,所述聯邦聚類模型基于至少兩個參與方設備的聚類樣本數據對初始聚類模型進行橫向聯邦聚類訓練得到;發送所述目標主聚類網絡對應的目標主網絡參數至每個所述參與方設備,并接收每個所述參與方設備傳輸的目標樣本聚類類別,所述目標樣本聚類類別基于所述目標主網絡參數以及所述參與方設備的聚類樣本數據確定;針對每個所述參與方設備,基于所述參與方設備對應的目標樣本聚類類別,從所述至少兩個目標子聚類網絡中確定出所述參與方設備對應的第一目標子聚類網絡;發送所述第一目標子聚類網絡對應的目標子網絡參數至所述參與方設備,以使所述參與方設備基于所述目標主網絡參數和所述目標子網絡參數生成目標聚類模型,并基于所述目標聚類模型對其待聚類數據進行聚類分析。2.根據權利要求1所述的聯邦聚類方法,其特征在于,所述初始聚類模型包括初始主聚類網絡和至少兩個初始子聚類網絡,所述聯邦聚類模型中的目標主聚類網絡和目標子聚類網絡是基于以下方式訓練得到的:發送所述初始主聚類網絡對應的初始主網絡參數至每個所述參與方設備,并接收每個所述參與方設備發送的所述初始主聚類網絡對應的第一損失,基于各所述第一損失確定安全聚合后所述初始主聚類網絡對應的第一主網絡聚類損失,并基于所述第一主網絡聚類損失和所述初始主聚類網絡確定調優主聚類網絡;發送所述調優主聚類網絡對應的調優主網絡參數至每個所述參與方設備,并接收每個所述參與方設備傳輸的第一樣本聚類類別,所述第一樣本聚類類別基于所述調優主網絡參數以及所述參與方設備的聚類樣本數據確定;針對每個所述參與方設備,確定與所述參與方設備的第一樣本聚類類別相對應的第一初始子聚類網絡,并發送所述第一初始子聚類網絡對應的第一子網絡參數至所述參與方設備;接收每個所述參與方設備發送的所述調優主聚類網絡對應的第二損失,并基于各所述第二損失確定安全聚合后所述調優主聚類網絡對應的第二主網絡聚類損失;接收每個所述參與方設備發送的所述第一初始子聚類網絡對應的第三損失,并基于各所述第三損失確定安全聚合后所述至少兩個初始子聚類網絡對應的第一子網絡聚類損失;基于所述第二主網絡聚類損失對所述調優主聚類網絡進行優化,得到優化后的目標主聚類網絡,并基于所述第一子網絡聚類損失對所述至少兩個初始子聚類網絡進行優化,得到優化后的目標子聚類網絡。3.根據權利要求2所述的聯邦聚類方法,其特征在于,所述基于所述第一主網絡聚類損失和所述初始主聚類網絡確定調優主聚類網絡,包括:在一次迭代中,基于所述第一主網絡聚類損失和所述初始主聚類網絡確定優化后的第一主聚類網絡,發送所述第一主聚類網絡對應的第一主網絡參數至每個所述參與方設備,接收每個所述參與方設備發送的所述第一主聚類網絡對應的第四損失,并基于各所述第四損失確定安全聚合后所述第一主聚類網絡對應的第二主網絡聚類損失;在所述第二主網絡聚類損失不小于預設損失閾值,且當前迭代次數不大于最大迭代次
數的情況下,重復執行上述步驟,以對所述初始主聚類網絡進行迭代更新,并將迭代更新后的初始主聚類網絡確定為所述調優主聚類網絡;在所述第二主網絡聚類損失小于預設損失閾值,或者當前迭代次數大于最大迭代次數的情況下,基于所述第二主網絡聚類損失對所述第一主聚類網絡進行優化,并將優化后的第一主聚類網絡確定為所述調優主聚類網絡。4.根據權利要求2所述的聯邦聚類方法,其特征在于,所述基于所述第二主網絡聚類損失對所述調優主聚類網絡進行優化,得到優化后的目標主聚類網絡,并基于所述第一子網絡聚類損失對所述至少兩個初始子聚類網絡進行優化,得到優化后的目標子聚類網絡,包括:基于所述第二主網絡聚類損失對所述調優主聚類網絡進行優化,得到優化后的第二主聚類網絡,并基于所述第一子網絡聚類損失對所述至少兩個初始子聚類網絡...
【專利技術屬性】
技術研發人員:王宇軒,陳巍,汪晶,賀茂華,
申請(專利權)人:科大訊飛股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。