System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及聯邦學習領域,具體涉及一種基于反向拍賣的聯邦學習激勵方法、裝置及系統。
技術介紹
1、聯邦學習(federated?learning,fl)作為一種分布式機器學習方法,近年來受到了眾多研究學者的關注,被廣泛應用于多種領域,如智慧醫療、智慧城市、金融和智能工業等。
2、在聯邦學習中,數據保留在本地物理域中,參與節點使用自身數據分別訓練本地模型,并共同建立聯合模型。聯邦學習激勵機制是聯邦學習系統中用于鼓勵和促進參與者積極參與模型訓練的機制。在聯邦學習中,多個參與者共同協作,訓練一個共享的機器學習模型,同時保持各自的數據隱私不被泄露。由于參與者需要消耗自己的計算資源和電力來進行模型的訓練,因此需要一種激勵機制來補償這些成本,并鼓勵參與者貢獻高質量的數據和計算資源。
3、而如何更合理、有效地提升參與方的動力,保護參與方敏感信息不被泄露,是業界需要解決的一個重要問題。
技術實現思路
1、本專利技術提供一種基于反向拍賣的聯邦學習激勵方法、裝置及系統,以解決現有聯邦學習中參與者激勵不足的問題。
2、為此,本專利技術提供如下技術方案:
3、本專利技術提供一種基于反向拍賣的聯邦學習激勵方法,所述方法包括:
4、通過反向拍賣過程確定參與聯邦學習的客戶端;
5、初始化全局模型,并將所述全局模型分發給各客戶端;
6、接收各客戶端發送的更新模型密文;
7、根據所述更新模型密文生成新的全局模型;
>8、確定各客戶端的獎勵,將所述獎勵發放給對應的客戶端。
9、可選地,所述通過反向拍賣過程確定參與聯邦學習的客戶端包括:
10、發起針對聯邦學習的拍賣;
11、獲取多個客戶端提交的競價信息,所述競價信息包括出價信息和客戶端信息;
12、基于預算約束和所述競價信息,利用反向拍賣算法確定參與聯邦學習的客戶端。
13、可選地,所述競價信息為加密信息;所述方法還包括:使用同態加密的私鑰對所述加密信息進行解密,得到對應的出價信息和客戶端信息。
14、可選地,所述基于預算約束和所述競價信息,利用反向拍賣算法確定參與聯邦學習的客戶端包括:
15、確定評判目標;
16、根據所述評判目標確定評估指標;
17、根據所述評估指標對參與競價的各客戶端進行評分,并根據評分結果對所述客戶端進行優先級排序;
18、依次選擇優先級較高的客戶端并根據所述預算約束確定參與聯邦學習的客戶端的數量。
19、可選地,所述評估指標包括一個或多個;多個評估指標具有相同或不同的權重。
20、可選地,所述多個評估指標包括以下至少兩種或多種:數據質量、計算能力、網絡帶寬。
21、可選地,所述根據所述更新模型密文生成新的全局模型包括:
22、對所述更新模型密文進行解密,得到更新模型;
23、聚合各客戶端的更新模型,得到新的全局模型。
24、可選地,所述確定各客戶端的獎勵包括:
25、確定各客戶端的貢獻度;
26、根據所述貢獻度及預算約束確定各客戶端的獎勵。
27、可選地,所述確定各客戶端的獎勵包括:
28、確定各客戶端的貢獻度;
29、獲取各客戶端的歷史行為記錄,并根據所述歷史行為記錄確定各客戶端的行為評分;
30、根據所述客戶端的行為評分和貢獻度計算所述客戶端的綜合評分;
31、根據各客戶端的綜合評分及預算約束,確定各客戶端的獎勵。
32、可選地,所述確定各客戶端的貢獻度包括:
33、確定各客戶端的更新模型在驗證集上的性能,根據所述性能確定所述各戶端的貢獻度;或者
34、計算各客戶端的更新模型參數與所述新的全局模型參數的差異,根據所述差異確定所述客戶端的貢獻度;或者
35、構建表征合作收益的特征函數,并利用所述特征函數計算所述客戶端的夏普利值,根據所述夏普利值確定所述客戶端的貢獻度。
36、本專利技術還提供一種基于反向拍賣的聯邦學習激勵裝置,所述裝置包括:
37、客戶端選擇模塊,用于通過拍賣過程確定參與聯邦學習的客戶端;
38、模型分發模塊,用于初始化全局模型,并將所述全局模型分發給各客戶端;
39、接收模塊,用于接收各客戶端發送的更新模型密文;
40、模型更新模塊,用于根據所述更新模型密文生成新的全局模型;
41、獎勵確定模塊,用于確定各客戶端的獎勵;
42、獎勵發放模塊,用于將所述獎勵發放給對應的客戶端;
43、其中,所述裝置向監管中心發送整個聯邦學習過程信息,所述聯邦學習過程信息包括訓練過程信息、獎勵發放的合規性信息以及違規客戶端的信息。
44、可選地,所述客戶端選擇模塊包括:
45、拍賣發起單元,用于發起針對聯邦學習的拍賣;
46、信息獲取單元,用于獲取多個客戶端提交的競價信息,所述競價信息包括出價信息和客戶端信息;
47、篩選單元,用于基于預算約束和所述競價信息,利用反向拍賣算法確定參與聯邦學習的客戶端。
48、可選地,所述獎勵確定模塊包括:
49、貢獻度確定單元,用于確定各客戶端的貢獻度;
50、第一獎勵確定單元,用于根據所述貢獻度確定各客戶端的獎勵。
51、可選地,所述獎勵確定模塊包括:
52、貢獻度確定單元,用于確定各客戶端的貢獻度;
53、行為評分單元,用于獲取各客戶端的歷史行為記錄,并根據所述歷史行為記錄確定各客戶端的行為評分;
54、計算單元,根據所述客戶端的行為評分和貢獻度計算所述客戶端的綜合評分;
55、第二獎勵確定單元,用于根據各客戶端的綜合評分及預算約束,確定各客戶端的獎勵。
56、本專利技術還提供一種基于反向拍賣的聯邦學習激勵系統,所述系統包括:中央服務器、以及多個客戶端;所述中央服務器包括所述的基于反向拍賣的聯邦學習激勵裝置。
57、可選地,所述系統還包括:監管中心,用于監控聯邦學習過程,記錄違規客戶端,并監管獎勵發放的合規性。
58、另一方面,本專利技術還提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器運行時執行所述的基于反向拍賣的聯邦學習激勵方法的步驟。
59、本專利技術提供的基于反向拍賣的聯邦學習激勵方法、裝置及系統,通過加密方式可以確保數據在傳輸和計算過程中的隱私性,使得參與者可以在不泄露原始數據的情況下共同訓練模型,實現了對聯邦學習的參與者數據隱私的有效保護。而且,通過反向拍賣過程確定參與聯邦學習的客戶端,允許參與者根據其資源和需求動態出價,確保了在有限預算下的資源有效分配。通過對參與者進行激勵,解決了傳統聯邦學習中存在的參與者動力不足的問題本文檔來自技高網...
【技術保護點】
1.一種基于反向拍賣的聯邦學習激勵方法,其特征在于,所述方法包括:
2.根據權利要求1所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述競價信息為加密信息;所述方法還包括:
3.根據權利要求2所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述基于預算約束和所述競價信息,利用反向拍賣算法確定參與聯邦學習的客戶端包括:
4.根據權利要求3所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述評估指標包括一個或多個;多個評估指標具有相同或不同的權重。
5.根據權利要求4所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述多個評估指標包括以下至少兩種或多種:數據質量、計算能力、網絡帶寬。
6.根據權利要求1所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述根據所述更新模型密文生成新的全局模型包括:
7.根據權利要求1所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述確定各客戶端的獎勵包括:
8.根據權利要求1所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述確定各客戶端的獎勵包括:<
...【技術特征摘要】
1.一種基于反向拍賣的聯邦學習激勵方法,其特征在于,所述方法包括:
2.根據權利要求1所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述競價信息為加密信息;所述方法還包括:
3.根據權利要求2所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述基于預算約束和所述競價信息,利用反向拍賣算法確定參與聯邦學習的客戶端包括:
4.根據權利要求3所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述評估指標包括一個或多個;多個評估指標具有相同或不同的權重。
5.根據權利要求4所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述多個評估指標包括以下至少兩種或多種:數據質量、計算能力、網絡帶寬。
6.根據權利要求1所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述根據所述更新模型密文生成新的全局模型包括:
7.根據權利要求1所述的基于反向拍賣的聯邦學習激勵方法,其特征在于,所述確定各客戶端的獎勵包括:
8.根據權利要求1所述的基于反向拍賣的聯邦...
【專利技術屬性】
技術研發人員:曹揚,朱策,管桂林,楊波,蔡惠民,
申請(專利權)人:中電科大數據研究院有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。