System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機,尤其涉及一種基于秘密分享算法更新模型的方法、裝置、設備及介質。
技術介紹
1、隨著計算設備的普及,與日常生活相關的應用落地,數字信息產生的速度和體量急劇增加。如,在線視頻點播業務記錄用戶的播放行為,社交網絡服務收集好友關系,出行服務平臺獲取乘客的位置信息等等。服務商利用這些數據,通過訓練或完善推薦系統等計算手段,改善應用的性能,提高服務質量,進而提高用戶體驗。
2、這些信息化的數據為人們的生活帶來諸多便利,但是有些數據甚至大部分數據可能包含敏感信息,不便分享至其他服務商使用或者不能獲取到其他服務商持有的數據,這樣可能會造成推薦系統不太符合用戶的實際需求,用戶體驗較差的問題。因此,如何在保障數據隱私安全的基礎上進行模型訓練更新是亟待解決的技術問題。
技術實現思路
1、本說明書實施例提供一種基于秘密分享算法更新目標模型的方法、裝置、設備及介質,以解決現有的模型更新方法存在的數據隱私安全的問題。
2、為解決上述技術問題,本說明書實施例是這樣實現的:
3、本說明書實施例提供的一種基于秘密分享算法更新目標模型的方法,目標模型可以包含基于因子分解機的子模型,該方法可以涉及第一數據方和第二數據方,該方法可以應用于第一數據方,可以包括:
4、獲取第一數據分片;所述第一數據分片包括訓練樣本數據的第一樣本分片以及所述子模型的模型參數的第一參數分片;所述訓練樣本數據包括所述第二數據方持有的針對目標對象的若干項第一特征數據;
5
6、基于所述第一預測值分片與持有第二預測值分片的所述第二數據方利用第二秘密分享算法計算得到第一殘差分片;所述第一殘差分片用于表征所述目標模型的殘差的一個數據分片;所述第二預測值分片為所述目標模型的預測值的另一個數據分片;
7、利用所述第一殘差分片更新所述第一參數分片,得到更新后的目標模型。
8、本說明書實施例提供的一種基于秘密分享算法更新目標模型的裝置,所述目標模型包含基于因子分解機的子模型,所述裝置可以包括:
9、數據獲取模塊,用于獲取第一數據分片;所述第一數據分片包括訓練樣本數據的第一樣本分片以及所述子模型的模型參數的第一參數分片;所述訓練樣本數據包括所述第二數據方持有的針對目標對象的若干項第一特征數據;
10、預測值計算模塊,用于基于所述第一數據分片與持有第二數據分片的所述第二數據方利用第一秘密分享算法計算得到第一預測值分片;所述第一預測值分片用于表示所述目標模型的預測值的一個數據分片;
11、殘差計算模塊,用于基于所述第一預測值分片與持有第二預測值分片的所述第二數據方利用第二秘密分享算法計算得到第一殘差分片;所述第一殘差分片用于表征所述目標模型的殘差的一個數據分片;所述第二預測值分片為所述目標模型的預測值的另一個數據分片;
12、參數更新模塊,用于利用所述第一殘差分片更新所述第一參數分片,得到更新后的目標模型。
13、本說明書實施例提供的一種基于秘密分享算法更新目標模型的設備,可以包括:
14、至少一個處理器;以及,
15、與所述至少一個處理器通信連接的存儲器;其中,
16、所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠:
17、獲取第一數據分片;所述第一數據分片包括訓練樣本數據的第一樣本分片以及所述子模型的模型參數的第一參數分片;所述訓練樣本數據包括所述第二數據方持有的針對目標對象的若干項第一特征數據;
18、基于所述第一數據分片與持有第二數據分片的所述第二數據方利用第一秘密分享算法計算得到第一預測值分片;所述第一預測值分片用于表示所述目標模型的預測值的一個數據分片;
19、基于所述第一預測值分片與持有第二預測值分片的所述第二數據方利用第二秘密分享算法計算得到第一殘差分片;所述第一殘差分片用于表征所述目標模型的殘差的一個數據分片;所述第二預測值分片為所述目標模型的預測值的另一個數據分片;
20、利用所述第一殘差分片更新所述第一參數分片,得到更新后的目標模型。
21、本說明書實施例提供的一種計算機可讀介質,其上存儲有計算機可讀指令,所述計算機可讀指令可被處理器執行以實現一種基于秘密分享算法更新目標模型的方法。
22、本說明書至少一個實施例能夠達到以下有益效果:本說明書實施例中的待更新的目標模型可以包含基于因子分解機的子模型,第一數據方和第二數據方可以基于訓練數據利用第一秘密分享算法協同計算模型預測值,第一數據方和第二數據方分別可以獲取到預測值的數據分片,雙方還可以利用第二秘密分享算法計算模型的殘差,第一數據方可以獲取到殘差的數據分片,然后可以利用殘差的數據分片更新在計算模型預測值的過程中獲取到的模型參數的分片,進而可以更新目標模型。這樣若訓練數據中包含第二數據方持有的特征數據,該特征數據不會直接暴露給第一數據方,但第一數據方也可以進行模型更新,進而可以在保證數據安全的前提下進行模型訓練更新。
本文檔來自技高網...【技術保護點】
1.一種基于秘密分享算法更新目標模型的方法,所述目標模型包含基于因子分解機的子模型,所述方法涉及第一數據方和第二數據方,所述方法應用于第一數據方,包括:
2.根據權利要求1所述的方法,所述子模型包括線性子模型和特征交叉子模型;所述第一參數分片包括線性參數的第一線性參數分片以及隱向量參數的第一隱向量參數分片;
3.根據權利要求2所述的方法,所述訓練樣本數據還包括所述第一數據方持有所述目標對象的若干項第二特征數據;所述子模型還包括雙方特征交叉子模型;所述雙方特征交叉子模型用于表示所述第一特征數據與對應的隱向量的乘積與所述第二特征數據與對應的隱向量的乘積的乘積;所述方法還包括:
4.根據權利要求1所述的方法,所述訓練樣本數據還包括所述第一數據方持有所述目標對象的若干項第二特征數據;所述目標模型包括針對所述第一特征數據的因子分解機的第一子模型與針對所述第二特征數據的因子分解機的第二子模型以及表示雙方特征交叉的第三子模型的和;
5.根據權利要求1所述的方法,若所述子模型為深度因子分解機模型,
6.根據權利要求1所述的方法,所述基于
7.根據權利要求1至6中任一項所述的方法,所述第一數據方持有所述訓練樣本數據對應的實際觀測值。
8.根據權利要求1所述的方法所述第一參數分片包括線性偏移參數的第一偏移參數分片、線性參數的第一線性參數分片以及隱向量參數的第一隱向量參數分片;
9.根據權利要求8所述的方法,若所述訓練數據還包括所述第一數據方持有所述目標對象的若干項第二特征數據;所述第一樣本分片包括所述第一特征數據的第一子特征分片以及所述第二特征數據的第三子特征分片;
10.根據權利要求8所述的方法,若所述子模型為深度因子分解機模型,所述模型參數包括深度參數;所述還包括:
11.根據權利要求9所述的方法,所述方法還包括:
12.根據權利要求3所述的方法,所述基于所述第一樣本分片以及所述第一隱向量參數分片,與所述第二數據方利用乘性秘密分享算法計算所述雙方特征交叉子模型,得到第一雙方特征交叉子預測值分片,具體可以包括:
13.一種基于秘密分享算法更新目標模型的裝置,所述目標模型包含基于因子分解機的子模型,所述裝置包括:
14.一種基于秘密分享算法更新目標模型的設備,包括:
15.一種計算機可讀介質,其上存儲有計算機可讀指令,所述計算機可讀指令可被處理器執行以實現權利要求1至12中任一項所述的基于秘密分享算法更新目標模型的方法。
...【技術特征摘要】
1.一種基于秘密分享算法更新目標模型的方法,所述目標模型包含基于因子分解機的子模型,所述方法涉及第一數據方和第二數據方,所述方法應用于第一數據方,包括:
2.根據權利要求1所述的方法,所述子模型包括線性子模型和特征交叉子模型;所述第一參數分片包括線性參數的第一線性參數分片以及隱向量參數的第一隱向量參數分片;
3.根據權利要求2所述的方法,所述訓練樣本數據還包括所述第一數據方持有所述目標對象的若干項第二特征數據;所述子模型還包括雙方特征交叉子模型;所述雙方特征交叉子模型用于表示所述第一特征數據與對應的隱向量的乘積與所述第二特征數據與對應的隱向量的乘積的乘積;所述方法還包括:
4.根據權利要求1所述的方法,所述訓練樣本數據還包括所述第一數據方持有所述目標對象的若干項第二特征數據;所述目標模型包括針對所述第一特征數據的因子分解機的第一子模型與針對所述第二特征數據的因子分解機的第二子模型以及表示雙方特征交叉的第三子模型的和;
5.根據權利要求1所述的方法,若所述子模型為深度因子分解機模型,
6.根據權利要求1所述的方法,所述基于所述第一預測值分片,與所述第二數據方利用第二秘密分享算法計算得到第一殘差分片,具體包括:
7.根據權利要求1至6中任一項所述的方法,所述第一...
【專利技術屬性】
技術研發人員:劉文炎,李漓春,趙原,
申請(專利權)人:螞蟻區塊鏈科技上海有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。