本公開(kāi)提供了一種數(shù)據(jù)恢復(fù)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及深度學(xué)習(xí)、模型訓(xùn)練技術(shù)領(lǐng)域。具體實(shí)現(xiàn)方案為:當(dāng)達(dá)到指定時(shí)機(jī)時(shí),生成處于訓(xùn)練過(guò)程的待訓(xùn)練子模型的快照數(shù)據(jù);當(dāng)滿足預(yù)定的模型數(shù)據(jù)恢復(fù)條件時(shí),從所生成的快照數(shù)據(jù)中,選取待利用的目標(biāo)快照數(shù)據(jù);將所述目標(biāo)快照數(shù)據(jù)所表征的模型中間結(jié)果數(shù)據(jù),加載在所述待訓(xùn)練子模型,得到數(shù)據(jù)恢復(fù)為目標(biāo)模型數(shù)據(jù)的待訓(xùn)練子模型;通過(guò)本方案可以對(duì)聯(lián)邦模型的模型數(shù)據(jù)進(jìn)行數(shù)據(jù)恢復(fù)。數(shù)據(jù)恢復(fù)。數(shù)據(jù)恢復(fù)。
【技術(shù)實(shí)現(xiàn)步驟摘要】
一種數(shù)據(jù)恢復(fù)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
[0001]本公開(kāi)涉及計(jì)算機(jī)
,尤其涉及深度學(xué)習(xí)、模型訓(xùn)練
,具體涉及一種數(shù)據(jù)恢復(fù)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
[0002]聯(lián)邦學(xué)習(xí)是一個(gè)機(jī)器學(xué)習(xí)框架,能夠?qū)崿F(xiàn)在訓(xùn)練參與方的數(shù)據(jù)不暴露的情況下,進(jìn)行數(shù)據(jù)使用和機(jī)器學(xué)習(xí)建模。
[0003]通過(guò)聯(lián)邦學(xué)習(xí)的方式訓(xùn)練一個(gè)可用的聯(lián)邦模型,通常需要較大的數(shù)據(jù)量以及較高的訓(xùn)練輪次。在聯(lián)邦模型訓(xùn)練時(shí),經(jīng)常會(huì)因?yàn)榫W(wǎng)絡(luò)問(wèn)題、機(jī)器故障問(wèn)題等出現(xiàn)訓(xùn)練中斷,而當(dāng)聯(lián)邦模型訓(xùn)練中斷時(shí),通常會(huì)導(dǎo)致聯(lián)邦模型的模型數(shù)據(jù)丟失,需要對(duì)聯(lián)邦模型進(jìn)行重新訓(xùn)練。
技術(shù)實(shí)現(xiàn)思路
[0004]本公開(kāi)提供了一種數(shù)據(jù)恢復(fù)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
[0005]根據(jù)本公開(kāi)的第一方面,提供了一種數(shù)據(jù)恢復(fù)方法,所述方法包括:
[0006]當(dāng)達(dá)到指定時(shí)機(jī)時(shí),生成處于訓(xùn)練過(guò)程的待訓(xùn)練子模型的快照數(shù)據(jù);其中,所述待訓(xùn)練子模型為聯(lián)邦模型中由訓(xùn)練參與方所訓(xùn)練的部分模型,所述指定時(shí)機(jī)為:基于所述待訓(xùn)練子模型的訓(xùn)練輪次所設(shè)定的周期性時(shí)機(jī);
[0007]當(dāng)滿足預(yù)定的模型數(shù)據(jù)恢復(fù)條件時(shí),從所生成的快照數(shù)據(jù)中,選取待利用的目標(biāo)快照數(shù)據(jù);
[0008]將所述目標(biāo)快照數(shù)據(jù)所表征的模型中間結(jié)果數(shù)據(jù),加載在所述待訓(xùn)練子模型,得到數(shù)據(jù)恢復(fù)為目標(biāo)模型數(shù)據(jù)的待訓(xùn)練子模型;
[0009]其中,所述目標(biāo)模型數(shù)據(jù)為從目標(biāo)訓(xùn)練時(shí)機(jī)進(jìn)行訓(xùn)練時(shí)所需利用的模型數(shù)據(jù),所述目標(biāo)訓(xùn)練時(shí)機(jī)為:基于所述目標(biāo)快照數(shù)據(jù)生成時(shí)所述待訓(xùn)練子模型所處的訓(xùn)練時(shí)機(jī)確定得到。
[0010]根據(jù)本公開(kāi)的第二方面,提供了一種數(shù)據(jù)恢復(fù)裝置,所述裝置包括:
[0011]生成模塊,用于當(dāng)達(dá)到指定時(shí)機(jī)時(shí),生成處于訓(xùn)練過(guò)程的待訓(xùn)練子模型的快照數(shù)據(jù);其中,所述待訓(xùn)練子模型為聯(lián)邦模型中由訓(xùn)練參與方所訓(xùn)練的部分模型,所述指定時(shí)機(jī)為:基于所述待訓(xùn)練子模型的訓(xùn)練輪次所設(shè)定的周期性時(shí)機(jī);
[0012]選取模塊,用于當(dāng)滿足預(yù)定的模型數(shù)據(jù)恢復(fù)條件時(shí),從所生成的快照數(shù)據(jù)中,選取待利用的目標(biāo)快照數(shù)據(jù);
[0013]加載模塊,用于將所述目標(biāo)快照數(shù)據(jù)所表征的模型中間結(jié)果數(shù)據(jù),加載在所述待訓(xùn)練子模型,得到數(shù)據(jù)恢復(fù)為目標(biāo)模型數(shù)據(jù)的待訓(xùn)練子模型;
[0014]其中,所述目標(biāo)模型數(shù)據(jù)為從目標(biāo)訓(xùn)練時(shí)機(jī)進(jìn)行訓(xùn)練時(shí)所需利用的模型數(shù)據(jù),所述目標(biāo)訓(xùn)練時(shí)機(jī)為:基于所述目標(biāo)快照數(shù)據(jù)生成時(shí)所述待訓(xùn)練子模型所處的訓(xùn)練時(shí)機(jī)確定得到。
[0015]根據(jù)本公開(kāi)的第三方面,提供了一種電子設(shè)備,包括:
[0016]至少一個(gè)處理器;以及
[0017]與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,
[0018]所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行所述數(shù)據(jù)恢復(fù)方法。
[0019]根據(jù)本公開(kāi)的第四方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行所述數(shù)據(jù)恢復(fù)方法。
[0020]根據(jù)本公開(kāi)的第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述數(shù)據(jù)恢復(fù)方法。
[0021]應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開(kāi)的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開(kāi)的范圍。本公開(kāi)的其它特征將通過(guò)以下的說(shuō)明書(shū)而變得容易理解。
附圖說(shuō)明
[0022]附圖用于更好地理解本方案,不構(gòu)成對(duì)本公開(kāi)的限定。其中:
[0023]圖1是根據(jù)本公開(kāi)提供的一種縱向聯(lián)邦模型的結(jié)構(gòu)示意圖;
[0024]圖2是根據(jù)本公開(kāi)提供的一種數(shù)據(jù)恢復(fù)方法的流程示意圖;
[0025]圖3是根據(jù)本公開(kāi)提供的一種數(shù)據(jù)恢復(fù)方法的另一流程示意圖;
[0026]圖4是根據(jù)本公開(kāi)提供的一種數(shù)據(jù)恢復(fù)裝置的結(jié)構(gòu)示意圖;
[0027]圖5是用來(lái)實(shí)現(xiàn)本公開(kāi)實(shí)施例的數(shù)據(jù)恢復(fù)方法的電子設(shè)備的框圖。
具體實(shí)施方式
[0028]以下結(jié)合附圖對(duì)本公開(kāi)的示范性實(shí)施例做出說(shuō)明,其中包括本公開(kāi)實(shí)施例的各種細(xì)節(jié)以助于理解,應(yīng)當(dāng)將它們認(rèn)為僅僅是示范性的。因此,本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,可以對(duì)這里描述的實(shí)施例做出各種改變和修改,而不會(huì)背離本公開(kāi)的范圍和精神。同樣,為了清楚和簡(jiǎn)明,以下的描述中省略了對(duì)公知功能和結(jié)構(gòu)的描述。
[0029]隨著隱私保護(hù)制度的逐漸完善,聯(lián)邦學(xué)習(xí)近年逐漸得到越來(lái)越多的關(guān)注。通過(guò)聯(lián)邦學(xué)習(xí),訓(xùn)練參與方可以在數(shù)據(jù)不暴露的情況下,進(jìn)行更多數(shù)據(jù)的使用以及利用更多的數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)建模。但聯(lián)邦學(xué)習(xí)的訓(xùn)練效率通常比正常模型慢100倍,且通過(guò)聯(lián)邦學(xué)習(xí)訓(xùn)練一個(gè)可用的聯(lián)邦模型,需要較大的數(shù)據(jù)量以及較多的訓(xùn)練輪次,例如:100輪或200輪等,這樣導(dǎo)致聯(lián)邦模型的整體訓(xùn)練時(shí)間很久,可能需要訓(xùn)練幾天或幾周。并且,聯(lián)邦學(xué)習(xí)較為依賴網(wǎng)絡(luò)傳輸,在聯(lián)邦模型訓(xùn)練時(shí),經(jīng)常會(huì)因?yàn)榫W(wǎng)絡(luò)問(wèn)題、機(jī)器故障等問(wèn)題導(dǎo)致聯(lián)邦模型整體訓(xùn)練失敗,聯(lián)邦模型的模型數(shù)據(jù)丟失,需要重新訓(xùn)練聯(lián)邦模型,浪費(fèi)大量時(shí)間。示例性的,模型數(shù)據(jù)可以包括但不局限于訓(xùn)練所得到的模型參數(shù)。
[0030]相關(guān)技術(shù)中存在多種減少聯(lián)邦模型訓(xùn)練中斷的可能性的方案,即盡量減少聯(lián)邦模型的模型數(shù)據(jù)丟失的方案。其中,關(guān)于優(yōu)化網(wǎng)絡(luò)的方案,通過(guò)購(gòu)買(mǎi)帶寬高、延遲低的網(wǎng)絡(luò),或者拉專線,提升網(wǎng)絡(luò)質(zhì)量,從而減少因網(wǎng)絡(luò)問(wèn)題導(dǎo)致聯(lián)邦模型訓(xùn)練中斷的可能性,從而減少聯(lián)邦模型的模型數(shù)據(jù)丟失;關(guān)于減少通信次數(shù)的方案,通過(guò)修改算法的邏輯,如spliting,減少聯(lián)邦模型訓(xùn)練時(shí)的網(wǎng)絡(luò)傳輸次數(shù),如:將需多次傳輸?shù)臄?shù)據(jù)打包為整體進(jìn)行傳輸,從而減少聯(lián)邦模型訓(xùn)練時(shí)出錯(cuò)或中斷的可能性,進(jìn)而減少聯(lián)邦模型的模型數(shù)據(jù)丟失;關(guān)于引入
重試機(jī)制的方案,通過(guò)聯(lián)邦學(xué)習(xí)框架所連接的庫(kù),如GRPC(gRPC Remote Procedure Calls,一個(gè)開(kāi)源遠(yuǎn)程過(guò)程調(diào)用系統(tǒng)),利用庫(kù)中封裝好的重試機(jī)制,在網(wǎng)絡(luò)發(fā)生抖動(dòng)時(shí),進(jìn)行重試。
[0031]而采用相關(guān)技術(shù)的方案,并不能很好解決聯(lián)邦模型訓(xùn)練數(shù)據(jù)丟失的問(wèn)題:
[0032]在優(yōu)化網(wǎng)絡(luò)時(shí),通常需要參與聯(lián)邦學(xué)習(xí)的多個(gè)訓(xùn)練參與方進(jìn)行相關(guān)網(wǎng)絡(luò)設(shè)備與服務(wù)的升級(jí),金錢(qián)成本很高,且如果優(yōu)化的網(wǎng)絡(luò)策略與訓(xùn)練參與方本身的網(wǎng)絡(luò)策略相沖突,需要很高的改造時(shí)間與較大的人力成本,因此訓(xùn)練參與方在參與聯(lián)邦學(xué)習(xí)時(shí),更傾向于使用其自身已有的設(shè)施與配置;
[0033]修改算法邏輯,減少網(wǎng)絡(luò)傳輸次數(shù),并不是一個(gè)普適性的方案,僅對(duì)部分算法生效,而另一些算法,如:XGB(eXtreme Gradient Boosting)算法,由于其自身的算法原理,無(wú)法進(jìn)行相關(guān)邏輯的修改;
[0034]引入重試機(jī)制確實(shí)可以在大部分場(chǎng)景解決一部分問(wèn)題,提高聯(lián)邦模型建模的成功率,并減少聯(lián)邦模型模型數(shù)據(jù)的丟失,但聯(lián)邦學(xué)習(xí)仍舊嚴(yán)重依賴基礎(chǔ)設(shè)施,重試對(duì)于偶發(fā)的斷鏈問(wèn)題無(wú)法根治,重試僅僅是一個(gè)簡(jiǎn)單的解決方案,如:當(dāng)聯(lián)邦模型訓(xùn)練因?yàn)榫W(wǎng)絡(luò)問(wèn)題出現(xiàn)斷鏈時(shí),通常會(huì)直接進(jìn)行瞬時(shí)重試,此處網(wǎng)絡(luò)問(wèn)題還未修復(fù),重試并不能解決斷鏈問(wèn)題,聯(lián)邦模型的模本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
【技術(shù)特征摘要】
1.一種數(shù)據(jù)恢復(fù)方法,所述方法包括:當(dāng)達(dá)到指定時(shí)機(jī)時(shí),生成處于訓(xùn)練過(guò)程的待訓(xùn)練子模型的快照數(shù)據(jù);其中,所述待訓(xùn)練子模型為聯(lián)邦模型中由訓(xùn)練參與方所訓(xùn)練的部分模型,所述指定時(shí)機(jī)為:基于所述待訓(xùn)練子模型的訓(xùn)練輪次所設(shè)定的周期性時(shí)機(jī);當(dāng)滿足預(yù)定的模型數(shù)據(jù)恢復(fù)條件時(shí),從所生成的快照數(shù)據(jù)中,選取待利用的目標(biāo)快照數(shù)據(jù);將所述目標(biāo)快照數(shù)據(jù)所表征的模型中間結(jié)果數(shù)據(jù),加載在所述待訓(xùn)練子模型,得到數(shù)據(jù)恢復(fù)為目標(biāo)模型數(shù)據(jù)的待訓(xùn)練子模型;其中,所述目標(biāo)模型數(shù)據(jù)為從目標(biāo)訓(xùn)練時(shí)機(jī)進(jìn)行訓(xùn)練時(shí)所需利用的模型數(shù)據(jù),所述目標(biāo)訓(xùn)練時(shí)機(jī)為:基于所述目標(biāo)快照數(shù)據(jù)生成時(shí)所述待訓(xùn)練子模型所處的訓(xùn)練時(shí)機(jī)確定得到。2.根據(jù)權(quán)利要求1所述的方法,其中,所述當(dāng)滿足預(yù)定的模型數(shù)據(jù)恢復(fù)條件時(shí),從所生成的快照數(shù)據(jù)中,選取待利用的目標(biāo)快照數(shù)據(jù),包括:當(dāng)所述待訓(xùn)練子模型的訓(xùn)練過(guò)程產(chǎn)生中斷且中斷結(jié)束時(shí),從所生成的快照數(shù)據(jù)中,選取待利用的目標(biāo)快照數(shù)據(jù)。3.根據(jù)權(quán)利要求1所述的方法,其中,所述從所生成的快照數(shù)據(jù)中,選取待利用的目標(biāo)快照數(shù)據(jù),包括:從所生成的快照數(shù)據(jù)中,選取生成時(shí)間最晚的快照數(shù)據(jù),得到待利用的目標(biāo)快照數(shù)據(jù)。4.根據(jù)權(quán)利要求1
?
3任一項(xiàng)所述的方法,其中,所述基于所述待訓(xùn)練子模型的訓(xùn)練輪次所設(shè)定的周期性時(shí)機(jī),包括:所述訓(xùn)練輪次的結(jié)束時(shí)機(jī)。5.根據(jù)權(quán)利要求4所述的方法,其中,所述快照數(shù)據(jù)中記錄有第一訓(xùn)練狀態(tài)數(shù)據(jù);其中,所述第一訓(xùn)練狀態(tài)數(shù)據(jù)用于表征生成所述快照數(shù)據(jù)時(shí)所述待訓(xùn)練子模型所處的訓(xùn)練輪次;基于所述目標(biāo)快照數(shù)據(jù)生成時(shí)所述待訓(xùn)練子模型所處的訓(xùn)練時(shí)機(jī),確定目標(biāo)訓(xùn)練時(shí)機(jī)的方式包括:將所述目標(biāo)快照數(shù)據(jù)中的第一訓(xùn)練狀態(tài)數(shù)據(jù)表征的訓(xùn)練輪次的下一輪次,確定為目標(biāo)訓(xùn)練時(shí)機(jī)。6.根據(jù)權(quán)利要求1
?
3任一項(xiàng)所述的方法,其中,所述基于所述待訓(xùn)練子模型的訓(xùn)練輪次所設(shè)定的周期性時(shí)機(jī),包括:所述訓(xùn)練輪次中的訓(xùn)練階段的結(jié)束時(shí)機(jī)。7.根據(jù)權(quán)利要求6所述的方法,其中,所述快照數(shù)據(jù)中記錄有第二訓(xùn)練狀態(tài)數(shù)據(jù);其中,所述第二訓(xùn)練狀態(tài)數(shù)據(jù)用于表征生成所述快照數(shù)據(jù)時(shí)所述待訓(xùn)練子模型所處訓(xùn)練輪次以及所處訓(xùn)練階段;基于所述目標(biāo)快照數(shù)據(jù)生成時(shí)所述待訓(xùn)練子模型所處的訓(xùn)練時(shí)機(jī),確定目標(biāo)訓(xùn)練時(shí)機(jī)的方式,包括:確定所述目標(biāo)快照數(shù)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張夢(mèng),尉乃升,王藝,岳洪達(dá),
申請(qǐng)(專利權(quán))人:北京百度網(wǎng)訊科技有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。