System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)實(shí)施例涉及機(jī)器學(xué)習(xí)數(shù)據(jù)隱私保護(hù),特別涉及一種基于聯(lián)邦學(xué)習(xí)的高效航班延誤預(yù)測(cè)方法和裝置。
技術(shù)介紹
1、現(xiàn)實(shí)場(chǎng)景中航班相關(guān)信息存儲(chǔ)在空管局、航空公司和機(jī)場(chǎng)等各民航部門,并且有著堅(jiān)固的地域壁壘,信息之間相互割裂。目前大多數(shù)的航班延誤預(yù)測(cè)方法主要集中在傳統(tǒng)集中式的分類法和回歸法,采用集中式建模的機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型。
2、但是,傳統(tǒng)的集中式模型大多需要將不同源收集的大量數(shù)據(jù)直接統(tǒng)一收集到一個(gè)的地方存儲(chǔ)起來(lái),大量的數(shù)據(jù)收集引起了隱私泄露問(wèn)題。在實(shí)際應(yīng)用場(chǎng)景中,由于數(shù)據(jù)法律法規(guī)和各機(jī)構(gòu)的利益競(jìng)爭(zhēng),很難實(shí)現(xiàn)集中式建模方式,歐盟頒布的《通用數(shù)據(jù)保護(hù)條例》(general?data?protection?regulation,gdpr)中規(guī)定,未經(jīng)用戶同意擅自將各方數(shù)據(jù)集中到一處已經(jīng)被明令禁止,單方數(shù)據(jù)又很難滿足預(yù)測(cè)需求。故而,在大數(shù)據(jù)的背景下,如果能聯(lián)合多機(jī)構(gòu)在數(shù)據(jù)隱私保護(hù)的前提下進(jìn)行預(yù)測(cè)建模,將會(huì)大大提升預(yù)測(cè)任務(wù)的準(zhǔn)確度。
3、因此,亟需一種基于聯(lián)邦學(xué)習(xí)的高效航班延誤預(yù)測(cè)方法。
技術(shù)實(shí)現(xiàn)思路
1、為了解決集中式航班延誤預(yù)測(cè)建模中數(shù)據(jù)隱私泄露以及數(shù)據(jù)壁壘背景下導(dǎo)致預(yù)測(cè)準(zhǔn)確度不高的問(wèn)題,本專利技術(shù)實(shí)施例提供了一種基于聯(lián)邦學(xué)習(xí)的高效航班延誤預(yù)測(cè)方法和裝置。
2、第一方面,本專利技術(shù)實(shí)施例提供了一種基于聯(lián)邦學(xué)習(xí)的高效航班延誤預(yù)測(cè)方法,包括:
3、確定用于聯(lián)邦學(xué)習(xí)的被動(dòng)方和多個(gè)主動(dòng)方,并分別對(duì)所述被動(dòng)方和多個(gè)主動(dòng)方的原始航班數(shù)據(jù)進(jìn)行預(yù)處理和
4、對(duì)所述被動(dòng)方和多個(gè)主動(dòng)方的初始訓(xùn)練集進(jìn)行加密實(shí)體對(duì)齊,以在隱私保護(hù)的前提下,確定各方共有的實(shí)體數(shù)據(jù);
5、基于聯(lián)邦學(xué)習(xí)框架,利用各方共有的實(shí)體數(shù)據(jù)協(xié)同訓(xùn)練得到符合預(yù)期的航班延誤預(yù)測(cè)模型。
6、第二方面,本專利技術(shù)實(shí)施例還提供了一種基于聯(lián)邦學(xué)習(xí)的高效航班延誤預(yù)測(cè)裝置,包括:
7、預(yù)處理模塊,用于確定用于聯(lián)邦學(xué)習(xí)的被動(dòng)方和多個(gè)主動(dòng)方,并分別對(duì)所述被動(dòng)方和多個(gè)主動(dòng)方的原始航班數(shù)據(jù)進(jìn)行預(yù)處理和特征提取,以使所述被動(dòng)方和每一個(gè)主動(dòng)方生成各自的初始訓(xùn)練集;其中,所述被動(dòng)方為航空公司,且所述被動(dòng)方的初始訓(xùn)練集中各序列樣本不含有標(biāo)簽,所述主動(dòng)方為機(jī)場(chǎng),且各所述主動(dòng)方的初始訓(xùn)練集中各序列樣本含有標(biāo)簽;
8、實(shí)體對(duì)齊模塊,用于對(duì)所述被動(dòng)方和多個(gè)主動(dòng)方的初始訓(xùn)練集進(jìn)行加密實(shí)體對(duì)齊,以在隱私保護(hù)的前提下,確定各方共有的實(shí)體數(shù)據(jù);
9、模型訓(xùn)練模塊,用于基于聯(lián)邦學(xué)習(xí)框架,利用各方共有的實(shí)體數(shù)據(jù)協(xié)同訓(xùn)練得到符合預(yù)期的航班延誤預(yù)測(cè)模型。
10、第三方面,本專利技術(shù)實(shí)施例還提供了一種計(jì)算設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí),實(shí)現(xiàn)本說(shuō)明書任一實(shí)施例所述的方法。
11、第四方面,本專利技術(shù)實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)中執(zhí)行時(shí),令計(jì)算機(jī)執(zhí)行本說(shuō)明書任一實(shí)施例所述的方法。
12、本專利技術(shù)實(shí)施例提供了一種基于聯(lián)邦學(xué)習(xí)的高效航班延誤預(yù)測(cè)方法和裝置,通過(guò)對(duì)用于聯(lián)邦學(xué)習(xí)的被動(dòng)方和多個(gè)主動(dòng)方的原始航班數(shù)據(jù)進(jìn)行預(yù)處理和加密實(shí)體對(duì)齊來(lái)解決多機(jī)構(gòu)數(shù)據(jù)異構(gòu)的問(wèn)題;聯(lián)合多機(jī)構(gòu)部署多客戶端的預(yù)測(cè)算法,將具有隱私保護(hù)功能的聯(lián)邦學(xué)習(xí)框架與預(yù)測(cè)算法結(jié)合引入航班延誤預(yù)測(cè)場(chǎng)景中,取消不安全的第三方,可以防止各個(gè)機(jī)構(gòu)的本地隱私數(shù)據(jù)泄露,相較于傳統(tǒng)集中式模型,可以大大提高隱私性。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于聯(lián)邦學(xué)習(xí)的高效航班延誤預(yù)測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分別對(duì)所述被動(dòng)方和多個(gè)主動(dòng)方的原始航班數(shù)據(jù)進(jìn)行預(yù)處理和特征提取,以使所述被動(dòng)方和每一個(gè)主動(dòng)方生成各自的初始訓(xùn)練集,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述原始航班數(shù)據(jù)至少包括出發(fā)機(jī)場(chǎng)、目的機(jī)場(chǎng)、出發(fā)機(jī)場(chǎng)的天氣情況、目的機(jī)場(chǎng)的天氣情況、出發(fā)時(shí)間、到達(dá)時(shí)間、出發(fā)延誤和到港延誤。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述被動(dòng)方和多個(gè)主動(dòng)方的初始訓(xùn)練集進(jìn)行加密實(shí)體對(duì)齊,以在隱私保護(hù)的前提下,確定各方共有的實(shí)體數(shù)據(jù),包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述航班延誤預(yù)測(cè)模型為極致梯度提升模型。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于聯(lián)邦學(xué)習(xí)框架,利用各方共有的實(shí)體數(shù)據(jù)協(xié)同訓(xùn)練得到符合預(yù)期的航班延誤預(yù)測(cè)模型,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,當(dāng)前節(jié)點(diǎn)分裂后每個(gè)子節(jié)點(diǎn)的信息增益計(jì)算結(jié)果是通過(guò)如下方式計(jì)算的:
8.一種基于聯(lián)邦學(xué)習(xí)的高效航班
9.一種計(jì)算設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí),實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)中執(zhí)行時(shí),令計(jì)算機(jī)執(zhí)行權(quán)利要求1-7中任一項(xiàng)所述的方法。
...【技術(shù)特征摘要】
1.一種基于聯(lián)邦學(xué)習(xí)的高效航班延誤預(yù)測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分別對(duì)所述被動(dòng)方和多個(gè)主動(dòng)方的原始航班數(shù)據(jù)進(jìn)行預(yù)處理和特征提取,以使所述被動(dòng)方和每一個(gè)主動(dòng)方生成各自的初始訓(xùn)練集,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述原始航班數(shù)據(jù)至少包括出發(fā)機(jī)場(chǎng)、目的機(jī)場(chǎng)、出發(fā)機(jī)場(chǎng)的天氣情況、目的機(jī)場(chǎng)的天氣情況、出發(fā)時(shí)間、到達(dá)時(shí)間、出發(fā)延誤和到港延誤。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述被動(dòng)方和多個(gè)主動(dòng)方的初始訓(xùn)練集進(jìn)行加密實(shí)體對(duì)齊,以在隱私保護(hù)的前提下,確定各方共有的實(shí)體數(shù)據(jù),包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述航班延誤預(yù)測(cè)模型...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張秋杰,王梓權(quán),張子愷,翟佳,
申請(qǐng)(專利權(quán))人:北京環(huán)境特性研究所,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。