System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及數據分類,具體而言,涉及一種基于聯邦蒸餾學習系統的多元時序數據分類方法及裝置。
技術介紹
1、時序數據,作為一種由時間序列記錄的、連續的、有序數據類型,在金融、醫療、交通、氣象等多個領域均扮演著至關重要的角色,時序數據的分類任務,旨在通過對一系列輸入數據的分析,準確地將這些數據歸類到預定義的類別中。隨著技術的進步和數據量的增加,時序數據分類的準確性和效率成為研究的熱點,常見的時序數據分類方法,如基于距離度量的方法、特征工程方法和深度學習方法,雖然在一定程度上滿足了分類需求,但在處理大規模、多維度且需要嚴格隱私保護的時序數據時,仍面臨諸多挑戰。
2、聯邦學習作為一種新興的分布式機器學習方法,為解決時序數據分類中的隱私保護和大規模數據處理問題提供了新的思路。通過允許多個客戶端協作訓練模型,而無需將數據集中到一個中心服務器上,聯邦學習有效保護了數據隱私,并提高了模型的泛化能力。然而,現有的聯邦學習方法在時序數據分類方面仍存在一些弊端,例如,現有的加權平均分類方法,雖然在聯邦學習領域取得了顯著成果,但假設所有客戶端的數據是獨立同分布的,這在現實世界中,尤其是時序數據領域,往往不成立,由于時序數據的異質性,該方法可能導致模型性能不佳。此外,隨著客戶端數量的增加,每一輪迭代都需要頻繁的模型參數傳輸,這不僅增加了通信成本,還可能影響模型的訓練速度和收斂性。
技術實現思路
1、本公開實施例至少提供一種基于聯邦蒸餾學習系統的多元時序數據分類方法及裝置,提高了多元時序數據分類的精
2、本公開實施例提供了一種基于聯邦蒸餾學習系統的多元時序數據分類方法,所述聯邦蒸餾學習系統包括一個服務器和多個客戶端,包括:
3、步驟1:所述服務器將預先構建初始時序數據分類模型以及蒸餾模型發送給所述多個客戶端中的每個客戶端;其中,所述服務器包括時序數據知識庫,所述時序數據知識庫包括一個關系目錄和一個知識隊列,所述關系目錄包括多個知識標簽向量組,所述知識標簽向量組包括與每個客戶端對應的數據子集序號、所述數據子集中的向量序號以及所述向量序號對應的知識標簽向量;所述知識隊列包括多個與所述知識標簽向量組對應的近鄰知識標簽向量集;每個所述知識標簽向量組包括一個知識標簽向量索引,所述知識標簽向量索引用于指向所述知識隊列中與所述知識標簽向量組對應的近鄰知識標簽向量集;
4、步驟2:所述每個客戶端將所述初始時序數據分類模型確定為所述客戶端對應的本地模型;并基于所述每個客戶端對應的本地模型分別對所述每個客戶端各自獲取的多元時序數據訓練集進行分類預測,得到與每個客戶端對應的多元時序分類數據預測標簽集;
5、步驟3:所述每個客戶端將各自得到的多元時序分類數據預測標簽集發送至所述服務器;針對所述每個客戶端對應的多元時序分類數據預測標簽集,基于所述服務器更新所述關系目錄中與所述多元時序分類數據預測標簽集中的各多元時序分類數據預測標簽對應的所述知識標簽向量組,并基于更新后的所述關系目錄更新所述知識隊列中所述知識標簽向量組的知識標簽向量索引指向的近鄰知識標簽向量集,并將更新后的所述知識隊列中與所述每個客戶端對應的近鄰知識標簽向量集分別發送給各個客戶端;
6、步驟4:所述每個客戶端對應的所述蒸餾模型對各自接收的所述近鄰知識標簽向量集進行知識蒸餾,并根據所述每個客戶端對應的知識蒸餾結果、所述每個客戶端對應的多元時序分類數據預測標簽集和預設損失函數,所述每個客戶端計算所述本地模型的本地模型損失值,若所述本地模型損失值大于預設損失閾值,則調整所述本地模型,并將調整后的本地模型作為所述步驟2中的本地模型,返回步驟2;否則,所述每個客戶端根據所述調整后的本地模型對采集的待分類時序數據集進行分類,得到所述待分類時序數據集的分類結果。
7、本公開實施例提供了一種基于聯邦蒸餾學習系統的多元時序數據分類裝置,所述聯邦蒸餾學習系統包括一個服務器和多個客戶端,包括:
8、模型分發模塊,用于執行步驟1:所述服務器將預先構建初始時序數據分類模型以及蒸餾模型發送給所述多個客戶端中的每個客戶端;其中,所述服務器包括時序數據知識庫,所述時序數據知識庫包括一個關系目錄和一個知識隊列,所述關系目錄包括多個知識標簽向量組,所述知識標簽向量組包括與每個客戶端對應的數據子集序號、所述數據子集中的向量序號以及所述向量序號對應的知識標簽向量;所述知識隊列包括多個與所述知識標簽向量組對應的近鄰知識標簽向量集;每個所述知識標簽向量組包括一個知識標簽向量索引,所述知識標簽向量索引用于指向所述知識隊列中與所述知識標簽向量組對應的近鄰知識標簽向量集;
9、數據分類模塊,用于執行步驟2:所述每個客戶端將所述初始時序數據分類模型確定為所述客戶端對應的本地模型;并基于所述每個客戶端對應的本地模型分別對所述每個客戶端各自獲取的多元時序數據訓練集進行分類預測,得到與每個客戶端對應的多元時序分類數據預測標簽集;
10、數據更新模塊,用于執行步驟3:所述每個客戶端將各自得到的多元時序分類數據預測標簽集發送至所述服務器;針對所述每個客戶端對應的多元時序分類數據預測標簽集,基于所述服務器更新所述關系目錄中與所述多元時序分類數據預測標簽集中的各多元時序分類數據預測標簽對應的所述知識標簽向量組,并基于更新后的所述關系目錄更新所述知識隊列中所述知識標簽向量組的知識標簽向量索引指向的近鄰知識標簽向量集,并將更新后的所述知識隊列中與所述每個客戶端對應的近鄰知識標簽向量集分別發送給各個客戶端;
11、損失計算模塊,用于執行步驟4:所述每個客戶端對應的所述蒸餾模型對各自接收的所述近鄰知識標簽向量集進行知識蒸餾,并根據所述每個客戶端對應的知識蒸餾結果、所述每個客戶端對應的多元時序分類數據預測標簽集和預設損失函數,所述每個客戶端計算所述本地模型的本地模型損失值,若所述本地模型損失值大于預設損失閾值,則調整所述本地模型,并將調整后的本地模型作為所述步驟2中的本地模型,返回步驟2;否則,所述每個客戶端根據所述調整后的本地模型對采集的待分類時序數據集進行分類,得到所述待分類時序數據集的分類結果。
12、本公開實施例提供了一種計算機設備,包括:處理器、存儲器和總線,所述存儲器存儲有所述處理器可執行的機器可讀指令,當計算機設備運行時,所述處理器與所述存儲器之間通過總線通信,所述機器可讀指令被所述處理器執行時執行如上述任一可能的實施方式中所述的基于聯邦蒸餾學習系統的多元時序數據分類方法。
13、本公開實施例提供了一種計算機可讀存儲介質,該計算機可讀存儲介質上存儲有計算機程序,該計算機程本文檔來自技高網...
【技術保護點】
1.一種基于聯邦蒸餾學習系統的多元時序數據分類方法,所述聯邦蒸餾學習系統包括一個服務器和多個客戶端,其特征在于,所述多元時序數據分類方法包括:
2.根據權利要求1所述的方法,其特征在于,所述服務器將預先構建初始時序數據分類模型以及蒸餾模型發送給所述多個客戶端中的每個客戶端,還包括:
3.根據權利要求2所述的方法,其特征在于,所述每個客戶端將所述數據子集上傳至所述服務器的所述時序數據庫的關系目錄之后,包括:
4.根據權利要求2所述的方法,其特征在于,所述多元時序分類數據預測標簽集包括多個多元時序分類數據預測標簽,所述針對所述每個客戶端對應的多元時序分類數據預測標簽集,基于所述服務器更新所述關系目錄中與所述多元時序分類數據預測標簽集中的各多元時序分類數據預測標簽對應的所述知識標簽向量組,包括:
5.根據權利要求1所述的方法,其特征在于,所述預設損失函數包括交叉熵損失函數和蒸餾損失函數,所述根據所述每個客戶端對應的知識蒸餾結果、所述每個客戶端對應的多元時序分類數據預測標簽集和預設損失函數,所述每個客戶端計算所述本地模型的本地模型損失值,包
6.根據權利要求5所述的方法,其特征在于,
7.根據權利要求1所述的方法,其特征在于,所述每個客戶端計算所述本地模型的本地模型損失值之后,還包括:
8.一種基于聯邦蒸餾學習系統的多元時序數據分類裝置,所述聯邦蒸餾學習系統包括一個服務器和多個客戶端,其特征在于,包括:
9.一種存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述的方法。
10.一種計算機設備,包括存儲介質、處理器及存儲在存儲介質上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至7中任一項所述的方法。
...【技術特征摘要】
1.一種基于聯邦蒸餾學習系統的多元時序數據分類方法,所述聯邦蒸餾學習系統包括一個服務器和多個客戶端,其特征在于,所述多元時序數據分類方法包括:
2.根據權利要求1所述的方法,其特征在于,所述服務器將預先構建初始時序數據分類模型以及蒸餾模型發送給所述多個客戶端中的每個客戶端,還包括:
3.根據權利要求2所述的方法,其特征在于,所述每個客戶端將所述數據子集上傳至所述服務器的所述時序數據庫的關系目錄之后,包括:
4.根據權利要求2所述的方法,其特征在于,所述多元時序分類數據預測標簽集包括多個多元時序分類數據預測標簽,所述針對所述每個客戶端對應的多元時序分類數據預測標簽集,基于所述服務器更新所述關系目錄中與所述多元時序分類數據預測標簽集中的各多元時序分類數據預測標簽對應的所述知識標簽向量組,包括:
5.根據權利要求1所述的方法,其特征在于,所述預設損失函數包括...
【專利技術屬性】
技術研發人員:何珍文,肖尊揚,蔣恕,龔斌,王強強,李浩,劉顯珍,張馳,何鑫,陳果,楊旭東,
申請(專利權)人:中國地質大學武漢,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。