System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開一般涉及計算機,尤其涉及一種基于生物信息數據的數據處理方法、系統、設備和介質。
技術介紹
1、隨著通信技術和計算機技術的不斷發展,通過訓練模型幫助用戶處理數據已經成為了非常常見的技術手段,在各個領域均有應用,例如金融領域以及生物信息領域。
2、學習訓練模型的方式多種多樣,其中多節點聯邦學習是非常常見的一種學習訓練模型的方式。在相關技術中,若在生物信息領域中,假設需要學習訓練的生物信息數據分布在多個節點中,且涉及隱私保護,即可以通過聯邦學習的學習訓練方式,將初始模型下由發送方(例如中心服務器)發至各個學習節點,由各個學習節點利用本地生物信息數據對初始模型進行訓練,訓練完成后得到訓練模型,并將訓練模型發送回發送方,由發送方再將各個節點的訓練模型通過收斂器收斂。如此,各節點無需輸出自身數據,即可完成學習訓練。
3、然而,在上述學習訓練的過程中,在對各個節點的訓練模型進行收斂形成聚合模型的過程中,會根據為各個節點的訓練模型使用的生物信息數據的數據量大小考慮模型貢獻度,進而在聚合過程中為各個訓練模型的權重占比進行劃分,然而這種劃分方式往往較為簡單粗暴,并不能夠體現數據的實際貢獻情況。
技術實現思路
1、鑒于相關技術中的上述缺陷或不足,期望提供一種基于生物信息數據的數據處理方法、系統、設備和介質,能夠解決聚合過程中為各個訓練模型的權重占比進行劃分,然而這種劃分方式往往較為簡單粗暴,并不能夠體現數據的實際貢獻情況的問題,在一定程度上通過提升數據貢獻和力度進而提高模型
2、第一方面,提供了一種數據處理方法,該方法包括:
3、在通過多個用戶中的每個用戶通過本地數據針對初始生物信息模型進行訓練,生成第一生物信息訓練模型的情況下,獲取所述每個用戶的本地數據的第一數據特征信息和每個用戶的第一生物信息訓練模型,所述第一數據特征信息用于指示所述每個用戶對應的用戶節點特征信息,所述本地數據為包括生物信息的數據;
4、根據所述第一數據特征信息,通過預設深度網絡模型確定所述多個用戶中每個用戶對應的第一生物信息訓練模型的第一貢獻度配比,并根據所述第一貢獻度配比對所述多個第一生物信息訓練模型進行聚合,生成第一生物信息聚合模型。
5、本申請中,在多個用戶中的每個用戶通過本地數據針對初始生物信息模型進行訓練,生成第一生物信息訓練模型的情況下,獲取每個用戶的本地數據的第一數據特征信息和每個用戶的第一生物信息訓練模型(第一數據特征信息用于指示每個用戶對應的用戶節點特征信息);然后,根據第一數據特征信息,通過預設深度網絡模型確定多個用戶中每個用戶對應的第一生物信息訓練模型的第一貢獻度配比,并根據第一貢獻度配比對多個第一生物信息訓練模型進行聚合,生成第一生物信息聚合模型。如此,通過獲取到每個用戶的用戶節點的數據特征以及多個用戶節點之間的貢獻度配比,在最終聚合模型的過程中,根據多個用戶節點之間的貢獻度配比為每個用戶的第一生物信息訓練模型設置合適的聚合比例,從而使得最終聚合后的第一生物信息聚合模型相較于此前不確定貢獻度的聚合模型的合理性大幅提高,也大幅度提高了通過多個用戶節點訓練模型聚合得到所需要的投入使用的模型的訓練效率。
6、第二方面,提供了一種基于生物信息數據的數據處理系統,該系統包括:
7、獲取單元,用于在多個用戶中的每個用戶通過本地數據針對初始生物信息模型進行訓練,生成第一生物信息訓練模型的情況下,獲取所述每個用戶的本地數據的第一數據特征信息和每個用戶的第一生物信息訓練模型,所述第一數據特征信息用于指示所述每個用戶對應的用戶節點特征信息,所述本地數據為包括生物信息的數據;
8、執行單元,用于根據所述第一數據特征信息,通過預設深度網絡模型確定所述多個用戶中每個用戶對應的第一生物信息訓練模型的第一貢獻度配比,并根據所述第一貢獻度配比對所述多個第一生物信息訓練模型進行聚合,生成第一生物信息聚合模型。
9、第三方面,提供了一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,處理器執行程序時,實現上述第一方面所述的方法。
10、第四方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現上述第一方面所述的方法。
11、第五方面,提供了一種計算機程序產品,計算機程序產品中包含指令,該指令被處理器運行時實現上述第一方面所述的方法。
12、本專利技術附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本專利技術的實踐了解到。
本文檔來自技高網...【技術保護點】
1.一種基于生物信息數據的數據處理方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,在多個用戶中的每個用戶通過本地數據針對初始生物信息模型進行訓練,生成第一生物信息訓練模型的情況下,獲取所述每個用戶的本地數據的第一數據特征信息,包括:
3.根據權利要求1所述的方法,其特征在于,所述第一數據特征信息包括以下至少一種數據特征信息:第一數據質量特征信息,第一數據通信特征信息,第一參與頻率特征信息,第一用戶節點局部性能特征信息。
4.根據權利要求1所述的方法,其特征在于,在所述第一數據特征信息包括至少兩種數據特征信息的情況下,所述根據所述數據特征信息,確定所述多個用戶中每個用戶的第一貢獻度配比,包括:
5.根據權利要求1所述的方法,其特征在于,根據所述第一貢獻度配比對所述多個第一生物信息訓練模型進行聚合,生成第一生物信息聚合模型之后,所述方法還包括:
6.根據權利要求5所述的方法,其特征在于,在所述收斂值大于等于預定閾值的情況下,所述根據第一貢獻度配比對所述多個訓練模型進行聚合,生成第一生物信息聚合模型之后,所
7.根據權利要求1所述的方法,其特征在于,所述根據第一貢獻度配比對所述多個訓練模型進行聚合之后,所述方法還包括:
8.一種基于生物信息數據的數據處理系統,其特征在于,包括:
9.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時,實現如權利要求1-7任一項所述的方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-7中任一項所述的方法。
11.一種計算機程序產品,所述計算機程序產品中包含指令,其特征在于,所述指令被處理器運行時實現如權利要求1-7中任一所述的方法。
...【技術特征摘要】
1.一種基于生物信息數據的數據處理方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,在多個用戶中的每個用戶通過本地數據針對初始生物信息模型進行訓練,生成第一生物信息訓練模型的情況下,獲取所述每個用戶的本地數據的第一數據特征信息,包括:
3.根據權利要求1所述的方法,其特征在于,所述第一數據特征信息包括以下至少一種數據特征信息:第一數據質量特征信息,第一數據通信特征信息,第一參與頻率特征信息,第一用戶節點局部性能特征信息。
4.根據權利要求1所述的方法,其特征在于,在所述第一數據特征信息包括至少兩種數據特征信息的情況下,所述根據所述數據特征信息,確定所述多個用戶中每個用戶的第一貢獻度配比,包括:
5.根據權利要求1所述的方法,其特征在于,根據所述第一貢獻度配比對所述多個第一生物信息訓練模型進行聚合,生成第一生物信息聚合模型之后,所述方法還包括:
...
【專利技術屬性】
技術研發人員:何昆侖,姜明明,
申請(專利權)人:中國人民解放軍總醫院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。