System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開一般涉及計算機,尤其涉及一種基于生物信息數據的生物信息模型訓練方法和裝置。
技術介紹
1、隨著互聯網技術的不斷進步和發展,各個領域(例如生物信息領域,金融領域等)均通過互聯網技術得到了效率上的大幅度提升,數據分析的效率也相應的得到大幅度提升。
2、數據分析技術往往可以通過基于網絡的學習模型進行分析,不同領域使用不同的學習模型。以生物信息領域為例,生物信息學習模型為通過大量生物信息數據訓練得到的,在經過大量生物信息數據訓練,得到收斂的生物信息學習模型即可用于實際應用中的數據分析。在相關技術中,生物信息學習模型的訓練方式往往是通過一個中心服務器向多個具有原始數據的用戶下發,由多個用戶利用自身原始數據訓練后,發送至中心服務器,最終生成可以使用的生物信息學習模型。
3、然而,在這個過程中,由于上述生物信息學習模型訓練過程對網絡通信較高,因此,該訓練過程在通信資源較為局限的情況下,則會生成訓練瓶頸,無法得到最佳訓練效果以及數據解析能力較強的生物信息學習模型。
技術實現思路
1、鑒于相關技術中的上述缺陷或不足,期望提供一種基于生物信息數據的生物信息模型訓練方法和裝置,能夠解決相關技術中由于上述學習模型訓練過程對網絡通信較高,因此,該訓練過程在通信資源較為局限的情況下,則會生成訓練瓶頸,無法得到最佳訓練效果以及數據解析能力較強的學習模型的問題,可以大幅提高訓練效率,并且降低訓練過程所需要的通信資源。
2、第一方面,提供了一種基于生物信息數據的生物信息模型
3、通過用戶集合中第一用戶的第一數據集對初始生物信息模型進行訓練,生成第一生物信息模型,所述第一數據集為所述第一用戶的本地數據,所述第一用戶的本地數據包括第一生物信息數據;
4、篩選用戶集合中的第二用戶,所述第一用戶和第二用戶為所述用戶集合中的不同用戶;
5、通過所述第二用戶的第二數據集對所述第一生物信息模型進行訓練,生成第二生物信息模型,并獲取所述第二生物信息模型的收斂值,所述第二數據集為所述第二用戶的本地數據,所述第二用戶的本地數據包括第二生物信息數據;
6、在第二生物信息模型的收斂值小于第一預設閾值的情況下,確認第二生物信息模型為目標生物信息模型,所述目標生物信息模型為訓練完成的模型。
7、本申請中,通過用戶集合中第一用戶的本地數據,也即第一數據集對初始生物信息模型進行訓練,生成第一生物信息模型;之后,篩選用戶集合中與第一用戶不同的第二用戶,并通過第二用戶的本地數據,也即第二數據集對第一生物信息模型進行訓練,生產第二生物信息模型,并獲取第二生物信息模型的收斂值;最后,在第二生物信息模型的收斂值小于第一預設閾值的情況下,確認第二生物信息模型為訓練完成的目標生物信息模型。如此,在本申請訓練模型的過程中,通過對篩選用戶依次對模型進行訓練,一方面避免了統一下方初始生物信息模型等待各個節點用戶訓練完成后統一收集、聚合過程中通信帶寬不夠造成的收集困難的情形,另一方面也避免了在統一收集的過程中需要等待全部節點用戶均訓練完成后才反饋模型進而導致的效率較低的問題,在本申請的方法中,采用隨機篩選節點用戶以及通過不同的節點用戶依次訓練的方式訓練模型,在訓練至任意節點用戶后,該節點用戶的訓練模型可以收斂的情況下,即可將該節點用戶的模型確定為目標生物信息模型,從而節省了發送模型過程對通信帶寬的需求,并且大幅度提升訓練效率。
8、第二方面,提供了一種基于生物信息數據的生物信息模型訓練裝置,該裝置包括:
9、訓練模塊,用于通過用戶集合中第一用戶的第一數據集對初始生物信息模型進行訓練,生成第一生物信息模型,所述第一數據集為所述第一用戶的本地數據,所述第一用戶的本地數據包括第一生物信息數據;
10、篩選模塊,用于篩選用戶集合中的第二用戶,所述第一用戶和第二用戶為所述用戶集合中的不同用戶;
11、所述訓練模塊,還用于通過所述第二用戶的第二數據集對所述第一生物信息模型進行訓練,生成第二生物信息模型,并獲取所述第二生物信息模型的收斂值,所述第二數據集為所述第二用戶的本地數據,所述第二用戶的本地數據包括第二生物信息數據;
12、執行模塊,用于在第二生物信息模型的收斂值小于第一預設閾值的情況下,確認第二生物信息模型為目標生物信息模型,所述目標生物信息模型為訓練完成的模型。
13、第三方面,提供了一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,處理器執行程序時,實現上述第一方面所述的方法。
14、第四方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現上述第一方面所述的方法。
15、第五方面,提供了一種計算機程序產品,計算機程序產品中包含指令,該指令被處理器運行時實現上述第一方面所述的方法。
16、本專利技術附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本專利技術的實踐了解到。
本文檔來自技高網...【技術保護點】
1.一種基于生物信息數據的生物信息模型訓練方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述通過用戶集合中第一用戶的第一數據集對初始生物信息模型進行訓練,生成第一生物信息模型,包括:
3.根據權利要求2所述的方法,其特征在于,所述根據所述目標訓練結果,更新所述初始生物信息模型,生成第一生物信息模型,包括:
4.根據權利要求1所述的方法,其特征在于,通過所述第二用戶的第二數據集對所述第一生物信息模型進行訓練,生成第二生物信息模型,并獲取所述第二生物信息模型的收斂值,包括:
5.根據權利要求4所述的方法,其特征在于,所述根據所述目標訓練結果、當前隨機梯度以及當前散度,更新所述第一生物信息模型,生成第二生物信息模型之前,所述方法還包括:
6.根據權利要求4所述的方法,其特征在于,所述根據所述目標訓練結果、當前隨機梯度以及當前散度,更新所述第一生物信息模型,生成第二生物信息模型,包括:
7.根據權利要求4所述的方法,其特征在于,所述根據所述目標訓練結果和當前隨機梯度,更新所述第一生物信息模型,生
8.根據權利要求1所述的方法,其特征在于,所述篩選用戶集合中的第二用戶,包括:
9.根據權利要求8所述的方法,其特征在于,所述根據所述相鄰用戶發送第一響應信息的發送時長和所述相鄰用戶的當前用戶狀態參數,確認相鄰用戶中的目標用戶作為第二用戶,包括:
10.一種基于生物信息數據的生物信息模型訓練裝置,其特征在于,包括:
11.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時,實現如權利要求1-9任一項所述的方法。
12.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-9中任一項所述的方法。
13.一種計算機程序產品,所述計算機程序產品中包含指令,其特征在于,所述指令被處理器運行時實現如權利要求1-9中任一所述的方法。
...【技術特征摘要】
1.一種基于生物信息數據的生物信息模型訓練方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述通過用戶集合中第一用戶的第一數據集對初始生物信息模型進行訓練,生成第一生物信息模型,包括:
3.根據權利要求2所述的方法,其特征在于,所述根據所述目標訓練結果,更新所述初始生物信息模型,生成第一生物信息模型,包括:
4.根據權利要求1所述的方法,其特征在于,通過所述第二用戶的第二數據集對所述第一生物信息模型進行訓練,生成第二生物信息模型,并獲取所述第二生物信息模型的收斂值,包括:
5.根據權利要求4所述的方法,其特征在于,所述根據所述目標訓練結果、當前隨機梯度以及當前散度,更新所述第一生物信息模型,生成第二生物信息模型之前,所述方法還包括:
6.根據權利要求4所述的方法,其特征在于,所述根據所述目標訓練結果、當前隨機梯度以及當前散度,更新所述第一生物信息模型,生成第二生物信息模型,包括:
7.根據權利要求4所述的方法,其...
【專利技術屬性】
技術研發人員:姜明明,徐洪麗,李上,烏日力格,劉俞奇,劉洋,劉英華,
申請(專利權)人:中國人民解放軍總醫院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。