System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及計算醫學中的多模態領域,尤指一種慢性腎臟疾病進展預測方法、裝置、存儲介質、計算機程序產品。
技術介紹
1、現有的慢性腎臟病進展預測技術主要包括于電子病歷數據的臨床模型、應用機器學習算法的簡單模型、利用多模態數據的擴展模型等幾類方法。
2、其中:在基于電子病歷數據的臨床模型的預測方法中,許多模型利用電子病歷中記錄的臨床指標來預測慢性腎臟疾病的進展。預測模型中最常見的預測因子是年齡、性別、體重指數、糖尿病狀態、收縮壓、血清肌酐、蛋白尿的測量以及血清白蛋白或總蛋白。該類技術多由臨床應用轉化而來,為便于現實場景使用,通常遵從數據易獲得與適用范圍廣兩大原則。但由于這類方法是臨床經驗的總結,這也導致方法選用的指標少,難以發現新的知識,導致對新的癥狀預測精度差。
3、在應用機器學習算法的簡單模型的預測方法中,其運用機器學習算法來處理范圍更廣、數量更多的變量,增強了對結構化數據和分類問題的分析能力,一定程度提高了疾病預測準確率。但該類技術的限制主要來源于模型自身,包括:難以利用大規模數據、簡單結構難以捕捉數據中復雜的非線性關系、手動特征工程復雜且容易忽略未知的重要特征,同樣存在對新的癥狀預測精度差的缺陷。
4、在利用多模態數據的擴展模型的預測方法中,通過挖掘其他模態數據(例如診療過程中重要的組學數據、圖像數據)對預測準確性的影響,以提高疾病預測準確性。但現有利用多模態數據的擴展模型的預測方法的缺點在于擴充新的臨床標志物需要大量濕實驗,每種模式的數據分析和利用都是獨立的,沒有注意到模式之間的互補信
5、因此,有必要在上述預測方法的基礎上加以改進。
技術實現思路
1、針對現有技術的不足,本專利技術提出一種慢性腎臟疾病進展預測方法、裝置、存儲介質、計算機程序產品。
2、其中:本專利技術一方面提供一種慢性腎臟疾病進展預測方法,包含:
3、收集關于慢性腎臟疾病的多模態數據,包括個體尺度的臨床數據、分子尺度的蛋白質組學數據與代謝組學數據、細胞組織尺度的數字病理圖像;其中所述臨床數據、蛋白質組數據、代謝組數據屬于表格數據,所述細胞組織尺度的數字病理圖像屬于圖像數據;將所述多模態數據輸入至構建的預測模型中進行訓練,該預測模型包含表格特征提取器、圖像特征提取器、多模態融合分類器;其中:識別每一模態數據的類別,若識別屬于表格數據,通過所述表格特征提取器對該模態數據進行特征聚合并編碼為多個一維特征向量,且將該多個一維特征向量整合為表格數據代表向量;若識別屬于圖像數據,通過所述圖像特征提取器對該模態數據整圖進行訓練,整合得到圖像代表向量;通過所述多模態融合分類器對所有所述表格數據代表向量與所有所述圖像代表向量進行拼接融合后進行分類預測。
4、在本專利技術一些實施例中,每一所述表格特征提取器包含映射編碼層、輔助訓練層、全連接特征提取層;通過所述映射編碼層將對應的該模態數據包含的特征依次進行分桶處理,統一數據的取值范圍,再將每個特征都編碼為一個一維特征向量;通過所述輔助訓練層更新優化每一一維特征向量;通過所述全連接特征提取層的多個隱藏層將該多個一維特征向量整合為該表格數據代表向量。
5、在本專利技術一些實施例中,所述映射編碼層采用哈希方程將對應的該模態數據的原始數據類型映射到多個類別,以統一數據的取值范圍。
6、在本專利技術一些實施例中,于通過所述輔助訓練層更新每一一維特征向量過程中,其中:對每一一維特征向量延長每一一維特征向量代表向量使其包含更多信息,并進行梯度回傳,訓練每一一維特征向量使其包含的信息與預測任務相符。
7、在本專利技術一些實施例中,所述圖像特征提取器采用resnet50模型為基礎架構,將resnet50模型最后兩層的聚合層與分類層替換為新的隱藏層,其他層保持不變。
8、在本專利技術一些實施例中,配置每一所述表格數據代表向量、每一所述圖像代表向量分別應用于預測的分類目標;所述多模態融合分類器由n層全連接神經網絡配合一門控網絡組成,其中所述門控網絡由m個全連接層組成,生成每一所述表格數據代表向量對應的第一權重、每一所述圖像代表向量對應的第二權重,且每一所述表格代表向量與自身對應的第一權重相乘,每一所述圖像代表向量與自身對應的第二權重相乘,再進行拼接;拼接后的特征進入所述n層全連接神經網絡進行分類預測;其中n和m均至少為2。
9、在本專利技術一些實施例中,使用五倍交叉驗證數據集訓練該預測模型。
10、在本專利技術一些實施例中,分析所述多模態數據中各模態數據的重要性,以及,分析在將所述多模態數據輸入至構建的預測模型中進行訓練過程中,每一階段取得的各個特征的重要性,篩選出關鍵特征,將該關鍵特征初步識別為預測標志物。在本專利技術一些實施例中,所述表格特征提取器包含映射編碼層、輔助訓練層、全連接特征提取層;其中:通過所述映射編碼層對各個表格數據包含的特征依次進行分桶處理,統一數據的取值范圍,再將每個特征都編碼為一個一維特征向量;通過所述輔助訓練層更新優化每一一維特征向量;通過所述全連接特征提取層的多個隱藏層將該多個一維特征向量整合為該表格數據代表向量。
11、以及,本專利技術再一方面提供一種慢性腎臟疾病進展預測裝置,該裝置包含:
12、數據集獲取單元,用以收集關于慢性腎臟疾病的多模態數據,包括個體尺度的臨床數據、分子尺度的蛋白質組學數據與代謝組學數據、細胞組織尺度的數字病理圖像;其中所述臨床數據、蛋白質組數據、代謝組數據屬于表格數據,所述細胞組織尺度的數字病理圖像屬于圖像數據;
13、模型訓練與預測單元,用以將所述多模態數據輸入至構建的預測模型中進行訓練,該預測模型包含表格特征提取器、圖像特征提取器、多模態融合分類器;其中:所述模型訓練與預測單元進一步包含:
14、編碼模塊,用以對識別為表格數據的模態數據通過所述表格特征提取器進行特征聚合并編碼為多個一維特征向量,且將該多個一維特征向量整合為該表格數據代表向量;以及,對識別為圖像數據的模態數據通過所述圖像特征提取器對整圖進行訓練,整合得到圖像代表向量;
15、分類模塊,用以通過所述多模態融合分類器對所有所述表格數據代表向量與所有所述圖像代表向量進行拼接融合后進行分類預測。
16、在本專利技術一些實施例中,每一所述表格特征提取器包含映射編碼層、輔助訓練層、全連接特征提取層;其中,所述映射編碼層用以將對應的該模態數據包含的特征依次進行分桶處理,統一數據的取值范圍,再將每個特征都編碼為一個一維特征向量;所述輔助訓練層與所述映射編碼層輸出端連接,用以更新優化每一一維特征向量;全連接特征提取層,與所述輔助訓練層輸出端連接,用以通過所述全連接特征提取層的多個隱藏層將該多個一維特征向量整合為該表格數據代表向量。
17、本專利技術又一方面還提供一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現上述的慢性腎臟疾病進展預測方法的步驟。
18、本專利技術又一方面還提供一種計算機程序產品,所本文檔來自技高網...
【技術保護點】
1.一種慢性腎臟疾病進展預測方法,其特征在于,包含:
2.根據權利要求1所述的方法,其特征在于,
3.根據權利要求2所述的方法,其特征在于,
4.根據權利要求2所述的方法,其特征在于,
5.根據權利要求1所述的方法,其特征在于,
6.根據權利要求1所述的方法,其特征在于,
7.根據權利要求1所述的方法,其特征在于,還包含:
8.根據權利要求1所述的方法,其特征在于,還包含:
9.一種慢性腎臟疾病進展預測裝置,其特征在于,包含:
10.根據權利要求9所述的裝置,其特征在于,包含:
11.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該計算機程序被處理器執行時實現權利要求1-8中任一所述方法的步驟。
12.一種計算機程序產品,所述計算機程序產品包括計算機程序,其特征在于,該計算機程序被處理器執行時實現權利要求1-8中任一所述方法的步驟。
【技術特征摘要】
1.一種慢性腎臟疾病進展預測方法,其特征在于,包含:
2.根據權利要求1所述的方法,其特征在于,
3.根據權利要求2所述的方法,其特征在于,
4.根據權利要求2所述的方法,其特征在于,
5.根據權利要求1所述的方法,其特征在于,
6.根據權利要求1所述的方法,其特征在于,
7.根據權利要求1所述的方法,其特征在于,還包含:
8.根據權利要求1所述的方法,其特...
【專利技術屬性】
技術研發人員:喬藝璇,趙屹,趙連鶴,吳楊,
申請(專利權)人:中國科學院計算技術研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。