System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本專利技術涉及深度學習,特別涉及一種基于深度學習模型的基因序列預測方法及相關設備。
技術介紹
1、隨著信息技術的快速發(fā)展和在生物醫(yī)學領域的深度應用,產生了多維度、多模態(tài)、異構、海量的大數據,其應用給生物醫(yī)學的研究帶來了深刻變革,對精準醫(yī)療發(fā)展有著重要的促進作用。
2、但是,目前已有的基于神經網絡的基因序列預測基因表達模型不是僅針對基因之間非線性關聯(lián)建模,就是僅考慮線性可加關聯(lián),同時,針對基因snp(snp:singlenucleotidepolymorphism,它指的是單核苷酸的變異或者說多態(tài)性)數據的稀疏性問題也沒有給出一個確切的解決方案,而多組織信息以及專家先驗信息也沒有有效的方法融合進入預測模型中。
3、因而現(xiàn)有技術還有待改進和提高。
技術實現(xiàn)思路
1、本專利技術的主要目的在于提供一種基于深度學習模型的基因序列預測方法及相關設備,旨在解決現(xiàn)有技術中基于神經網絡的基因序列預測基因表達模型僅針對基因之間非線性關聯(lián)建模,僅考慮線性可加關聯(lián),無法實現(xiàn)對基因序列進行精準預測的問題。
2、為了達到上述目的,本專利技術采取了以下技術方案:
3、一種基于深度學習模型的基因序列預測方法,所述基于深度學習模型的基因序列預測方法包括:
4、構建非線性深度學習模型,并獲取預測數據和原始數據;
5、利用所述預測數據和所述原始數據對所述非線性深度學習模型進行預測,得到預測值;
6、根據所述預測數據和所述原始數據,計算所
7、根據所述預測值計算得到當前任務的目標損失函數后,根據所述懲罰值構建得到多元素損失函數,并計算得到所述非線性深度學習模型的損失值;
8、根據所述損失值,利用優(yōu)化器優(yōu)化所述非線性深度學習模型,并利用經過優(yōu)化后的非線性深度學習模型對所述預測數據中的待檢測基因序列進行預測,得到基因預測檢測結果。
9、所述基于深度學習模型的基因序列預測方法中,所述基于深度學習模型的基因序列預測方法還包括:
10、利用所述目標損失函數對所述非線性深度學習模型進行評估,得到評估結果。
11、所述基于深度學習模型的基因序列預測方法中,所述構建非線性深度學習模型,并獲取預測數據和原始數據,具體包括:
12、構建基因插補體系結構,并從cadd數據庫中獲取原始cadd分數;
13、其中,所述非線性深度學習模型為所述基因插補體系結構,所述基因插補體系結構包括:特征控制門塊、線性塊、非線性塊、先驗知識融合塊和多任務模塊;
14、從基因型和基因表達量關聯(lián)數據庫獲取預設第一數量的組織表達;
15、根據所述組織表達構建次要任務的聯(lián)合組織表達標簽;
16、利用激活函數將所述原始cadd分數進行標準化,得到先驗知識數據。
17、所述基于深度學習模型的基因序列預測方法中,所述利用所述預測數據和所述原始數據對所述非線性深度學習模型進行預測,得到預測值,具體包括:
18、分別由任一個所述組織表達和次要任務的聯(lián)合組織表達標簽構成原始基因矩陣后,利用所述特征控制門塊根據回歸分析方法,對所述原始基因矩陣中的原始基因序列進行分別過濾,得到衡量指標;其中,所述衡量指標為p值;
19、對經過過濾后的原始基因序列進行分別排序,得到經過排序后的原始基因序列,并將大于預設閾值的原始基因序列進行分別篩選,得到經過篩選后的原始基因序列;
20、對所述經過篩選后的原始基因序列進行合并后縮放,并利用所述非線性塊對經過縮放后的原始基因序列進行計算,得到非線性塊輸出值;
21、利用所述特征控制門塊對所述非線性塊輸出值進行自動學習,并輸入到所述多任務模塊中,得到所述預測值。
22、所述基于深度學習模型的基因序列預測方法中,所述根據所述預測數據和所述原始數據,計算所述非線性深度學習模型的懲罰值,具體包括:
23、將所述先驗知識數據和所述原始cadd分數加入到所述線性塊的權重中,并利用歸一化處理計算得到所述懲罰值。
24、所述基于深度學習模型的基因序列預測方法中,所述根據所述預測值計算得到當前任務的目標損失函數后,根據所述懲罰值構建得到多元素損失函數,并計算得到所述非線性深度學習模型的損失值,具體包括:
25、計算當前任務的所述預測值的均方誤差,得到所述目標損失函數;
26、根據所述懲罰值和所述目標損失函數構建所述多元素損失函數后,求解所述多元素損失函數得到所述損失值。
27、所述基于深度學習模型的基因序列預測方法中,所述原始數據包括基因型和基因表達量關聯(lián)數據庫,以及原始cadd分數;所述預測數據包括多組織輔助任務數據和先驗知識數據;所述多組織輔助任務數據包括所述次要任務的聯(lián)合組織表達標簽。
28、一種基于深度學習模型的基因序列預測系統(tǒng),所述基于深度學習模型的基因序列預測系統(tǒng)包括:
29、模型構建和數據獲取模塊,用于構建非線性深度學習模型,并獲取預測數據和原始數據;
30、預測值獲取模塊,用于利用所述預測數據和所述原始數據對所述非線性深度學習模型進行預測,得到預測值;
31、懲罰值計算模塊,用于根據所述預測數據和所述原始數據,計算所述非線性深度學習模型的懲罰值;
32、損失值計算模塊,用于根據所述預測值計算得到當前任務的目標損失函數后,根據所述懲罰值構建得到多元素損失函數,并計算得到所述非線性深度學習模型的損失值;
33、基因預測結果檢測模塊,用于根據所述損失值,利用優(yōu)化器優(yōu)化所述非線性深度學習模型,并利用經過優(yōu)化后的非線性深度學習模型對所述預測數據中的待檢測基因序列進行預測,得到基因預測檢測結果。
34、一種控制器,所述控制器包括:存儲器、處理器、顯示器及存儲在所述存儲器上并可在所述處理器上運行的基于深度學習模型的基因序列預測程序,所述基于深度學習模型的基因序列預測程序被所述處理器執(zhí)行時實現(xiàn)如上所述的基于深度學習模型的基因序列預測方法的步驟。
35、一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有基于深度學習模型的基因序列預測程序,所述基于深度學習模型的基因序列預測程序被處理器執(zhí)行時實現(xiàn)如上所述的基于深度學習模型的基因序列預測方法的步驟。
36、相較于現(xiàn)有技術,本專利技術提供的一種基于深度學習模型的基因序列預測方法及相關設備,所述方法包括:利用獲取的預測數據和原始數據,對構建的非線性深度學習模型進行預測得到預測值;以及計算非線性深度學習模型的懲罰值;根據預測值計算得到當前任務的目標損失函數后,根據懲罰值構建得到多元素損失函數,并計算得到非線性深度學習模型的損失值;根據損失值優(yōu)化非線性深度學習模型后,利用經過優(yōu)化后的非線性深度學習模型對預測數據中的待檢測基因序列進行預測,得到基因預測檢測結果。通過對預先構建的非線性深度學習模型進行預測得到預測值后,本文檔來自技高網...
【技術保護點】
1.一種基于深度學習模型的基因序列預測方法,其特征在于,所述基于深度學習模型的基因序列預測方法包括:
2.根據權利要求1所述的基于深度學習模型的基因序列預測方法,其特征在于,所述基于深度學習模型的基因序列預測方法還包括:
3.根據權利要求1所述的基于深度學習模型的基因序列預測方法,其特征在于,所述構建非線性深度學習模型,并獲取預測數據和原始數據,具體包括:
4.根據權利要求3所述的基于深度學習模型的基因序列預測方法,其特征在于,所述利用所述預測數據和所述原始數據對所述非線性深度學習模型進行預測,得到預測值,具體包括:
5.根據權利要求3所述的基于深度學習模型的基因序列預測方法,其特征在于,所述根據所述預測數據和所述原始數據,計算所述非線性深度學習模型的懲罰值,具體包括:
6.根據權利要求3所述的基于深度學習模型的基因序列預測方法,其特征在于,所述根據所述預測值計算得到當前任務的目標損失函數后,根據所述懲罰值構建得到多元素損失函數,并計算得到所述非線性深度學習模型的損失值,具體包括:
7.根據權利要求3所述的基
8.一種基于深度學習模型的基因序列預測系統(tǒng),其特征在于,所述基于深度學習模型的基因序列預測系統(tǒng)包括:
9.一種控制器,其特征在于,所述控制器包括:存儲器、處理器、顯示器及存儲在所述存儲器上并可在所述處理器上運行的基于深度學習模型的基因序列預測程序,所述基于深度學習模型的基因序列預測程序被所述處理器執(zhí)行時實現(xiàn)如權利要求1-7任一項所述的基于深度學習模型的基因序列預測方法的步驟。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有基于深度學習模型的基因序列預測程序,所述基于深度學習模型的基因序列預測程序被處理器執(zhí)行時實現(xiàn)如權利要求1-7任一項所述的基于深度學習模型的基因序列預測方法的步驟。
...【技術特征摘要】
1.一種基于深度學習模型的基因序列預測方法,其特征在于,所述基于深度學習模型的基因序列預測方法包括:
2.根據權利要求1所述的基于深度學習模型的基因序列預測方法,其特征在于,所述基于深度學習模型的基因序列預測方法還包括:
3.根據權利要求1所述的基于深度學習模型的基因序列預測方法,其特征在于,所述構建非線性深度學習模型,并獲取預測數據和原始數據,具體包括:
4.根據權利要求3所述的基于深度學習模型的基因序列預測方法,其特征在于,所述利用所述預測數據和所述原始數據對所述非線性深度學習模型進行預測,得到預測值,具體包括:
5.根據權利要求3所述的基于深度學習模型的基因序列預測方法,其特征在于,所述根據所述預測數據和所述原始數據,計算所述非線性深度學習模型的懲罰值,具體包括:
6.根據權利要求3所述的基于深度學習模型的基因序列預測方法,其特征在于,所述根據所述預測值計算得到當前任務的目標損失函數后,根據所述懲罰值構建得到多元素損失函數,并計算得到所述非線性深度學習模型...
【專利技術屬性】
技術研發(fā)人員:王中昊,殷鵬,朱木春,黃華振,
申請(專利權)人:中國科學院深圳先進技術研究院,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。