System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
技術(shù)介紹
1、本實(shí)施例涉及基于基因組數(shù)據(jù)的醫(yī)療決策支持。細(xì)胞的基因組成貢獻(xiàn)于或者甚至確定疾病病因。對(duì)于大多數(shù)常見的復(fù)雜疾病而言,多基因遺傳,牽涉許多常見的小效應(yīng)的基因變型,比罕見的單基因突變扮演更大的角色,從而導(dǎo)致寬范圍的個(gè)體疾病風(fēng)險(xiǎn)。在癌癥中,焦點(diǎn)已經(jīng)在標(biāo)識(shí)癌基因和腫瘤抑制基因中的驅(qū)動(dòng)突變上,所述驅(qū)動(dòng)突變損害所編碼蛋白質(zhì)的功能,并且最終將正常細(xì)胞轉(zhuǎn)化成惡性細(xì)胞。在這兩種情況下,諸如下一代測(cè)序之類的基因分型技術(shù)被越來越多地采用來支持做出臨床決策。然而,基因組領(lǐng)域的大小與小的患者隊(duì)列以及固有的基因異質(zhì)性(即導(dǎo)致相同表型的不同基因型)相組合,使得難以合適地訓(xùn)練考慮所有相關(guān)基因組信息的臨床決策支持系統(tǒng)。例如,確定基因的表達(dá)(而不是所編碼蛋白質(zhì)的功能性)的調(diào)控序列(諸如啟動(dòng)子和增強(qiáng)子序列)中非編碼突變的影響尚未被大規(guī)模考慮。
2、為了全面表征疾病的基因成分,并且因此例如關(guān)于由諸如放射療法之類的治療造成的正常組織并發(fā)癥或毒性來改進(jìn)診斷、預(yù)后和預(yù)測(cè),不可或缺的是考慮蛋白質(zhì)編碼和非編碼突變——包括遺傳性(即,種系)和獲得性(即,體細(xì)胞)突變——在蛋白質(zhì)功能性和表達(dá)這兩者上的組合效應(yīng)。雖然基因及其所編碼蛋白質(zhì)的表達(dá)也可以使用轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)方法直接測(cè)量,但是基因組學(xué)是迄今為止臨床上最被認(rèn)可的,并且最經(jīng)常是臨床慣例中的僅可用分子模態(tài)。
3、對(duì)于常見的復(fù)雜疾病,例如冠狀動(dòng)脈疾病,全基因組多基因風(fēng)險(xiǎn)得分(prs)標(biāo)識(shí)高風(fēng)險(xiǎn)個(gè)體,并且因此,使得能夠例如使用ldpred算法實(shí)現(xiàn)增強(qiáng)的篩選或預(yù)防性療法。然而,prs在基因和基因
4、附加地,存在將基因組數(shù)據(jù)與諸如基因和蛋白質(zhì)表達(dá)數(shù)據(jù)之類的更多功能讀出集成的方法。例如,神經(jīng)網(wǎng)絡(luò)模型已經(jīng)從多個(gè)組學(xué)模態(tài)中被訓(xùn)練出來以支持臨床決策。所述方法中的一些還集成了在直接或間接蛋白質(zhì)-蛋白質(zhì)相互作用上的先驗(yàn)知識(shí)。然而,所有這些方法都要求在訓(xùn)練期間以及在臨床慣例中訪問多個(gè)模態(tài)的數(shù)據(jù),包括轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)。
技術(shù)實(shí)現(xiàn)思路
1、為醫(yī)療決策支持提供計(jì)算機(jī)可讀介質(zhì)上的系統(tǒng)、方法和指令。基于患者的可用基因組數(shù)據(jù),dna語言模型和蛋白質(zhì)語言模型這兩者被用于生成得分。這些得分被用于預(yù)測(cè)患者的健康。例如,通過對(duì)基因的表達(dá)和所編碼蛋白質(zhì)的功能性進(jìn)行評(píng)分并且將評(píng)分輸入到預(yù)測(cè)模型來提供決策支持。
2、在第一方面中,提供了一種用于醫(yī)療系統(tǒng)中的決策支持的方法。獲取患者的基因組序列。蛋白質(zhì)功能的第一得分由處理器實(shí)現(xiàn)的蛋白質(zhì)語言模型基于從基因組序列導(dǎo)出的輸入生成。基因表達(dá)的第二得分由處理器實(shí)現(xiàn)的調(diào)控dna語言模型基于從基因組序列導(dǎo)出的輸入生成。由機(jī)器學(xué)習(xí)模型響應(yīng)于第一得分和第二得分至機(jī)器學(xué)習(xí)模型的輸入來預(yù)測(cè)患者的健康。顯示如由機(jī)器學(xué)習(xí)模型預(yù)測(cè)的健康。
3、在第二方面中,提供了一種醫(yī)療決策支持系統(tǒng)。存儲(chǔ)器被配置為存儲(chǔ)患者的基因組序列的信息、用于基因的表達(dá)的第一語言模型、用于所編碼蛋白質(zhì)的功能性的第二語言模型以及用于醫(yī)療狀況或疾病的預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò)。處理器被配置為將第一語言模型應(yīng)用于信息中的至少一些,將第二語言模型應(yīng)用于信息中的至少一些,并且將神經(jīng)網(wǎng)絡(luò)應(yīng)用于第一和第二語言模型的輸出,神經(jīng)網(wǎng)絡(luò)被配置為從神經(jīng)網(wǎng)絡(luò)的應(yīng)用中為患者輸出決策支持信息。顯示器被配置為顯示決策支持信息或者從決策支持信息導(dǎo)出的信息。
4、在第三方面中,提供了一種用于分析基因組序列數(shù)據(jù)的方法。獲得患者的基因組序列數(shù)據(jù)。基因組序列數(shù)據(jù)中包含的蛋白質(zhì)編碼基因序列被轉(zhuǎn)譯成所編碼蛋白質(zhì)序列。蛋白質(zhì)語言模型被應(yīng)用于所編碼蛋白質(zhì)序列。所述應(yīng)用導(dǎo)致評(píng)估對(duì)應(yīng)蛋白質(zhì)功能性的第一度量得分。從基因組序列數(shù)據(jù)中提取在蛋白質(zhì)編碼基因的表達(dá)上施加調(diào)控效應(yīng)的dna序列。調(diào)控dna語言模型被應(yīng)用于所提取的dna序列。所述應(yīng)用導(dǎo)致評(píng)估對(duì)應(yīng)蛋白質(zhì)編碼基因的表達(dá)的第二度量得分。由經(jīng)機(jī)器訓(xùn)練的預(yù)測(cè)模型響應(yīng)于第一和第二度量得分至經(jīng)機(jī)器訓(xùn)練的預(yù)測(cè)模型的輸入來導(dǎo)出關(guān)于疾病或醫(yī)療狀況的診斷、預(yù)后或預(yù)測(cè)輸出。顯示所述診斷、預(yù)測(cè)或預(yù)測(cè)輸出。
5、上面描述的或下面說明性實(shí)施例中的方面或概念中的任何一個(gè)或多個(gè)可以被單獨(dú)使用或組合使用。針對(duì)一個(gè)實(shí)施例或方面描述的方面或概念可以被用在其他實(shí)施例或方面中。針對(duì)一種方法或系統(tǒng)描述的方面或概念可以被用在系統(tǒng)、方法或非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中的其他方法或系統(tǒng)中。
6、這些和其他方面、特征、實(shí)施例和優(yōu)點(diǎn)將從對(duì)優(yōu)選實(shí)施例的以下詳細(xì)描述中變得顯而易見,所述詳細(xì)描述要結(jié)合隨附附圖進(jìn)行閱讀。本專利技術(shù)由以下權(quán)利要求限定,并且本節(jié)中的任何內(nèi)容都不應(yīng)當(dāng)理解為對(duì)那些權(quán)利要求的限制。本專利技術(shù)的進(jìn)一步的方面和優(yōu)點(diǎn)在下面結(jié)合優(yōu)選實(shí)施例進(jìn)行討論,并且以后可以獨(dú)立地或組合地要求保護(hù)。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種用于醫(yī)療系統(tǒng)中的決策支持的方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中預(yù)測(cè)包括將健康預(yù)測(cè)為疾病或醫(yī)療狀況的臨床決策標(biāo)度中的值。
3.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括確定如由機(jī)器學(xué)習(xí)模型預(yù)測(cè)的健康的不確定性。
4.根據(jù)權(quán)利要求1所述的方法,其中生成第一得分包括由包括進(jìn)化尺度模型(ESM)的處理器實(shí)現(xiàn)的蛋白質(zhì)語言模型生成第一得分,并且其中生成第二得分包括由包括Enformer模型的處理器實(shí)現(xiàn)的調(diào)控DNA語言模型生成第二得分。
5.根據(jù)權(quán)利要求1所述的方法,其中生成第二得分包括利用從基因組序列導(dǎo)出的輸入生成第二得分,所述基因組序列是基因組序列的蛋白質(zhì)編碼基因的轉(zhuǎn)錄起始位點(diǎn)周圍的100kb或更多。
6.根據(jù)權(quán)利要求5所述的方法,進(jìn)一步包括從圖譜中導(dǎo)出轉(zhuǎn)錄起始位點(diǎn)。
7.根據(jù)權(quán)利要求5所述的方法,其中生成第二得分進(jìn)一步包括基于功能性RNA編碼基因以及蛋白質(zhì)編碼基因來生成。
8.根據(jù)權(quán)利要求1所述的方法,其中預(yù)測(cè)包括在機(jī)器學(xué)習(xí)模型包括神經(jīng)網(wǎng)絡(luò)的情況下進(jìn)行預(yù)測(cè)。
9.根據(jù)權(quán)利
10.根據(jù)權(quán)利要求9所述的方法,其中圖神經(jīng)網(wǎng)絡(luò)的邊包括表示所連接的蛋白質(zhì)對(duì)的物理關(guān)聯(lián)的似然性的權(quán)重。
11.根據(jù)權(quán)利要求1所述的方法,其中預(yù)測(cè)包括響應(yīng)于輸入進(jìn)行預(yù)測(cè),其中所述輸入進(jìn)一步包括年齡、性別、種族、組織學(xué)特性、疾病發(fā)展階段、可檢測(cè)的分子改變、從醫(yī)學(xué)圖像、病理圖像和/或?qū)嶒?yàn)室測(cè)試導(dǎo)出的生物標(biāo)記。
12.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括關(guān)于蛋白質(zhì)編碼基因、對(duì)應(yīng)的調(diào)控DNA序列和/或疾病或醫(yī)療狀況從基因組序列中進(jìn)行選擇。
13.根據(jù)權(quán)利要求12所述的方法,其中從調(diào)控DNA語言模型和/或蛋白質(zhì)語言模型的基因組序列導(dǎo)出的輸入是從選擇導(dǎo)出的。
14.根據(jù)權(quán)利要求12所述的方法,其中選擇包括基于第一或第二得分的閾值進(jìn)行選擇。
15.根據(jù)權(quán)利要求1所述的方法,其中獲取包括從基因面板測(cè)序、全外顯子組測(cè)序、全基因組測(cè)序、全基因組基因分型微陣列和/或未觀察到的基因型的歸因中獲取。
16.一種醫(yī)療決策支持系統(tǒng),包括:
17.根據(jù)權(quán)利要求16所述的醫(yī)療決策支持系統(tǒng),其中所述第一語言模型包括調(diào)控DNA語言模型,其中第一語言模型被應(yīng)用于其的信息中的至少一些包括基因組序列中轉(zhuǎn)錄起始位點(diǎn)周圍的100kb或更大。
18.根據(jù)權(quán)利要求16所述的醫(yī)療決策支持系統(tǒng),其中所述神經(jīng)網(wǎng)絡(luò)包括基于蛋白質(zhì)-蛋白質(zhì)相互作用布置的圖神經(jīng)網(wǎng)絡(luò)。
19.一種用于基因組序列數(shù)據(jù)的分析的方法,所述方法包括:
20.根據(jù)權(quán)利要求19所述的方法,其中導(dǎo)出包括由機(jī)器訓(xùn)練的預(yù)測(cè)模型進(jìn)行的導(dǎo)出包括圖神經(jīng)網(wǎng)絡(luò),其中所述圖表示蛋白質(zhì)-蛋白質(zhì)相互作用。
...【技術(shù)特征摘要】
1.一種用于醫(yī)療系統(tǒng)中的決策支持的方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中預(yù)測(cè)包括將健康預(yù)測(cè)為疾病或醫(yī)療狀況的臨床決策標(biāo)度中的值。
3.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括確定如由機(jī)器學(xué)習(xí)模型預(yù)測(cè)的健康的不確定性。
4.根據(jù)權(quán)利要求1所述的方法,其中生成第一得分包括由包括進(jìn)化尺度模型(esm)的處理器實(shí)現(xiàn)的蛋白質(zhì)語言模型生成第一得分,并且其中生成第二得分包括由包括enformer模型的處理器實(shí)現(xiàn)的調(diào)控dna語言模型生成第二得分。
5.根據(jù)權(quán)利要求1所述的方法,其中生成第二得分包括利用從基因組序列導(dǎo)出的輸入生成第二得分,所述基因組序列是基因組序列的蛋白質(zhì)編碼基因的轉(zhuǎn)錄起始位點(diǎn)周圍的100kb或更多。
6.根據(jù)權(quán)利要求5所述的方法,進(jìn)一步包括從圖譜中導(dǎo)出轉(zhuǎn)錄起始位點(diǎn)。
7.根據(jù)權(quán)利要求5所述的方法,其中生成第二得分進(jìn)一步包括基于功能性rna編碼基因以及蛋白質(zhì)編碼基因來生成。
8.根據(jù)權(quán)利要求1所述的方法,其中預(yù)測(cè)包括在機(jī)器學(xué)習(xí)模型包括神經(jīng)網(wǎng)絡(luò)的情況下進(jìn)行預(yù)測(cè)。
9.根據(jù)權(quán)利要求8所述的方法,其中所述神經(jīng)網(wǎng)絡(luò)包括表示蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)的圖神經(jīng)網(wǎng)絡(luò)。
10.根據(jù)權(quán)利要求9所述的方法,其中圖神經(jīng)網(wǎng)絡(luò)的邊包括表示所連接的蛋白質(zhì)對(duì)的物理關(guān)聯(lián)的似然性的權(quán)重。
11.根據(jù)權(quán)利要求1所述的方法,其中預(yù)測(cè)包括響應(yīng)于輸入...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:M·西伯特,V·辛格,A·卡門,
申請(qǐng)(專利權(quán))人:西門子醫(yī)療股份公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。