• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>格里爾公司專利>正文

    用于評估縱向生物特征數據的系統和方法技術方案

    技術編號:36922028 閱讀:25 留言:0更新日期:2023-03-22 18:45
    提供了用于確定一測試對象是否患有一疾病狀況的系統和方法。在一個方面,所述方法包括確定一測試對象的至少第一基因型數據結構和第二基因型數據結構,其由在不同時間分別從來自所述對象的第一樣本和第二樣本收集的數據形成。將所述第一基因型數據結構和所述第二基因型數據結構輸入到所述疾病狀況的一模型中,從而分別產生所述疾病狀況的第一模型得分集和第二模型得分集。基于所述第一模型得分集與所述第二模型得分集之間的一差異來確定一測試δ得分集。對照多個參考δ得分集來評估所述測試δ得分集,以確定所述測試對象的所述疾病狀況,其中每個參考δ得分集用于多個參考對象中的一相應參考對象。象中的一相應參考對象。象中的一相應參考對象。

    【技術實現步驟摘要】
    【國外來華專利技術】用于評估縱向生物特征數據的系統和方法
    [0001]相關申請的交叉引用
    [0002]本申請要求于2020年11月27日提交的美國臨時專利申請第62/941,012號的優先權,其全部內容通過引用明確并入本文。


    [0003]本公開涉及用于基于對象的基因型特征隨時間的變化來評估對象的疾病狀態的方法。

    技術介紹

    [0004]癌癥代表了一個突出的全球公共衛生問題。僅美國在2015年就報告了1,658,370例病例。篩查計劃和早期診斷對提高癌癥患者的無病存活率和降低死亡率具有重要影響。例如,結直腸癌的早期篩查使美國的結直腸癌發病率和死亡率降低了近50%。這種降低與癌癥分期相關的存活率相一致,從結直腸癌1期的94%下降到結直腸癌4期的11%。然而,早期癌癥檢測存在兩大挑戰:患者依從性和敏感性差。
    [0005]有利地,對癌癥的分子發病機制的認識的增加和次世代定序技術的快速發展正在推進對涉及體液中癌癥發展的早期分子改變的研究。在血漿、血清和尿液中的游離DNA(cfDNA)中發現了與此類癌癥發展相關的特定遺傳和表觀遺傳改變。這種改變可能被用作幾種癌癥的診斷生物標志物。有利的是,非侵入性采樣方法,例如所謂的“液體活檢(liquid biopsies)”,可以促進患者的依從性,因為它們更容易、更快且執行成本更低。
    [0006]可以在血清、血漿、尿液和其他體液中發現游離DNA,從而實現“液體活檢”,這代表了對象中許多不同組織(包括患病組織)的基因組組成的快照(snapshot)。cfDNA來源于壞死或凋亡細胞,通常由所有類型的細胞釋放。cfDNA包含特定的腫瘤相關改變,例如突變、甲基化和拷貝數變異(copy number variations,CNV),因此包含循環(circulating)腫瘤DNA(ctDNA)。
    [0007]然而,因為cfDNA代表從廣泛的組織釋放的DNA,包括健康組織和經歷造血的白細胞,其挑戰仍然是能夠區分源自疾病組織(例如:癌癥)的信號與源自生殖細胞的信號。事實上,在大多數癌癥患者中,大部分cfDNA來自健康細胞,例如,大于80%、90%、95%或更多。cfDNA信號可以被富集,例如,通過識別具有不符合典型1:1比例的等位基因部分的變體等位基因,例如生殖系中的雜合等位基因所示。cfDNA信號也可以根據被定序的cfDNA的大小進行富集,因為據觀察,源自癌性腫瘤的cfDNA的平均長度比源自生殖細胞的cfDNA來得短。
    [0008]不幸的是,迄今為止,大多數cfDNA診斷研究都集中在晚期腫瘤階段。基于cfDNA的診斷分析在早期惡性疾病階段的識別中的應用文獻較少。盡管早期癌癥檢測與晚期癌癥檢測的工作原理相同,但早期檢測存在一些獨特的障礙。這些包括較低的畸變頻率和數量、潛在的混雜現象,例如非腫瘤組織的克隆擴展或癌癥相關突變隨年齡增長的積累,以及對驅動(driver)改變的不完整了解。
    [0009]在血液中,細胞凋亡是決定cfDNA量的常見事件。然而,在癌癥患者中,cfDNA的數
    量也會受到壞死(necrosis)的影響。由于細胞凋亡似乎是主要的釋放機制,循環cfDNA的大小分布顯示富含約167bp的短片段,對應于凋亡細胞產生的核小體。

    技術實現思路

    [0010]一般而言,與使用常規分類方法可能的情況相比,本文所述的系統和方法通過考慮對象生物特征的個體差異,可以更早地檢測到疾病狀態。對對象的疾病狀態進行分類的常規方法可能涉及在單個時間點獲得對象的一個或多個生物特征的快照(snapshot),并根據預定的疾病概況或經過訓練的分類器評估對象的信息。雖然這種方法足以在對象病情進展充分時確定疾病的存在,但通常無法可靠地檢測疾病的前期狀態甚至早期階段。例如,已經開發了幾種分類器,用于通過詢問從對象血漿中分離的游離DNA(cfDNA)的序列讀取來診斷對象的癌癥。然而,由于血漿含有來自健康生殖細胞和造血細胞的cfDNA,這些分類器使用血漿中存在的循環腫瘤DNA(ctDNA)的最小量,稱為最小腫瘤分數(tumor fraction),以檢測cfDNA序列讀取中的癌性特征。然而,由于疾病的診斷階段與治療結果之間存在著很強的相關性,因此需要更敏感的方法來識別早期疾病的存在。
    [0011]有利的是,本公開提供了用于早期疾病識別的此類方法,至少部分地通過詢問對象的生物特征隨時間的變化,而不是在單個時間點。具體而言,通過使用來自對象的多個生物樣本隨時間推移的數據,在監測疾病狀態時可以解釋對象生物特征的個性化差異。
    [0012]在一個方面,本公開提供了一種用于確定對象的疾病狀態的方法,方法通過將對象患有疾病狀態的模型化概率隨時間的變化與模型化概率隨時間的變化的總體分布進行比較。在一些實施方案中,方法包括確定對象的第一基因型數據結構,第一基因型數據結構包括基于在第一測試時間點從對象獲得的第一生物樣本中的第一多個核酸分子的電子形式的第一多個序列讀取的多個基因型特征的值。方法可以包括將第一基因型數據結構輸入到疾病狀況的模型中,從而生成疾病狀況的第一模型得分集。方法可以包括確定測試對象的第二基因型數據結構,第二基因型數據結構包括基于在第一測試時間點之后發生的第二測試時間點從對象獲得的第二生物樣本中的第二多個核酸分子的電子形式的第二多個序列讀取的多個基因型特征的值。方法可以包括將第二基因型數據結構輸入到模型中,從而生成疾病狀況的第二模型得分集。方法可以包括基于第一和第二模型得分集之間的差異來確定測試δ得分集。然后,方法可以包括對照多個參考δ得分集來評估測試δ得分集,從而確定測試對象的疾病狀況,其中多個參考δ得分集中的每個參考δ得分集針對多個參考對象中的相應參考對象。
    [0013]在另一方面,本專利技術提供了一種通過使用時間趨勢測試評估對象具有疾病狀態的模型化概率隨時間的變化來確定對象的疾病狀態的方法。在一些實施方案中,方法包括為多個測試時間點中的每個相應測試時間點確定測試對象的對應基因型數據結構,對應基因型數據結構包括基于在相應測試時間點從對象處獲得的對應的生物樣本中的對應的多個核酸分子的電子形式的對應的多個序列讀取的多個基因型特征的值。方法可以包括將對應的基因型數據結構輸入到疾病狀況的模型中(在本文中單獨描述),以在相應測試時間點生成疾病狀況的對應的時間戳模型得分集,從而獲得測試對象的多個時間戳測試模型得分集,其中,每個相應的時間戳測試模型得分集耦合到多個測試時間點中的不同測試時間點。方法可以包括將多個時間戳測試模型得分集與時間趨勢測試擬合,從而獲得測試對象的測
    試趨勢參數集。方法可包括對照多個參考對象的多個參考趨勢參數集評估對象的測試趨勢參數集,從而確定對象的疾病狀況,其中多個參考趨勢參數集中的每個相應參考趨勢參數集是針對多個參考對象中的對應的參考對象。
    [0014]方法可包括基于所有時間點的數據創建分類器,以一次利用所有時間點來了解疾病狀況,而不是將分類器略微應用于每個時間點(例如,將預先訓練的單個時間點分類器應用于從多個時間點收集的測試樣本),以及以時間信息對模型分數進行事后分本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    【國外來華專利技術】1.一種確定一測試對象是否具有一疾病狀況的方法,其特征在于,所述方法包含:在一計算機系統執行以下步驟,其中所述計算機系統具有一個或多個處理器以及內存,所述內存存儲一個或多個程序以供所述一個或多個處理器執行:(A)確定所述測試對象的一第一基因型數據結構,所述第一基因型數據結構包括基于在一第一測試時間點從所述測試對象獲得的一第一生物樣本中的一第一多個核酸分子的電子形式的一第一多個序列讀取的多個基因型特征的多個值;(B)將所述第一基因型數據結構輸入到所述疾病狀況的一模型中,從而產生所述疾病狀況的第一模型得分集;(C)確定所述測試對象的一第二基因型數據結構,所述第二基因型數據結構包括基于在發生在所述第一測試時間之后的一第二測試時間點從所述測試對象獲得的一第二生物樣本中的一第二多個核酸分子的電子形式的一第二多個序列讀取的所述多個基因型特征的多個值;(D)將所述第二基因型數據結構輸入到所述模型中,從而產生所述疾病狀況的一第二模型得分集;(E)基于所述第一模型得分集與所述第二模型得分集之間的一差異來確定一測試δ得分集;以及(F)對照多個參考δ得分集來評估所述測試δ得分集,從而確定所述測試對象是否具有所述疾病狀況,其中在所述多個參考δ得分集中的每個參考δ得分集是針對多個參考對象中的一相應參考對象。2.如權利要求1所述的方法,其特征在于:所述模型評估來自單個時間點的數據。3.如權利要求1或2所述的方法,其特征在于:所述第一模型得分集包括所述測試對象在所述第一測試時間點具有所述疾病狀況的一概率;所述第二模型得分集包括所述測試對象在所述第二測試時間點具有所述疾病狀況的一概率,以及所述評估(F)包括將所述測試δ得分集與所述多個參考δ得分集的一分布進行比較,其中所述多個參考δ得分中的每個參考δ得分集是基于以下(i)與(ii)之間的一差異針對在所述多個參考對象中的一相應參考對象:(i)所述相應參考對象具有所述疾病狀況的一第一概率,所述第一概率使用包括所述多個基因型特征的多個值的一相應第一參考基因型數據結構通過所述模型來提供,所述多個值是使用在一相應第一時間點從所述相應參考對象獲得的一相應第一生物樣本來獲取;以及(ii)所述相應參考對象具有所述疾病狀況的一第二概率,所述第二概率使用包括所述多個基因型特征的多個值的一相應第二參考基因型數據結構通過所述模型來提供,所述多個值是使用在所述相應第一時間點之后發生的一相應第二時間點從所述相應參考對象獲得的一相應第二生物樣本來獲取,其中所述相應訓練對象至少在所述相應第一時間點以及所述相應第二時間點的期間不具有所述疾病狀況。4.如權利要求1或2所述的方法,其特征在于:所述模型的所述第一模型得分集包括具有所述疾病狀況的一概率。
    5.如權利要求1或2所述的方法,其特征在于:所述模型的所述第一模型得分集包括不具有所述疾病狀況的一似然或一概率。6.如權利要求1至3中任一項所述的方法,其特征在于:所述評估(F)包括:確定所述分布的一集中趨勢的量數以及所述分布的一散布量數;以及使用所述分布的所述集中趨勢的量數以及所述分布的所述散布量數來確定所述測試δ得分集的一顯著性。7.如權利要求6所述的方法,其特征在于:所述分布的所述集中趨勢的量數是所述分布中的一算術平均數、一加權平均數、一中程數、一中樞紐、一三均值、一極端值調整平均數、一平均數或一眾數。8.如權利要求6或7所述的方法,其特征在于:所述分布的所述散布量數是所述分布的一標準差、一方差或一范圍。9.如權利要求6所述的方法,其特征在于:所述分布的所述集中趨勢的量數是所述分布的所述平均數;所述分布的所述散布量數是所述分布的所述標準差;以及使用所述分布的所述集中趨勢的量數以及所述分布的所述散布量數來確定所述測試δ得分集的所述顯著性包括確定多個標準差的數量所述測試δ得分集是來自所述分布的所述平均數。10.如權利要求9所述的方法,其特征在于:當自所述分布的所述平均數的所述多個標準差的數量所述測試δ得分集滿足一閾值時,所述測試對象被確定具有所述疾病狀況。11.如權利要求1至3中任一項所述的方法,其特征在于:所述評估(F)包括將所述測試δ得分輸入到對照所述多個參考δ得分集訓練的一分類器中,其中所述多個參考δ得分中的每個參考δ得分集是基于以下(i)與(ii)之間的一差異針對在所述多個參考對象中的一相應參考對象:(i)所述相應參考對象具有所述疾病狀況的一第一概率,所述第一概率使用包括所述多個基因型特征的多個值的一相應第一參考基因型數據結構通過所述模型來提供,所述多個值是使用在一相應第一時間點從所述相應參考對象獲得的一相應第一生物樣本來獲取;以及(ii)所述相應參考對象具有所述疾病狀況的一第二概率,所述第二概率使用包括所述多個基因型特征的多個值的一相應第二參考基因型數據結構通過所述模型來提供,所述多個值是使用在所述相應第一時間點之后發生的一相應第二時間點從所述相應參考對象獲得的一相應第二生物樣本來獲取,其中所述相應訓練對象至少在所述相應第一時間點以及所述相應第二時間點的期間不具有所述疾病狀況。12.如權利要求11所述的方法,其特征在于:針對所述多個參考對象的至少一子集中的每個相應訓練對象,對照在所述相應第二時間點之后發生的一相應第三時間點的所述相應對象是否具有所述疾病狀況的一確定,來對所述分類器進一步進行訓練。13.如權利要求11或12所述的方法,其特征在于:所述分類器是一神經網絡算法、一支持向量機算法、一樸素貝葉斯分類器算法、一最鄰近搜索算法、一提升樹算法、一隨機森林算法、一決策樹算法、一多分類邏輯回歸算法或一線性回歸算法。14.如權利要求3至10中任一項所述的方法,其特征在于:
    將所述多個參考對象中的每個相應參考對象的所述相應第一時間點與所述相應第二時間點之間的一時間量用作計算所述分布的一協變量;以及針對所述測試對象基于表示所述第一測試時間點與所述第二測試時間點之間的一時間差的所述協變量來調整所述測試δ得分集。15.如權利要求14所述的方法,其特征在于:將表示所述第一測試時間點與所述第二測試時間點之間的一時間差的所述協變量應用于所述第一基因型數據結構、所述第二基因型數據結構、每個第一相應參考基因型數據結構或是每個第二相應參考基因型數據結構的所述多個特征中的一個或多個基因型特征。16.如權利要求14所述的方法,其特征在于:將表示所述第一測試時間點與所述第二測試時間點之間的一時間差的所述協變量應用于所述測試δ得分集以及多個參考δ得分的分布中的每個參考δ得分集。17.如權利要求3至10中任一項所述的方法,其特征在于:還包括歸一化,其中:針對所述相應對象將所述多個參考δ得分集中的每個相應參考δ得分集歸一化所述相應第一時間點與所述相應第二時間點之間的一時間量;以及將所述測試δ得分集歸一化所述第一測試時間點與所述第二測試時間點之間的一時間量。18.如權利要求17所述的方法,其特征在于:通過針對所述相應對象對每個第一相應參考基因型數據結構或是每個第二相應參考基因型數據結構的所述多個特征中的一個或多個基因型特征歸一化所述相應第一時間點與所述相應第二時間點之間的一時間量,來針對所述相應參考對象將所述多個參考δ得分集中的每個相應參考δ得分集歸一化所述相應第一時間點與所述相應第二時間點之間的一時間量;以及通過將所述第一基因型數據結構以及所述第二基因型數據結構中的一個或多個基因型特征歸一化所述第一測試時間點與所述第二測試時間點之間的一時間量,來將所述測試δ得分集歸一化所述第一測試時間點與所述第二測試時間點之間的一時間量。19.如權利要求17所述的方法,其特征在于:將所述歸一化應用于所述測試δ得分集以及所述多個參考δ得分集的分布中的每個參考δ得分集。20.如權利要求3至19中任一項所述的方法,其特征在于:將所述多個參考對象中的每個相應參考對象的一非基因型特征作為計算所述分布中的一協變量;以及所述測試δ得分集是根據所述測試對象的所述非基因型特征來進行調整。21.如權利要求20所述的方法,其特征在于:將所述協變量應用于所述第一基因型數據結構、所述第二基因型數據結構、每個相應第一參考基因型數據結構或是每個相應第二參考基因型數據結構的所述多個特征中的一個或多個基因型特征。22.如權利要求20所述的方法,其特征在于:將所述協變量應用于所述測試δ得分集以及所述多個參考δ得分集的分布中的每個參考δ得分集。23.如權利要求2至19中任一項所述的方法,其特征在于:所述方法還包含:一歸一化,其中:針對所述相應參考對象的一非基因型特征將所述多個參考δ得分集中的每個相應參考
    δ得分集進行歸一化;以及針對所述測試對象的所述非基因型特征將所述測試δ得分集進行歸一化。24.如權利要求23所述的方法,其特征在于:通過對所述相應參考對象的所述非基因型特征的每個相應第一參考基因型數據結構或是每個相應第二參考基因型數據結構的所述多個特征中的一個或多個基因型特征歸一化,針對所述相應參考對象的所述非基因型特征對所述多個參考δ得分集中的每個相應參考δ得分集歸一化;以及針對所述測試對象的所述非基因型特征對所述測試δ得分集歸一化。25.如權利要求23所述的方法,其特征在于:所述歸一化應用于所述測試δ得分集以及所述多個參考δ得分集的所述分布中的每個參考δ得分集。26.如權利要求20至25中任一項所述的方法,其特征在于:所述非基因型特征包括年齡、飲酒狀態、吸煙狀態、性別或其一組合。27.如權利要求1至26中任一項所述的方法,其特征在于:所述多個參考對象針對性別、年齡、吸煙狀況、飲酒或其一組合進行分段。28.如權利要求1至27中任一項所述的方法,其特征在于:所述疾病狀況是一癌癥。29.如權利要求1至27中任一項所述的方法,其特征在于:所述疾病狀況是一組疾病狀況中的一種疾病狀況,并且所述模型為所述一組疾病狀況中的每種疾病狀況提供一概率或一似然。30.如權利要求29所述的方法,其特征在于:所述一組疾病狀況包括多種癌癥狀況。31.如權利要求30所述的方法,其特征在于:所述多種癌癥狀況包括一腎上腺癌、一膽道癌、一膀胱癌、一骨/骨髓癌、一腦癌、一子宮頸癌、一結直腸癌、一食道癌、一胃癌、一頭/頸癌、一肝膽癌、一腎癌、一肝癌、一肺癌、一卵巢癌、一胰臟癌、一骨盆腔癌、一胸膜癌、一前列腺癌、一腎癌、一皮膚癌、一胃癌、一睪丸癌、一胸腺癌、一甲狀腺癌、一子宮癌、一淋巴瘤、一黑色素瘤、一多發性骨髓瘤或一白血病。32.如權利要求30所述的方法,其特征在于:所述多種癌癥狀況包括以下癌癥的一預定階段:一腎上腺癌、一膽道癌、一膀胱癌、一骨/骨髓癌、一腦癌、一子宮頸癌、一結直腸癌、一食道癌、一胃癌、一頭/頸癌、一肝膽癌、一腎癌、一肝癌、一肺癌、一卵巢癌、一胰臟癌、一骨盆腔癌、一胸膜癌、一前列腺癌、一腎癌、一皮膚癌、一胃癌、一睪丸癌、一胸腺癌、一甲狀腺癌、一子宮癌、一淋巴瘤、一黑色素瘤、一多發性骨髓瘤或一白血病。33.如權利要求1至中任一項所述的方法,其特征在于:所述疾病狀況是一癌癥的一預后。34.如權利要求33所述的方法,其特征在于:所述癌癥的所述預后是所述癌癥的一特定治療的一預后。35.如權利要求33所述的方法,其特征在于:所述癌癥的所述預后是癌癥復發的一預后。36.如權利要求1至27中任一項所述的方法,其特征在于:所述疾病狀況是一冠狀動脈疾病。37.如權利要求1至36中任一項所述的方法,其特征在于:所述測試對象是一人。38.如權利要求1至37中任一項所述的方法,其特征在于:所述測試對象未被診斷為具
    有所述疾病狀況。39.如權利要求1至38中任一項所述的方法,其特征在于:從所述測試對象獲得的所述第一生物樣本以及從所述測試對象獲得的所述第二生物樣本獨立地包括所述對象的血液、全血、血漿、血清、尿液、腦脊液、糞便、唾液、汗水、眼淚、胸膜液、心包液或腹膜液。40.如權利要求1至39中任一項所述的方法,其特征在于:從所述測試對象獲得的所述第一生物樣本以及從所述測試對象獲得的所述第二生物樣本均為血液樣本。41.如權利要求1至39中任一項所述的方法,其特征在于:從所述測試對象獲得的所述第一生物樣本以及從所述測試對象獲得的所述第二生物樣本均為血漿樣本。42.如權利要求1至41中任一項所述的方法,其特征在于:所述第一測試時間點以及所述第二測試時間點相隔至少6個月、至少10個月或至少1年。43.如權利要求1至42中任一項所述的方法,其特征在于:所述第一多個核酸分子以及所述第二多個核酸分子是游離DNA分子。44.如權利要求1至43中任一項所述的方法,其特征在于:所述多個基因型特征包括從以下群組中選擇的一個或多個特征:在一基因座的一單核苷酸變體的支持、在一基因座的一甲基化狀態、在一基因座的一相對拷貝數、在一基因座的一等位基因比率、所述多個游離核酸分子的一片段大小度量、在一基因座的一甲基化模式及其一數學組合。45.如權利要求1至43中任一項所述的方法,其特征在于:所述多個基因型特征包括多個相對拷貝數,其中所述多個相對拷貝數中的每個相應相對拷貝數對應于多個基因座中的一不同基因座。46.如權利要求1至43中任一項所述的方法,其特征在于:所述多個基因型特征包括多個甲基化狀態,其中所述多個甲基化狀態中的每個甲基化狀態對應于多個基因座中的一不同基因座。47.如權利要求1至43中任一項所述的方法,其特征在于:所述第一基因型數據結構的所述多個基因型特征包括一第一多個箱值,所述第一多個箱值中的每個相應箱值代表多個箱中的一對應箱;所述第一多個箱值中的每個相應箱值代表使用映射到多個箱中的所述對應箱的所述第一多個序列讀取中的多個序列讀取來鑒定的具有一預定甲基化模式的多個獨特核酸片段的一數量;所述第二基因型數據結構的所述多個基因型特征包括一第二多個箱值,所述第二多個箱值中的每個相應箱值代表所述多個箱中的一對應箱;所述第二多個箱值中的每個相應箱值代表映射到所述多個箱中的所述對應箱的所述第二多個序列讀取中的多個序列讀取來鑒定的具有一預定甲基化模式的多個獨特核酸片段的一數量;以及所述多個箱中的每個箱代表所述測試對象的一物種的一參考基因組的一非重疊區域。48.如權利要求47所述的方法,其特征在于:所述方法還包含對所述第一多個箱值中的每個相應箱值以及所述第二多個箱值中的每個相應箱值歸一化。49.如權利要求48所述的方法,其特征在于:所述歸一化至少部分地包括:確定所述第一多個箱值的一第一集中趨勢量數;確定所述第二多個箱值的一第二集中趨勢量數;
    將所述第一多個箱值中的每個相應箱值替換為所述相應箱值除以所述第一集中趨勢量數;以及將所述第二多個箱值中的每個相應箱值替換為所述相應箱值除以所述第二集中趨勢量數。50.如權利要求49所述的方法,其特征在于:所述第一集中趨勢量數是所述第一多個箱值的一算術平均數、一加權平均數、一中程數、一中樞紐、一三均值、一極端值調整平均數、一平均數或一眾數;以及所述第二集中趨勢量數是所述第二多個箱值的一算術平均數、一加權平均數、一中程數、一中樞紐、一三均值、一極端值調整平均數、一平均數或一眾數。51.如權利要求48所述的方法,其特征在于:所述歸一化至少部分地包括:將所述第一多個箱值中的每個相應箱值替換為針對所述第一多個箱值中的一相應第一GC偏差校正的所述相應箱值;以及將所述第二多個箱值中的每個相應箱值替換為針對所述第二多個箱值中的一相應第二GC偏差校正的所述相應箱值。52.如權利要求51所述的方法,其特征在于:所述相應第一GC偏差由擬合到一第一多個二維點的一曲線或一直線的一第一方程定義,其中所述第一多個二維點中的每個相應二維點包括:(i)一第一值,所述第一值是所述參考基因組的對應區域的相應GC含量,由對應于所述相應二維點的所述第一多個箱中的所述相應箱代表;以及(ii)一第二值,所述第二值是所述相應箱的所述第一多個箱值中的所述箱值;將所述第一多個箱值中的每個相應箱值替換為針對所述第一多個箱值中的一相應第一GC偏差校正的所述相應箱值包括從所述相應箱值減去所述相應箱的一GC校正,所述GC校正源自由所述相應箱以及所述第一方程代表的所述多個物種的所述參考基因組的所述對應區域的所述GC含量;所述相應第二GC偏差由擬合到一第二多個二維點的一曲線或一直線的一第二方程定義,其中所述第二多個二維點中的每個相應二維點包括:(i)一第三值,所述第三值是所述多個物種的所述參考基因組的對應區域的相應GC含量,由對應于所述相應二維點的所述第二多個箱中的所述相應箱代表;以及(ii)一第四值,所述第四值是所述相應箱的所述第二多個箱值中的所述箱值;以及將所述第二多個箱值中的每個相應箱值替換為針對所述第二多個箱值中的一相應第二GC偏差校正的所述相應箱值包括從所述相應箱值減去所述相應箱的一GC校正,所述GC校正源自由所述相應箱以及所述第二方程代表的所述多個物種的所述參考基因組的所述對應區域的所述GC含量。53.如權利要求1至52中任一項所述的方法,其特征在于:所述第一多個核酸分子是DNA。54.如權利要求1至53中任一項所述的方法,其特征在于:所述第一多個核酸分子通過使用多個探針的一靶向DNA甲基化定序獲得。55.如權利要求54所述的方法,其特征在于:所述多個探針與所述人類基因組中的100個或更多個基因座雜交。56.如權利要求54所述的方法,其特征在于:所述靶向DNA甲基化定序檢測所述第一多
    個核酸中的一個或多個5
    ?
    甲基胞嘧啶及/或5
    ?
    羥甲基胞嘧啶。57.如權利要求54所述的方法,其特征在于:所述靶向DNA甲基化定序包括將所述第一多個核酸中的一個或多個未甲基化胞嘧啶或一個或多個甲基化胞嘧啶轉化為對應的一個或多個尿嘧啶。58.如權利要求57所述的方法,其特征在于:所述靶向DNA甲基化定序包括將所述第一多個核酸中的一個或多個未甲基化胞嘧啶轉化為對應的一個或多個尿嘧啶;以及所述DNA甲基化定序將所述一個或多個尿嘧啶讀出為一個或多個對應的胸腺嘧啶。59.如權利要求57所述的方法,其特征在于:所述靶向DNA甲基化定序包括將所述第一多個核酸中的一個或多個甲基化胞嘧啶轉化為對應的一個或多個尿嘧啶;以及所述DNA甲基化定序將所述一個或多個5
    ?
    甲基胞嘧啶或5
    ?
    羥甲基胞嘧啶讀出為一個或多個對應的胸腺嘧啶。60.如權利要求59所述的方法,其特征在于:一個或多個未甲基化胞嘧啶或一個或多個甲基化胞嘧啶的轉化包括一化學轉化、一酶促轉化或其組合。61.如權利要求1至60中任一項所述的方法,其特征在于:所述模型是在一組對象中進行訓練的,其中在所述一組對象中的一第一部分具有所述疾病狀況,并且在所述一組對象中的一第二部分不具有所述疾病狀況。62.如權利要求1至61中任一項所述的方法,其特征在于:所述模型是一神經網絡算法、一支持向量機算法、一樸素貝葉斯分類器算法、一最鄰近搜索算法、一提升樹算法、一隨機森林算法、一決策樹算法、一多分類邏輯回歸算法或一線性回歸算法。63.如權利要求1至61中任一項所述的方法,其特征在于:所述模型包括:(i)一輸入層,用于接收所述多個基因型特征的多個值,其中所述多個基因型特征包括一第一數量的維度;(ii)一嵌入層,包括一組權重,其中所述嵌入層直接或間接接收所述輸入層的輸出,并且所述嵌入層的一輸出是具有一第二數量的維度的一模型得分集,所述第二數量的維度小于所述第一數量的維度;以及(iii)一輸出層,直接或間接從所述嵌入層接收所述模型得分集,其中所述第一模型得分集是在將所述第一基因型數據結構輸入到所述輸入層時所述嵌入層的所述模型得分集;并且所述第二模型得分集是在將所述第二基因型數據結構輸入到所述輸入層時所述嵌入層的所述模型得分集。64.如權利要求63所述的方法,其特征在于:所述評估(F)包括對照所述多個參考δ得分集通過邏輯回歸訓練使用一邏輯函數來評估所述測試δ得分集,其中所述多個參考δ得分中的每個參考δ得分集是基于以下(i)與(ii)之間的一差異針對在所述多個參考對象中的一相應參考對象:(i)一第一得分集,使用包括所述多個基因型特征的多個值的一第一相應參考基因型數據結構由所述模型的所述嵌入層來提供,所述多個值是使用在一相應第一時間點從所述相應參考對象獲得的一第一相應生物樣本來獲取;以及
    (ii)一第一二得分集,使用包括所述多個基因型特征的多個值的一第二相應基因型數據結構由所述模型的所述嵌入層來提供,所述多個值是使用在不同于所述第一相應時間點的一相應第二時間點從所述相應參考對象獲得的一第二相應生物樣本來獲取。65.如權利要求63或64所述的方法,其特征在于:所述模型是一卷積神經網絡。66.如權利要求63至65中任一項所述的方法,其特征在于:所述多個參考對象...

    【專利技術屬性】
    技術研發人員:M
    申請(專利權)人:格里爾公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产成人综合日韩精品无码| 无码av大香线蕉伊人久久| 中文字幕有码无码AV| 亚洲综合无码一区二区| 狠狠精品干练久久久无码中文字幕| 国产成人无码a区在线视频| 无码一区二区三区在线观看| 久久久久久亚洲精品无码| 久久久久久AV无码免费网站 | 亚洲精品无码午夜福利中文字幕 | 亚洲国产成人无码av在线播放| 无码人妻aⅴ一区二区三区| 日韩精品专区AV无码| 成在人线av无码免费高潮喷水| 人妻丰满熟AV无码区HD| 精品无码av一区二区三区| 亚洲AV永久无码精品| 国产成人无码一区二区在线观看| 亚洲日韩一区二区一无码| 人妻少妇伦在线无码专区视频| 国产精品多人p群无码| 亚洲国产成人精品无码久久久久久综合| 久久精品国产亚洲AV无码偷窥| 国产成人A人亚洲精品无码| 亚洲日韩激情无码一区| 国产日产欧洲无码视频无遮挡| 无码丰满熟妇浪潮一区二区AV| 国产精品无码专区AV在线播放| 中文无码亚洲精品字幕| 少妇精品无码一区二区三区| 久久久久亚洲精品无码系列 | 亚洲精品无码久久久| a级毛片无码免费真人| 国产午夜鲁丝片AV无码免费| 亚洲aⅴ无码专区在线观看春色| 亚洲av中文无码字幕色不卡| 免费看国产成年无码AV片| 精品无码国产污污污免费| 亚洲AⅤ永久无码精品AA| 国产色爽免费无码视频| 久久午夜无码鲁丝片直播午夜精品|