System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 久久无码AV中文出轨人妻,精品久久久无码人妻字幂,久久亚洲AV无码精品色午夜麻豆
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    群體基因組變異數(shù)據(jù)處理方法、裝置及電子設備制造方法及圖紙

    技術(shù)編號:43753766 閱讀:14 留言:0更新日期:2024-12-20 13:10
    本公開提出一種群體基因組變異數(shù)據(jù)處理方法、裝置、電子設備及存儲介質(zhì),該方法包括:獲取多個染色體變異數(shù)據(jù)樣本,根據(jù)多個群體來源標識信息,確定多個染色體變異數(shù)據(jù)樣本對應的區(qū)間劃分模式,根據(jù)區(qū)間劃分模式分別對各個染色體變異數(shù)據(jù)樣本進行劃分,以得到各個染色體變異數(shù)據(jù)樣本對應的多個變異數(shù)據(jù)片段,基于變異數(shù)據(jù)過濾參數(shù)處理多個變異數(shù)據(jù)片段,得到目標群體基因組變異數(shù)據(jù)。通過本公開,能夠基于將染色體變異數(shù)據(jù)樣本的群體來源,將染色體變異數(shù)據(jù)樣本的變異數(shù)據(jù)過濾任務分為數(shù)據(jù)處理量均衡的多個子任務,對多個子任務進行并行處理,從而可以避免存在子任務拖尾現(xiàn)象而造成運行等待,從而有效節(jié)省計算資源和提升數(shù)據(jù)處理速度。

    【技術(shù)實現(xiàn)步驟摘要】

    本公開涉及生物信息處理,尤其涉及一種群體基因組變異數(shù)據(jù)處理方法、裝置、電子設備及存儲介質(zhì)。


    技術(shù)介紹

    1、當前,變異質(zhì)量值重校正(variant?quality?score?recalibration,vqsr)是群體基因組學研究的一個關(guān)鍵環(huán)節(jié),通過機器學習的方法利用多個不同的數(shù)據(jù)特征訓練一個高斯混合模型對變異數(shù)據(jù)進行質(zhì)控,以區(qū)分基因組變異數(shù)據(jù)中的“好”變異和“壞”變異,過濾得到高質(zhì)量的變異數(shù)據(jù)。

    2、相關(guān)技術(shù)中,通常是采用重測序數(shù)據(jù)分析工具(the?genome?analysis?toolkit,gatk)運算模式直接進行群體基因組分析。

    3、這種方式下,當基因組數(shù)據(jù)規(guī)模上升到萬人或十萬人規(guī)模時,處理群體基因組vqsr時容易存在超大型群體基因組分析難以實施,以及耗時超長的問題。


    技術(shù)實現(xiàn)思路

    1、本公開旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。

    2、為此,本公開的目的在于提出一種群體基因組變異數(shù)據(jù)處理方法、裝置、電子設備、存儲介質(zhì)及計算機程序產(chǎn)品。

    3、本公開第一方面實施例提出一種群體基因組變異數(shù)據(jù)處理方法,包括:獲取多個染色體變異數(shù)據(jù)樣本,其中,所述染色體變異數(shù)據(jù)樣本具有對應的群體來源標識信息;根據(jù)多個所述群體來源標識信息,確定所述多個染色體變異數(shù)據(jù)樣本對應的區(qū)間劃分模式;根據(jù)所述區(qū)間劃分模式分別對各個所述染色體變異數(shù)據(jù)樣本進行劃分,以得到各個所述染色體變異數(shù)據(jù)樣本對應的多個變異數(shù)據(jù)片段;基于變異數(shù)據(jù)過濾參數(shù)處理所述多個變異數(shù)據(jù)片段,得到所述目標群體基因組變異數(shù)據(jù)。

    4、本公開第二方面實施例提出一種群體基因組變異數(shù)據(jù)處理裝置,包括:獲取模塊,用于獲取多個染色體變異數(shù)據(jù)樣本,其中,所述染色體變異數(shù)據(jù)樣本具有對應的群體來源標識信息;確定模塊,用于根據(jù)多個所述群體來源標識信息,確定所述多個染色體變異數(shù)據(jù)樣本對應的區(qū)間劃分模式;第一處理模塊,用于根據(jù)所述區(qū)間劃分模式分別對各個所述染色體變異數(shù)據(jù)樣本進行劃分,以得到各個所述染色體變異數(shù)據(jù)樣本對應的多個變異數(shù)據(jù)片段;第二處理模塊,用于基于變異數(shù)據(jù)過濾參數(shù)處理所述多個變異數(shù)據(jù)片段,得到所述目標群體基因組變異數(shù)據(jù)。

    5、本公開第三方面實施例提出了一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,處理器執(zhí)行程序時,實現(xiàn)如本公開第一方面實施例提出的群體基因組變異數(shù)據(jù)處理方法。

    6、本公開第四方面實施例提出了一種非臨時性計算機可讀存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)如本公開第一方面實施例提出的群體基因組變異數(shù)據(jù)處理方法。

    7、本公開第五方面實施例提出了一種計算機程序產(chǎn)品,當計算機程序產(chǎn)品中的指令由處理器執(zhí)行時,執(zhí)行如本公開第一方面實施例提出的群體基因組變異數(shù)據(jù)處理方法。

    8、本公開實施例中提出的群體基因組變異數(shù)據(jù)處理方法、裝置、電子設備、存儲介質(zhì)及計算機程序產(chǎn)品,至少可以包括以下有益效果:通過獲取多個染色體變異數(shù)據(jù)樣本,其中,染色體變異數(shù)據(jù)樣本具有對應的群體來源標識信息,根據(jù)多個群體來源標識信息,確定多個染色體變異數(shù)據(jù)樣本對應的區(qū)間劃分模式,根據(jù)區(qū)間劃分模式分別對各個染色體變異數(shù)據(jù)樣本進行劃分,以得到各個染色體變異數(shù)據(jù)樣本對應的多個變異數(shù)據(jù)片段,基于變異數(shù)據(jù)過濾參數(shù)處理多個變異數(shù)據(jù)片段,得到目標群體基因組變異數(shù)據(jù),能夠基于將染色體變異數(shù)據(jù)樣本的群體來源,將染色體變異數(shù)據(jù)樣本的變異數(shù)據(jù)過濾任務分為數(shù)據(jù)處理量均衡的多個子任務,對多個子任務進行并行處理,從而可以避免存在子任務拖尾現(xiàn)象而造成運行等待,從而有效節(jié)省計算資源和提升數(shù)據(jù)處理速度。

    9、本公開附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本公開的實踐了解到。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.一種群體基因組變異數(shù)據(jù)處理方法,其特征在于,包括:

    2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)多個所述群體來源標識信息,確定所述多個染色體變異數(shù)據(jù)樣本對應的區(qū)間劃分模式,包括:

    3.如權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述比對結(jié)果,確定所述區(qū)間劃分模式,包括:

    4.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述區(qū)間劃分模式分別對各個所述染色體變異數(shù)據(jù)樣本進行劃分,以得到各個所述染色體變異數(shù)據(jù)樣本對應的多個變異數(shù)據(jù)片段,包括:

    5.如權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述參考位點數(shù)量和變異位點密度信息分別對各個所述染色體變異數(shù)據(jù)樣本進行劃分,以得到各個所述染色體變異數(shù)據(jù)樣本對應的多個變異數(shù)據(jù)片段,包括:

    6.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述參考位點數(shù)量和所述變異位點密度信息,確定各個所述變異數(shù)據(jù)片段在所述染色體變異數(shù)據(jù)樣本上的目標區(qū)間信息,包括:

    7.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述參考位點數(shù)量和所述變異位點密度信息,確定各個所述變異數(shù)據(jù)片段在所述染色體變異數(shù)據(jù)樣本上的目標區(qū)間信息,還包括:

    8.如權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述參考位點數(shù)量和等位基因密度信息分別對各個所述染色體變異數(shù)據(jù)樣本進行劃分,以得到各個所述染色體變異數(shù)據(jù)樣本對應的多個變異數(shù)據(jù)片段,包括:

    9.如權(quán)利要求8所述的方法,其特征在于,所述根據(jù)所述參考位點數(shù)量和所述等位基因密度信息,確定各個所述變異數(shù)據(jù)片段在所述染色體變異數(shù)據(jù)樣本上的目標區(qū)間信息,包括:

    10.如權(quán)利要求8所述的方法,其特征在于,所述根據(jù)所述參考位點數(shù)量和所述等位基因密度信息,確定各個所述變異數(shù)據(jù)片段在所述染色體變異數(shù)據(jù)樣本上的目標區(qū)間信息,還包括:

    11.如權(quán)利要求1所述的方法,其特征在于,所述基于變異數(shù)據(jù)過濾參數(shù)處理所述多個變異數(shù)據(jù)片段,得到所述目標群體基因組變異數(shù)據(jù),包括:

    12.一種群體基因組變異數(shù)據(jù)處理裝置,其特征在于,包括:

    13.一種電子設備,其特征在于,包括:

    14.一種計算機可讀存儲介質(zhì),其特征在于,其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-11中任一項所述方法。

    ...

    【技術(shù)特征摘要】

    1.一種群體基因組變異數(shù)據(jù)處理方法,其特征在于,包括:

    2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)多個所述群體來源標識信息,確定所述多個染色體變異數(shù)據(jù)樣本對應的區(qū)間劃分模式,包括:

    3.如權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述比對結(jié)果,確定所述區(qū)間劃分模式,包括:

    4.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述區(qū)間劃分模式分別對各個所述染色體變異數(shù)據(jù)樣本進行劃分,以得到各個所述染色體變異數(shù)據(jù)樣本對應的多個變異數(shù)據(jù)片段,包括:

    5.如權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述參考位點數(shù)量和變異位點密度信息分別對各個所述染色體變異數(shù)據(jù)樣本進行劃分,以得到各個所述染色體變異數(shù)據(jù)樣本對應的多個變異數(shù)據(jù)片段,包括:

    6.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述參考位點數(shù)量和所述變異位點密度信息,確定各個所述變異數(shù)據(jù)片段在所述染色體變異數(shù)據(jù)樣本上的目標區(qū)間信息,包括:

    7.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述參考位點數(shù)量和所述變異位點密度信息,確定各個所述變異數(shù)據(jù)片段在所述染色體...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:唐靜波鐘子寅謝寅龍
    申請(專利權(quán))人:深圳華大智造科技股份有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产精品午夜无码av体验区| 精品人妻系列无码天堂| 亚洲VA中文字幕无码一二三区| 午夜爽喷水无码成人18禁三级| 一本天堂ⅴ无码亚洲道久久| 久久精品无码精品免费专区| 亚洲日韩精品A∨片无码加勒比| 少妇人妻无码精品视频app| 久久国产精品无码网站| 无码精品国产一区二区三区免费| 国产精品无码av天天爽| 亚洲国产精品无码久久久秋霞1| 国产做无码视频在线观看| 亚洲国产成人无码AV在线| 免费无码毛片一区二区APP| 东京热人妻无码一区二区av| 色综合色国产热无码一| 人妻AV中出无码内射| 国外AV无码精品国产精品| 精品无码成人片一区二区98| 中文人妻无码一区二区三区| 亚洲美日韩Av中文字幕无码久久久妻妇| 免费看国产成年无码AV片| 日韩精品无码Av一区二区| 无码任你躁久久久久久老妇App| 亚洲va中文字幕无码| 无码午夜人妻一区二区不卡视频| 无码午夜人妻一区二区不卡视频| 无码人妻一区二区三区免费视频| 国产羞羞的视频在线观看 国产一级无码视频在线| 精品少妇人妻av无码久久| 曰批全过程免费视频在线观看无码| 国产精品无码一区二区三区毛片| 中文有无人妻vs无码人妻激烈| 国产色综合久久无码有码| 久久无码AV中文出轨人妻| 少妇无码太爽了不卡在线观看| 国产精品无码久久综合| 亚洲AV无码乱码国产麻豆穿越| av色欲无码人妻中文字幕| 国产精品亚韩精品无码a在线|