本申請公開了一種測序數據的處理方法及裝置。該方法包括:獲取待檢測基因組的測序數據,并確定待檢測基因組的測序數據中產生的至少一個位點,其中,至少一個位點包括突變位點和/或不突變位點;驗證待檢測基因組的測序數據中產生的位點的基因型可靠程度,并輸出位點的基因型可靠程度;基于位點的基因型可靠程度,對位點進行可信性標記。通過本申請,解決了相關技術中采用人工篩選的方式來驗證二代測序產生的變異信息,導致驗證效率低、時間周期長、成本高的技術問題。
【技術實現步驟摘要】
測序數據的處理方法及裝置
本申請涉及基因測序
,具體而言,涉及一種測序數據的處理方法及裝置。
技術介紹
隨著二代測序的普及,產生了大量的人基因組數據,通過對基因組數據進行分析,從而推進了疾病研究的進展,解決了部分疑難雜癥,造福了部分遺傳病患者。而如何判別二代測序產生的變異信息的準確性,是獲得準確可靠的基因分析成果的至關重要的一步。需要說明的是,基因組數據分析會獲得大量突變,以一個30測序數據的處理方法及裝置的全基因組測序數據為例,其能檢測得到300M-400M的突變,包括單核苷酸多態性突變(SNP),插入缺失突變(InDel)。科研工作者往往需要在檢測的結果中,去獲取與研究目標相關的突變,并進行驗證,該過程涉及到判斷位點的準確性,需要先確定可靠,再進行驗證,SNP一般假陽性在10%左右,而InDel的假陽性能達到20%以上。位點較少的時候一般是先用IGV人工判斷,而樣本或者位點較多的時候,或者需要判斷樣本間的基因型關系是否真實的與研究目標相符的時候,使用IGV判斷工作量巨大,甚至難以實現判斷目標。如何解決二代測序位點的準確性驗證的不便利性,包括人工驗證,或者實驗驗證的不方便,周期長,成本高等問題,是亟待解決的問題。針對相關技術中采用人工篩選的方式來驗證二代測序產生的變異信息,導致驗證效率低、時間周期長、成本高的技術問題,目前尚未提出有效的解決方案。
技術實現思路
本申請提供一種測序數據的處理方法及裝置,以解決相關技術中采用人工篩選的方式來驗證二代測序產生的變異信息,導致驗證效率低、時間周期長、成本高的技術問題。根據本申請的一個方面,提供了一種測序數據的處理方法。該方法包括:獲取待檢測基因組的測序數據,并確定待檢測基因組的測序數據中產生的至少一個位點,其中,至少一個位點包括突變位點和/或不突變位點;驗證待檢測基因組的測序數據中產生的位點的基因型可靠程度,并輸出位點的基因型可靠程度;基于位點的基因型可靠程度,對位點進行可信性標記。可選地,獲取待檢測基因組的測序數據,并確定待檢測基因組的測序數據中產生的至少一個位點包括:獲取參考基因組的測序數據,并基于參考基因組的測序數據的位點順序轉換待檢測基因組的測序數據,得到目標形式的測序數據;獲取至少一個待判讀的目標位點的基因組位置信息,并基于目標位點的基因組位置信息在目標形式的測序數據中確定至少一個位點。可選地,驗證待檢測基因組的測序數據中產生的位點的基因型可靠程度,并輸出位點的基因型可靠程度包括:在產生的點位為突變點位的情況下,判斷突變點位是否滿足第一預設條件,并在突變點位滿足第一預設條件時,確定突變點位的基因型可靠程度為可信;在產生的點位為不突變點位的情況下,判斷不突變點位是否滿足第二預設條件,并在不突變點位滿足第二預設條件時,確定不突變點位的基因型可靠程度為可信。可選地,判斷突變點位是否滿足第一預設條件包括:判斷突變位點的覆蓋深度是否大于預設深度,判斷突變位點是否存在鏈偏好性,并判斷待檢測基因組的測序數據中的突變的堿基是否不小于預設比例;在突變位點的覆蓋深度大于預設深度,突變位點不存在鏈偏好性,且待檢測基因組的測序數據中的突變的堿基不小于預設比例的情況下,確定突變位點滿足第一預設條件。可選地,判斷不突變點位是否滿足第二預設條件包括:判斷不突變位點的覆蓋深度是否大于預設深度,并判斷待檢測基因組的測序數據中的突變的堿基是否小于預設比例;對于不突變點位,在不突變位點的覆蓋深度大于預設深度,且待檢測基因組的測序數據中的突變的堿基小于預設比例的情況下,判斷不突變位點的上下游的預設對堿基序列中是否存在可信的插入缺失突變位點;在不突變位點的上下游的預設對堿基序列中不存在可信的插入缺失突變位點的情況下,確定不突變位點的基因型可靠程度為可信。可選地,基于位點的基因型可靠程度,對位點進行可信性標記包括:在待檢測的基因組中的測序數據為單樣本的情況下,如果單樣本的位點的基因型可靠程度為可信,則標記位點為可信的位點。可選地,基于位點的基因型可靠程度,對產生的位點進行可信性標記包括:在待檢測基因組的測序數據為多樣本的情況下,基于多樣本之間的關系以及位點的基因型可靠程度對位點進行可信性標記。可選地,基于多樣本之間的關系以及位點的基因型可靠程度對位點進行可信性標記包括:在判定單樣本中的位點的基因型可靠程度為可信的情況下判定結果,基于多樣本之間的關系信息驗證判定結果是否正確;在判定結果正確的情況下,則標記位點為可信。根據本申請的另一方面,提供了一種測序數據的處理裝置。該裝置包括:獲取單元,用于獲取待檢測基因組的測序數據,并確定待檢測基因組的測序數據中產生的至少一個位點,其中,至少一個位點包括突變位點和/或不突變位點;驗證單元,用于驗證待檢測基因組的測序數據中產生的位點的基因型可靠程度,并輸出位點的基因型可靠程度;標記單元,用于基于位點的基因型可靠程度,對位點進行可信性標記。根據本專利技術實施例的另一方面,還提供了一種非易失性存儲介質,非易失性存儲介質包括存儲的程序,其中,程序運行時控制非易失性存儲介質所在的設備執行一種測序數據的處理方法。根據本專利技術實施例的另一方面,還提供了一種電子裝置,包含處理器和存儲器;存儲器中存儲有計算機可讀指令,處理器用于運行計算機可讀指令,其中,計算機可讀指令運行時執行一種測序數據的處理方法。通過本申請,采用以下步驟:獲取待檢測基因組的測序數據,并確定待檢測基因組的測序數據中產生的至少一個位點,其中,至少一個位點包括突變位點和/或不突變位點;驗證待檢測基因組的測序數據中產生的位點的基因型可靠程度,并輸出位點的基因型可靠程度;基于位點的基因型可靠程度,對位點進行可信性標記,解決了相關技術中采用人工篩選的方式來驗證二代測序產生的變異信息,導致驗證效率低、時間周期長、成本高的技術問題。進而達到了提高變異信息的驗證效率和驗證準確性的效果。附圖說明構成本申請的一部分的附圖用來提供對本申請的進一步理解,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:圖1是根據本申請實施例提供的測序數據的處理方法的流程圖;圖2是根據本申請實施例提供的另一種測序數據的處理方法的流程圖;以及圖3是根據本申請實施例提供的測序數據的處理裝置的示意圖。具體實施方式需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。為了使本
的人員更好地理解本申請方案,下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分的實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本申請保護的范圍。需要說明的是,本申請的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區別類似的對象,而不必用于描述特定本文檔來自技高網...
【技術保護點】
1.一種測序數據的處理方法,其特征在于,包括:/n獲取待檢測基因組的測序數據,并確定所述待檢測基因組的測序數據中產生的至少一個位點,其中,所述至少一個位點包括突變位點和/或不突變位點;/n驗證所述待檢測基因組的測序數據中產生的位點的基因型可靠程度,并輸出所述位點的基因型可靠程度;/n基于所述位點的基因型可靠程度,對所述位點進行可信性標記。/n
【技術特征摘要】
1.一種測序數據的處理方法,其特征在于,包括:
獲取待檢測基因組的測序數據,并確定所述待檢測基因組的測序數據中產生的至少一個位點,其中,所述至少一個位點包括突變位點和/或不突變位點;
驗證所述待檢測基因組的測序數據中產生的位點的基因型可靠程度,并輸出所述位點的基因型可靠程度;
基于所述位點的基因型可靠程度,對所述位點進行可信性標記。
2.根據權利要求1所述的方法,其特征在于,獲取待檢測基因組的測序數據,并確定所述待檢測基因組的測序數據中產生的至少一個位點包括:
獲取參考基因組的測序數據,并基于所述參考基因組的測序數據的位點順序轉換所述待檢測基因組的測序數據,得到目標形式的測序數據;
獲取至少一個待判讀的目標位點的基因組位置信息,并基于所述目標位點的基因組位置信息在所述目標形式的測序數據中確定至少一個位點。
3.根據權利要求1所述的方法,其特征在于,驗證所述待檢測基因組的測序數據中產生的位點的基因型可靠程度,并輸出所述位點的基因型可靠程度包括:
在產生的點位為突變點位的情況下,判斷所述突變點位是否滿足第一預設條件,并在所述突變點位滿足所述第一預設條件時,確定所述突變點位的基因型可靠程度為可信;
在產生的點位為不突變點位的情況下,判斷所述不突變點位是否滿足第二預設條件,并在所述不突變點位滿足所述第二預設條件時,確定所述不突變點位的基因型可靠程度為可信。
4.根據權利要求3所述的方法,其特征在于,判斷所述突變點位是否滿足第一預設條件包括:
判斷所述突變位點的覆蓋深度是否大于預設深度,判斷所述突變位點是否存在鏈偏好性,并判斷所述待檢測基因組的測序數據中的突變的堿基是否不小于預設比例;
在所述突變位點的覆蓋深度大于所述預設深度,所述突變位點不存在鏈偏好性,且所述待檢測基因組的測序數據中的突變的堿基不小于所述預設比例的情況下,確定所述突變位點滿足所述第一預設條件。
5.根據權利要求3所述的方法,其特征在于,判斷所述不突變點位是否滿足第二預設條件包括:
判斷所述不突變位點的覆蓋深度是否大于預設深度,并判斷所述待檢測基因組的測序數據中的突變的堿基是否小于預設比例;
對于不突變點位,在所述不突變位點的覆蓋深度大...
【專利技術屬性】
技術研發人員:余歡,江文愷,吳俊,李瑞強,
申請(專利權)人:天津諾禾醫學檢驗所有限公司,
類型:發明
國別省市:天津;12
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。