System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及編譯碼,尤其涉及一種dna存儲編譯碼方法、裝置、電子設備及存儲介質。
技術介紹
1、隨著信息量呈指數級增長,新型數據存儲技術的研發成為各行各業的關注焦點。脫氧核糖核酸(dna)分子作為信息的承載體,相較傳統存儲介質,具備多項優勢。其高存儲密度、潛在的低維護成本以及其他突出特點,使其成為信息存儲的理想選擇。dna存儲涉及將數據通過dna編碼算法轉換為dna分子鏈中不同堿基的序列信息,并儲存在相應的存儲載體中。當需要時,可通過特定的dna解碼算法進行讀取,重新生成原始數據。
2、dna編碼在dna存儲中扮演著關鍵的角色,其目標是以盡可能少的堿基序列來無誤地存儲數據信息。dna編碼的質量直接影響存儲性能和數據讀寫的完整性。在dna存儲信息的過程中,包括dna編碼、合成、存儲以及dna測序、解碼,都存在潛在的錯誤風險,可能導致信息損失。為了最大程度地保證信息的無誤讀取,在dna存儲過程中引入相應的糾錯機制,以提高存儲的準確性,利用dna存儲(barcode)庫來識別集合群體中標記的單個生物分子,已經成為當前大規模并行生物醫學實驗中的重要工具。然而,在barcode的合成、實驗過程以及最終的測序中,可能會出現錯誤,例如核苷酸替換、插入和刪除等意外情況。因此,為了從混亂(錯誤)版本的存儲中恢復原始的碼字,研究者們希望利用糾錯碼的技術,而無需將每個可能的錯誤讀取與庫中的每個已知碼字逐一比較。這樣的糾錯碼機制可以提高存儲識別的準確性,使得恢復原始碼字成為可能。
3、rs(reed-solomon)碼是目前在
4、rs碼采用的是一種多項式編碼的方法,通過在原始數據中添加一些冗余信息來實現錯誤的檢測和糾正,其基本原理是將數據看作是一個多項式,并對該多項式進行編碼。編碼過程中,通過使用離散數學中的有限域運算,將數據多項式轉換為一組糾錯碼字。糾錯碼字包含了原始數據和一些額外的冗余信息。在接收端,通過對接收到的數據進行解碼和糾正操作,可以恢復原始的數據。為了實現較高的糾錯能力,rs碼引入了較多的冗余信息,這導致了數據存儲或傳輸的開銷增加,較高的冗余度會占用更多的存儲空間,rs碼的編碼和解碼過程相對復雜,需要進行多項式運算和有限域的操作,這對于實現高效的編碼和解碼算法提出了一定的挑戰,尤其是在資源受限的環境下,導致編碼以及解碼的效率及準確度較差。
技術實現思路
1、本專利技術提供一種dna存儲編譯碼方法、裝置、電子設備及存儲介質,其主要目的在于解決相關技術中提供的dna存儲編譯碼方式的準確性較差的問題。
2、為實現上述目的,本專利技術提供的一種dna存儲編譯碼方法,包括:獲取待編碼數據,對待編碼數據進行信息填充,得到目標二進制序列;對目標二進制序列進行編碼、映射,得到待編碼數據對應的dna堿基序列;根據dna堿基序列識別待編碼數據的編碼錯誤模式;根據編碼錯誤模式選取對應的譯碼算法對dna堿基序列進行譯碼,得到譯碼數據。
3、本專利技術還提供一種dna存儲編譯碼裝置,包括:信息填充模塊,用于獲取待編碼數據,對待編碼數據進行信息填充,得到目標二進制序列;編碼映射模塊,用于對目標二進制序列進行編碼、映射,得到待編碼數據對應的dna堿基序列;編碼錯誤模式識別模塊,用于根據dna堿基序列識別待編碼數據的編碼錯誤模式;dna堿基序列譯碼模塊,用于根據編碼錯誤模式選取對應的譯碼算法對dna堿基序列進行譯碼,得到譯碼數據。
4、本專利技術還提供一種電子設備,包括:與至少一個處理器通信連接的存儲器;其中,處理器用于執行存儲在存儲器上的計算機程序;存儲器存儲有可被至少一個處理器執行的計算機程序,計算機程序被至少一個處理器執行,以使至少一個處理器能夠執行上述的一種dna存儲編譯碼方法。
5、本專利技術還提供一種計算機可讀存儲介質,存儲有計算機程序,該計算機程序被處理器執行時,實現上述任意一項的dna存儲編譯碼方法。
6、本專利技術實施例通過對待編碼數據進行信息填充,可以使得待編碼數據的長度滿足極化碼的長度要求,進而實現自適應長度的dna存儲設計,有利于提高后續編碼的效率及精確度;對目標二進制序列進行編碼、映射,可以得到編碼后的dna堿基序列;識別dna堿基序列對應的編碼錯誤模式進行譯碼,可以在譯碼時通過其中一個出錯的比特的位置可以確定另一個出錯的比特的位置,進一步減小了譯碼的復雜度,同時可以通過不同的編碼錯誤模式可以有效地提高譯碼的準確度,實現對待編碼數據的無損編譯。因此本專利技術提出的一種dna存儲編譯碼方法、裝置、電子設備及存儲介質,可以解決dna存儲編譯碼的準確性較差的問題,同時實現任意長度的dna存儲編碼。
本文檔來自技高網...【技術保護點】
1.一種DNA存儲編譯碼方法,其特征在于,所述方法包括:
2.如權利要求1所述的一種DNA存儲編譯碼方法,其特征在于,所述對所述待編碼數據進行信息填充,得到目標二進制序列,包括:
3.如權利要求2所述的一種DNA存儲編譯碼方法,其特征在于,所述利用預設的凍結比特信息對所述二進制序列進行信息填充,得到目標二進制序列,包括:
4.如權利要求1所述的一種DNA存儲編譯碼方法,其特征在于,所述對所述目標二進制序列進行編碼、映射,得到所述待編碼數據對應的DNA堿基序列,包括:
5.如權利要求4所述的一種DNA存儲編譯碼方法,其特征在于,所述計算所述目標二進制序列對應的極化碼生成矩陣,包括:
6.如權利要求5所述的一種DNA存儲編譯碼方法,其特征在于,所述根據所述置換矩陣及所述數據碼長生成極化碼生成矩陣,包括:
7.如權利要求1所述的一種DNA存儲編譯碼方法,其特征在于,所述根據所述DNA堿基序列識別所述待編碼數據的編碼錯誤模式,包括:
8.一種DNA存儲編譯碼裝置,其特征在于,所述裝置包括:
9
10.一種計算機可讀存儲介質,存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時,實現權利要求1至7中任意一項所述的DNA存儲編譯碼方法。
...【技術特征摘要】
1.一種dna存儲編譯碼方法,其特征在于,所述方法包括:
2.如權利要求1所述的一種dna存儲編譯碼方法,其特征在于,所述對所述待編碼數據進行信息填充,得到目標二進制序列,包括:
3.如權利要求2所述的一種dna存儲編譯碼方法,其特征在于,所述利用預設的凍結比特信息對所述二進制序列進行信息填充,得到目標二進制序列,包括:
4.如權利要求1所述的一種dna存儲編譯碼方法,其特征在于,所述對所述目標二進制序列進行編碼、映射,得到所述待編碼數據對應的dna堿基序列,包括:
5.如權利要求4所述的一種dna存儲編譯碼方法,其特征在于,所述計算所述目標二進...
【專利技術屬性】
技術研發人員:劉凌,林瑞浩,李金升,朱澤軒,陳毓新,張勇,李勝康,
申請(專利權)人:深圳大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。