System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本公開涉及時(shí)間序列分類領(lǐng)域,更具體地,涉及用于對(duì)納米孔測序時(shí)間序列電信號(hào)進(jìn)行分類的方法和設(shè)備以及用于對(duì)分類模型進(jìn)行訓(xùn)練的方法和設(shè)備。
技術(shù)介紹
1、大多數(shù)達(dá)到最先進(jìn)精度的時(shí)間序列分類方法都有很高的計(jì)算復(fù)雜度,即使是較小的數(shù)據(jù)集也需要大量的訓(xùn)練時(shí)間,而對(duì)于較大的數(shù)據(jù)集的計(jì)算時(shí)間是無法接受的。此外,許多現(xiàn)有的方法集中在單一類型的特征上,如形狀或頻率。
2、因此,本公開提出了直接基于時(shí)序信號(hào)進(jìn)行序列分類任務(wù),可以省略許多中間過程,極大提高了效率。
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)本公開的實(shí)施例,將測序結(jié)果的分類問題,提前到處理時(shí)序信號(hào)階段即可解決的問題,并且應(yīng)用先進(jìn)的時(shí)間序列分類算法multirocket獲得了很高的效率和極高的準(zhǔn)確率,從納米孔測序時(shí)間序列電信號(hào)中分離出干凈的測序信號(hào)。
2、具體地,本公開的實(shí)施例提供了一種用于對(duì)納米孔測序時(shí)間序列電信號(hào)進(jìn)行分類的方法和設(shè)備。
3、本公開的一個(gè)方面提供了一種用于對(duì)納米孔測序時(shí)間序列電信號(hào)進(jìn)行分類的方法,所述方法包括:獲取納米孔測序時(shí)間序列電信號(hào);從所述納米孔測序時(shí)間序列電信號(hào)中分離出測序信號(hào);對(duì)所述測序信號(hào)進(jìn)行特征提取,以獲得特征值,所述特征值包括正值的比例ppv、正值的平均值mpv、正值索引的平均值mipv和正值連續(xù)出現(xiàn)的最大個(gè)數(shù)lspv中的至少一項(xiàng);以及將所獲得的特征值輸入線性分類模型,以對(duì)所述測序信號(hào)進(jìn)行分類。
4、根據(jù)本公開的實(shí)施例,所述從所述納米孔測序時(shí)間序列電信號(hào)中分離出測序信號(hào)包括:根據(jù)所
5、根據(jù)本公開的實(shí)施例,所述根據(jù)所述納米孔測序時(shí)間序列電信號(hào)的信號(hào)值確定點(diǎn)組包括:從所述納米孔測序時(shí)間序列電信號(hào)中逐個(gè)獲取當(dāng)前信號(hào)點(diǎn)的信號(hào)值;根據(jù)所述當(dāng)前信號(hào)點(diǎn)的信號(hào)值計(jì)算所述當(dāng)前信號(hào)點(diǎn)的第一擬合均值;根據(jù)所述當(dāng)前信號(hào)點(diǎn)的信號(hào)值和所述當(dāng)前信號(hào)點(diǎn)的第一擬合均值計(jì)算所述當(dāng)前信號(hào)點(diǎn)的第一擬合方差;根據(jù)所述當(dāng)前信號(hào)點(diǎn)的擬合均值和所述當(dāng)前信號(hào)點(diǎn)的第一擬合方差計(jì)算所述當(dāng)前信號(hào)點(diǎn)的起始點(diǎn)閾值和所述當(dāng)前信號(hào)點(diǎn)的結(jié)束點(diǎn)閾值;根據(jù)所述當(dāng)前信號(hào)點(diǎn)的起始點(diǎn)閾值確定所述當(dāng)前信號(hào)點(diǎn)是否為所述點(diǎn)組的起始點(diǎn),和/或根據(jù)所述當(dāng)前信號(hào)點(diǎn)的結(jié)束點(diǎn)閾值確定所述當(dāng)前信號(hào)點(diǎn)是否為所述點(diǎn)組的結(jié)束點(diǎn)。
6、根據(jù)本公開的實(shí)施例,所述方法還包括:對(duì)所述測序信號(hào)進(jìn)行過濾和/或切除異常信號(hào)。
7、根據(jù)本公開的實(shí)施例,還包括:通過multirocket算法對(duì)所述測序信號(hào)進(jìn)行特征提取。
8、根據(jù)本公開的實(shí)施例,所述線性分類模型是嶺回歸模型。
9、根據(jù)本公開的實(shí)施例,還包括對(duì)所述特征提取和所述線性分類模型進(jìn)行訓(xùn)練,其中,所述訓(xùn)練包括:對(duì)測序信號(hào)進(jìn)行標(biāo)注,以生成訓(xùn)練數(shù)據(jù);迭代地對(duì)所述訓(xùn)練數(shù)據(jù)進(jìn)行特征提取并將所提取的特征值輸入所述線性分類模型進(jìn)行分類,使得分類結(jié)果匹配標(biāo)注結(jié)果;以及存儲(chǔ)所述線性分類模型以及特征提取中使用的參數(shù)。
10、根據(jù)本公開的實(shí)施例,所述標(biāo)注還包括:將所述測序信號(hào)轉(zhuǎn)換為堿基序列;針對(duì)每條堿基序列,截取前m個(gè)堿基和后n個(gè)堿基,以基于預(yù)定規(guī)則與對(duì)應(yīng)的條形碼barcode進(jìn)行比對(duì)算分,其中,m和n是大于0的自然數(shù);以及將barcode比對(duì)得分超過預(yù)定分?jǐn)?shù)的測序信號(hào)打上對(duì)應(yīng)的barcode標(biāo)簽。
11、本公開的一個(gè)方面提供了一種用于對(duì)納米孔測序時(shí)間序列電信號(hào)進(jìn)行分類的設(shè)備,所述設(shè)備包括處理電路以及存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)指令,所述指令在由所述處理電路執(zhí)行時(shí),使所述設(shè)備執(zhí)行上述用于對(duì)納米孔測序時(shí)間序列電信號(hào)進(jìn)行分類的方法。
12、本公開的一個(gè)方面提供了一種用于對(duì)分類模型進(jìn)行訓(xùn)練的設(shè)備,所述設(shè)備包括處理電路以及存儲(chǔ)器,所述處理器存儲(chǔ)指令,所述指令在由所述處理電路執(zhí)行時(shí),使所述設(shè)備執(zhí)行上述對(duì)分類模型進(jìn)行訓(xùn)練的方法。
13、本公開的一個(gè)方面一種存儲(chǔ)計(jì)算機(jī)程序的非暫時(shí)性計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)程序包括指令,所述指令在由處理電路執(zhí)行時(shí),使所述處理電路執(zhí)行本文公開的任何方法。
14、根據(jù)本公開的實(shí)施例,本公開可以從納米孔測序時(shí)間序列電信號(hào)中分離出干凈的測序信號(hào),有效提高納米孔測序信號(hào)分類的準(zhǔn)確率及效率,并且對(duì)于特征不斷變化的場景具有較好的適應(yīng)性。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種用于對(duì)納米孔測序時(shí)間序列電信號(hào)進(jìn)行分類的方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,所述從所述納米孔測序時(shí)間序列電信號(hào)中分離出測序信號(hào)包括:
3.根據(jù)權(quán)利要求2所述的方法,所述根據(jù)所述納米孔測序時(shí)間序列電信號(hào)的信號(hào)值確定點(diǎn)組包括:
4.根據(jù)權(quán)利要求1所述的方法,還包括:
5.根據(jù)權(quán)利要求1所述的方法,還包括:通過MultiRocket算法對(duì)所述測序信號(hào)進(jìn)行特征提取。
6.根據(jù)權(quán)利要求1所述的方法,其中,所述線性分類模型是嶺回歸模型。
7.根據(jù)權(quán)利要求1所述的方法,還包括對(duì)所述特征提取和所述線性分類模型進(jìn)行訓(xùn)練,其中,所述訓(xùn)練包括:
8.根據(jù)權(quán)利要求7所述的方法,所述標(biāo)注包括:
9.一種用于對(duì)納米孔測序時(shí)間序列電信號(hào)進(jìn)行分類的設(shè)備,所述設(shè)備包括:
10.一種存儲(chǔ)計(jì)算機(jī)程序的非暫時(shí)性計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)程序包括指令,所述指令在由處理電路執(zhí)行時(shí),使所述處理電路執(zhí)行根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法。
【技術(shù)特征摘要】
1.一種用于對(duì)納米孔測序時(shí)間序列電信號(hào)進(jìn)行分類的方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,所述從所述納米孔測序時(shí)間序列電信號(hào)中分離出測序信號(hào)包括:
3.根據(jù)權(quán)利要求2所述的方法,所述根據(jù)所述納米孔測序時(shí)間序列電信號(hào)的信號(hào)值確定點(diǎn)組包括:
4.根據(jù)權(quán)利要求1所述的方法,還包括:
5.根據(jù)權(quán)利要求1所述的方法,還包括:通過multirocket算法對(duì)所述測序信號(hào)進(jìn)行特征提取。
6.根據(jù)權(quán)利要求1所述...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:黎宇翔,吳逵,李甫強(qiáng),李慧敏,
申請(qǐng)(專利權(quán))人:中國科學(xué)院基礎(chǔ)醫(yī)學(xué)與腫瘤研究所籌,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。