System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及信息技術(shù)服務,尤其涉及的是一種基于去相關(guān)統(tǒng)計學習的基因檢測方法及基因檢測裝置。
技術(shù)介紹
1、異戊二烯類化合物(又稱為萜類化合物)是一類廣泛存在于動植物和微生物中的有機化合物。這種化合物是由5個碳單位(異戊二烯單元)構(gòu)成的,具有多種生物學功能,例如,參與植物的激素調(diào)控、代謝過程、細胞信號傳導、防御機制等。在實際應用中,通過研究異戊二烯生物合成相關(guān)的酶的基因來揭示異戊二烯類化合物在不同生物過程中的作用。編碼與異戊二烯生物合成相關(guān)的酶的基因被稱為異戊二烯類基因。
2、在現(xiàn)代生物醫(yī)學研究中,通過研究異戊二烯類基因的表達水平來研究以下幾種能力:
3、1)植物響應環(huán)境脅迫:異戊二烯類化合物在植物的抗逆性、病蟲害防御中起重要作用,研究其基因表達水平可以幫助理解植物如何應對環(huán)境壓力;
4、2)代謝調(diào)控:通過基因表達值可以研究異戊二烯途徑中關(guān)鍵酶的調(diào)控機制,以及它們對植物代謝的影響;
5、3)發(fā)育與激素合成:異戊二烯類基因的表達與植物生長激素(如赤霉素和油菜素內(nèi)酯)的生物合成密切相關(guān),基因表達值可以揭示激素合成的調(diào)控網(wǎng)絡。
6、異戊二烯類基因通常通過檢測mrna的豐度來反映。常用的檢測方法是rna測序:通過測量不同條件下基因的轉(zhuǎn)錄豐度,定量分析基因表達水平。通過rna測序,可以獲得大量異戊二烯類基因的rna測序數(shù)據(jù)。如何對rna測序數(shù)據(jù)進行有效特征提取從而解釋植物響應環(huán)境脅迫,代謝調(diào)控和發(fā)育與激素合成是現(xiàn)代生物研究的熱點和難點問題。
7、常用的特征提取方法包括
8、因此,現(xiàn)有技術(shù)還有待改進。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)缺陷,本專利技術(shù)提供一種基于去相關(guān)統(tǒng)計學習的基因檢測方法及基因檢測裝置,以解決現(xiàn)有的基因特征提取方法難以處理基因之間的關(guān)聯(lián)性的問題。
2、本專利技術(shù)解決技術(shù)問題所采用的技術(shù)方案如下:
3、第一方面,本專利技術(shù)提供基于去相關(guān)統(tǒng)計學習的基因檢測方法,包括:
4、基于rna測序方法獲得描述基因表達水平的原始數(shù)據(jù)集;
5、對所述原始數(shù)據(jù)集進行分析,確定轉(zhuǎn)換線性模型中的轉(zhuǎn)換函數(shù);
6、根據(jù)確定的轉(zhuǎn)換函數(shù)對所述原始數(shù)據(jù)集中的基因之間的關(guān)聯(lián)性進行去相關(guān)變化處理;
7、基于去相關(guān)向前統(tǒng)計學習方法從處理后的數(shù)據(jù)集中選擇并逐步增加基因變量,得到滿足條件的基因集合;
8、根據(jù)所述基因集合進行基因檢測,輸出統(tǒng)計推斷和臨床檢測結(jié)果。
9、在一種實現(xiàn)方式中,所述基于rna測序方法獲得描述基因表達水平的原始數(shù)據(jù)集,包括:
10、對于給定的n個研究對象,利用所述rna測序方法獲得描述異戊二烯類基因表達水平的原始數(shù)據(jù)集;
11、將所述原始數(shù)據(jù)集分為兩部分其中,第一部分yi為研究目標,第二部分xi為pn個基因的表達值。
12、在一種實現(xiàn)方式中,所述對所述原始數(shù)據(jù)集進行分析,確定轉(zhuǎn)換線性模型中的轉(zhuǎn)換函數(shù),包括:
13、通過繪制散點圖和殘差圖的方式,確定所述原始數(shù)據(jù)集中響應變量與預測變量之間的關(guān)系;
14、根據(jù)所述原始數(shù)據(jù)集中的非線性數(shù)據(jù)特征、異方差數(shù)據(jù)特征以及多重共線性數(shù)據(jù)特征選擇對應的轉(zhuǎn)換函數(shù);
15、根據(jù)選擇的轉(zhuǎn)換函數(shù)對所述原始數(shù)據(jù)集的數(shù)據(jù)進行轉(zhuǎn)換,并應用線性回歸模型進行擬合,評估所述轉(zhuǎn)換線性模型的效果;
16、檢測所述轉(zhuǎn)換線性模型的正態(tài)性和同方差性,并根據(jù)殘差分析指標和模型擬合優(yōu)度指標優(yōu)化所述轉(zhuǎn)換線性模型。
17、在一種實現(xiàn)方式中,所述轉(zhuǎn)換函數(shù)包括:對數(shù)函數(shù)log(t)、邏輯函數(shù)平方根函數(shù)多項式函數(shù)t2中的一種或組合。
18、在一種實現(xiàn)方式中,所述根據(jù)確定的轉(zhuǎn)換函數(shù)對所述原始數(shù)據(jù)集中的基因之間的關(guān)聯(lián)性進行去相關(guān)變化處理,包括:
19、對所述原始數(shù)據(jù)集中的預測變量矩陣x=(x1,x2,…,xn)t進行去相關(guān)變換:
20、
21、其中,0<λn<1,in為n階單位矩陣;
22、對所述原始數(shù)據(jù)集中的響應向量矩陣進行去相關(guān)變換:
23、
24、其中,ε=(xxt/pn+λnin)-1/2ε*,ε*=(ε1,ε2,…,εn)t為隨機誤差向量;
25、確定去相關(guān)的殘差平方和:
26、
27、其中,為基因集合,為投影矩陣,表示由的列指標落在集中構(gòu)成的子矩陣;
28、根據(jù)所述去相關(guān)的殘差平方和衡量特征的重要性,篩選得到去相關(guān)變換處理后的數(shù)據(jù)集。
29、在一種實現(xiàn)方式中,所述基于去相關(guān)向前統(tǒng)計學習方法從處理后的數(shù)據(jù)集中選擇并逐步增加基因變量,得到滿足條件的基因集合,包括:
30、初始化所述轉(zhuǎn)換線性模型:
31、y*=ε*;
32、計算每個預測變量與響應變量的線性關(guān)系,并選擇第一個與所述響應變量具有最強相關(guān)性的第一個基因x1模型,更新后得到的轉(zhuǎn)換線性模型為:
33、y*=x1β1+ε*;
34、對于每個候選基因,計算所述候選基因與所述響應變量在當前模型中的貢獻,選擇對模型擬合效果提升最大的第二個基因x2加入模型,更新后得到的轉(zhuǎn)換線性模型為:
35、y*=x1β1+x2β2+ε*。
36、在一種實現(xiàn)方式中,所述計算所述候選基因與所述響應變量在當前模型中的貢獻,選擇對模型擬合效果提升最大的第二個基因x2加入模型,之后還包括:
37、每次評估剩余的預測變量,選出對當前轉(zhuǎn)換線性模型改進貢獻最大的變量,并將所選擇的變量加入當前轉(zhuǎn)換線性模型;
38、當時,停止選擇候選基因,最終的轉(zhuǎn)換線性模型的形式為:
39、y*=x1β1+x2β2+…+xkβk+ε*;
40、其中,k為最終被選擇的變量數(shù)量。
41、第二方面,本專利技術(shù)提供一種基于去相關(guān)統(tǒng)計學習的基因檢測裝置,包括:
42、原始數(shù)據(jù)獲取模塊,用于基于rna測序方法獲得描述基因表達水平的原始數(shù)據(jù)集;
43、轉(zhuǎn)換函數(shù)確定模塊,用于對所述原始數(shù)據(jù)集進行分析,確定轉(zhuǎn)換線性模型中的轉(zhuǎn)換函數(shù);
44、去相關(guān)變化處理模塊,用于根據(jù)確定的轉(zhuǎn)換函數(shù)對所述原始數(shù)據(jù)集中的基因之間的關(guān)聯(lián)性進行去相關(guān)變化處理;
45、向前統(tǒng)計學習模塊,用于基于去相關(guān)向前統(tǒng)計學習方法從處理后的數(shù)據(jù)集中選擇并逐步增加基因變量,得到滿足條件的本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述基于RNA測序方法獲得描述基因表達水平的原始數(shù)據(jù)集,包括:
3.根據(jù)權(quán)利要求1所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述對所述原始數(shù)據(jù)集進行分析,確定轉(zhuǎn)換線性模型中的轉(zhuǎn)換函數(shù),包括:
4.根據(jù)權(quán)利要求1或3所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述轉(zhuǎn)換函數(shù)包括:對數(shù)函數(shù)log(t)、邏輯函數(shù)平方根函數(shù)多項式函數(shù)t2中的一種或組合。
5.根據(jù)權(quán)利要求1所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述根據(jù)確定的轉(zhuǎn)換函數(shù)對所述原始數(shù)據(jù)集中的基因之間的關(guān)聯(lián)性進行去相關(guān)變化處理,包括:
6.根據(jù)權(quán)利要求1所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述基于去相關(guān)向前統(tǒng)計學習方法從處理后的數(shù)據(jù)集中選擇并逐步增加基因變量,得到滿足條件的基因集合,包括:
7.根據(jù)權(quán)利要求6所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述計算所述候選基因與所
8.一種基于去相關(guān)統(tǒng)計學習的基因檢測裝置,其特征在于,包括:
9.一種終端,其特征在于,包括:處理器以及存儲器,所述存儲器存儲有基于去相關(guān)統(tǒng)計學習的基因檢測程序,所述基于去相關(guān)統(tǒng)計學習的基因檢測程序被所述處理器執(zhí)行時用于實現(xiàn)如權(quán)利要求1-7中任意一項所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法的操作。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有基于去相關(guān)統(tǒng)計學習的基因檢測程序,所述基于去相關(guān)統(tǒng)計學習的基因檢測程序被處理器執(zhí)行時用于實現(xiàn)如權(quán)利要求1-7中任意一項所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法的操作。
...【技術(shù)特征摘要】
1.一種基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述基于rna測序方法獲得描述基因表達水平的原始數(shù)據(jù)集,包括:
3.根據(jù)權(quán)利要求1所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述對所述原始數(shù)據(jù)集進行分析,確定轉(zhuǎn)換線性模型中的轉(zhuǎn)換函數(shù),包括:
4.根據(jù)權(quán)利要求1或3所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述轉(zhuǎn)換函數(shù)包括:對數(shù)函數(shù)log(t)、邏輯函數(shù)平方根函數(shù)多項式函數(shù)t2中的一種或組合。
5.根據(jù)權(quán)利要求1所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述根據(jù)確定的轉(zhuǎn)換函數(shù)對所述原始數(shù)據(jù)集中的基因之間的關(guān)聯(lián)性進行去相關(guān)變化處理,包括:
6.根據(jù)權(quán)利要求1所述的基于去相關(guān)統(tǒng)計學習的基因檢測方法,其特征在于,所述基于去相關(guān)向前統(tǒng)計學習方法從處理后的數(shù)據(jù)集...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:蔣學軍,馬悅,王浩楓,
申請(專利權(quán))人:南方科技大學,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。