System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及預測異常流程環節,具體涉及一種腎臟病生物樣本庫的樣本信息溯源方法。
技術介紹
1、腎臟病是一種影響腎功能和結構的疾病,為了研發出對腎臟病進行有效治療的藥物,需要對腎臟病生物樣本進行研究。在對腎臟病生物樣本進行研究的過程中要確保腎臟病生物樣本的有效性和正常性,在實際情況中腎臟病生物樣本從采集到研究的過程中容易出現丟失和污染等異?,F象,為了避免腎臟病生物樣本出現異常,需要對腎臟病生物樣本從采集、分發、使用和銷毀等全過程進行溯源,分析具體環節流程的異常情況,及時增加風險管控,有效避免造成腎臟病生物樣本異常的原因。
2、在現有方法中通過fp樹(frequent?pattern?tree)對異常腎臟病生物樣本的流程信息進行溯源,根據人為設定的支持度閾值預測出異常環節流程,及時對腎臟病生物樣本的相關異常流轉流程做出處理和風險規避,降低腎臟病生物樣本的異常現象。但在實際情況中人為設定的支持度閾值不準確,通過fp樹(frequent?pattern?tree)對異常腎臟病生物樣本的流程信息進行溯源的過程中,過大或者過小的支持度閾值都會導致異常環節流程預測不準確,導致無法準確預測出容易造成腎臟病生物樣本異常的流轉流程,進而無法準確及時進行異常風險的處理和規避,無法有效降低腎臟病生物樣本出現異常現象。
技術實現思路
1、為了解決人為設定的支持度閾值不準確,導致異常環節流程預測不準確,進而無法有效降低腎臟病生物樣本出現異常的技術問題,本專利技術的目的在于提供一種腎臟病生物樣本庫
2、本專利技術實施例提供了一種腎臟病生物樣本庫的樣本信息溯源方法,該方法包括以下步驟:
3、獲取每個異常腎臟病生物樣本流轉的流程并構建fp樹;對于預設支持度閾值集合中的任一個支持度閾值,通過該支持度閾值對fp樹進行處理,獲取最大頻繁項集;
4、基于每個最大頻繁項集所對應路徑在fp樹中的每個節點的數值和深度,獲取每個最大頻繁項集的參考權重;
5、根據所述參考權重,獲取該支持度閾值的合理程度;
6、基于合理程度獲取最佳支持度閾值,根據最佳支持度閾值預測腎臟病生物樣本的異常流程環節。
7、進一步地,所述參考權重的獲取方法為:
8、對于任一個最大頻繁項集,將該最大頻繁項集所對應路徑作為目標路徑,將目標路徑中的節點根據數值大小進行劃分,獲得第一類別和第二類別;其中,第一類別中節點的數值較大,第二類別中節點的數值較??;
9、根據第一類別與第二類別之間節點的數值差異,獲取目標路徑上節點的相似程度;
10、將第二類別中數值最大的節點作為目標路徑的分割節點,根據所述分割節點與其在fp樹中相同深度的其他節點之間的數值差異、以及所述分割節點在fp樹中所處深度上所有節點的數量,獲取第一類別的第一異??赡艹潭龋?/p>
11、將第二類別中數值最小的節點作為目標路徑的終點,根據第二類別中節點的數值的波動情況、以及所述終點在fp樹中所處深度的下一深度上的節點的數值與第二類別中節點的數值的相似情況,獲取第二類別的第二異??赡艹潭龋?/p>
12、根據所述相似程度、所述第一異??赡艹潭群退龅诙惓?赡艹潭?,獲取該最大頻繁項集的整體異常程度;
13、根據所述終點在fp樹中的深度和目標路徑中的每個節點的數值,獲取該最大頻繁項集的重要程度;
14、將所述整體異常程度與所述重要程度的乘積,作為該最大頻繁項集的參考權重。
15、進一步地,所述相似程度的獲取方法為:
16、獲取第一類別中所有節點的數值的均值,作為第一參考值;
17、獲取第二類別中所有節點的數值的均值,作為第二參考值;
18、將第一參考值與第二參考值的差值進行負相關且歸一化的結果,作為目標路徑上節點的相似程度。
19、進一步地,所述第一異??赡艹潭鹊墨@取方法為:
20、將所述分割節點在fp樹中的深度作為目標深度,獲取目標深度上除所述分割節點外其他所有節點的數值的均值,作為第一特征值;
21、將所述分割節點的數值與第一特征值的差值,作為第一類別的參考異常程度;
22、將目標深度上所有節點的數量的倒數與參考異常程度的乘積進行歸一化的結果,作為第一類別的第一異常可能程度。
23、進一步地,所述第二異常可能程度的獲取方法為:
24、將第二類別中節點的數值的標準差進行負相關且歸一化的結果,作為第二類別的初始異常可能程度;
25、獲取第二類別中節點的數值的方差,作為第一方差;
26、獲取所述終點在fp樹中所處深度的下一深度上的所有節點的數值與第二類別中節點的數值的方差,作為第二方差;
27、將第一方差與第二方差的差值絕對值進行歸一化的結果,作為第二類別的修正權重;
28、將第二類別的修正權重與初始異??赡艹潭鹊某朔e,作為第二類別的第二異常可能程度。
29、進一步地,所述整體異常程度的獲取方法為:
30、獲取所述第一異??赡艹潭群退龅诙惓?赡艹潭鹊木?,作為該最大頻繁項集的整體異??赡艹潭?;
31、將所述相似程度與整體異??赡艹潭鹊某朔e,作為該最大頻繁項集的整體異常程度。
32、進一步地,所述重要程度的獲取方法為:
33、將目標路徑中的所有節點的數值的均值與所述終點在fp樹中的深度的比值,作為該最大頻繁項集的重要程度。
34、進一步地,所述合理程度的獲取方法為:
35、將所有最大頻繁項集的參考權重的均值,作為該支持度閾值的合理程度。
36、進一步地,所述最佳支持度閾值的獲取方法為:
37、將最大的合理程度對應的支持度閾值,作為最佳支持度閾值。
38、進一步地,所述異常流程環節的獲取方法為:
39、通過最佳支持度閾值對fp樹進行處理,將此時獲取的每個最大頻繁項集均作為目標項集;
40、獲取每個正常腎臟病生物樣本流轉的流程并構建fp樹作為參考fp樹,通過最佳支持度閾值對參考fp樹進行處理,將此時獲取的每個最大頻繁項集均作為參考項集;
41、將每個目標項集與每個參考項集進行比較,將不與參考項集相同的目標項集所對應路徑的流程環節,作為腎臟病生物樣本的異常流程環節。
42、本專利技術具有如下有益效果:
43、本專利技術根據異常腎臟病生物樣本流轉的流程構建fp樹,避免了正常腎臟病生物樣本的干擾,有利于高效分析出造成腎臟病生物樣本異常的流程;為了獲取出合理的支持度閾值,使得準確預測出造成腎臟病生物樣本異常的流程環節,進而對于預設支持度閾值集合中的任一個支持度閾值,通過該支持度閾值對fp樹進行處理,獲取最大頻繁項集,避免對重復出現的流程環節進行分析;為了準確分析該支持度閾值是否合理,進而基于每個最大頻繁項集所對應路徑在fp樹中的每本文檔來自技高網...
【技術保護點】
1.一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,該方法包括以下步驟:
2.如權利要求1所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述參考權重的獲取方法為:
3.如權利要求2所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述相似程度的獲取方法為:
4.如權利要求2所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述第一異??赡艹潭鹊墨@取方法為:
5.如權利要求2所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述第二異??赡艹潭鹊墨@取方法為:
6.如權利要求2所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述整體異常程度的獲取方法為:
7.如權利要求2所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述重要程度的獲取方法為:
8.如權利要求1所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述合理程度的獲取方法為:
9.如權利要求1所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述最佳支持
10.如權利要求1所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述異常流程環節的獲取方法為:
...【技術特征摘要】
1.一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,該方法包括以下步驟:
2.如權利要求1所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述參考權重的獲取方法為:
3.如權利要求2所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述相似程度的獲取方法為:
4.如權利要求2所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述第一異??赡艹潭鹊墨@取方法為:
5.如權利要求2所述的一種腎臟病生物樣本庫的樣本信息溯源方法,其特征在于,所述第二異常可能程度的獲取方法為:
6.如...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。