System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)剔除了一種基于深度學(xué)習(xí)的糖尿病風險評估模型構(gòu)建方法,涉及模型構(gòu)建。
技術(shù)介紹
1、近些年來,隨著我國經(jīng)濟的迅速發(fā)展和國民生活方式以及飲食結(jié)構(gòu)的改變,我國糖尿病患者人數(shù)正在以驚人的速度增長。目前大部分醫(yī)療機構(gòu)對糖尿病的診斷還是依靠醫(yī)生的個人經(jīng)驗和體檢數(shù)據(jù)為準,這種診斷方式對醫(yī)生的要求很高,具有很強的主觀性,容易出現(xiàn)誤診和漏診的情況,錯失了預(yù)防和治療的最佳時機,將嚴重影響到病人的身心健康。如果將糖尿病和機器學(xué)習(xí)結(jié)合,采用機器學(xué)習(xí)算法來輔助醫(yī)生診斷,將會很大程度上提高診斷和科學(xué)性,有效的克服醫(yī)生憑經(jīng)驗診斷的主觀性的問題。因此,使用機器學(xué)習(xí)的方法對糖尿病患者進行預(yù)測,具有很大的現(xiàn)實意義,如:logistic回歸、bp?神經(jīng)網(wǎng)絡(luò)模型、cox比例風險模型、決策樹模型。這些方法在疾病預(yù)測方面有較好的效果,但是也有各種各樣的缺點,比如要求數(shù)據(jù)量大、要求一定時間段的的連續(xù)數(shù)據(jù)、泛化能力太弱、過度擬合、陷入局部最小值、對隨機性和波動性數(shù)據(jù)不敏感、對不平衡數(shù)據(jù)預(yù)測效果不理想等問題等等。現(xiàn)有的研究大多采用單個全局優(yōu)化模型,單分類器模型性能有限,存在泛化能力弱和容錯性較差等問題。
技術(shù)實現(xiàn)思路
1、為了解決上述技術(shù)問題,本專利技術(shù)提出了一種基于深度學(xué)習(xí)的糖尿病風險評估模型構(gòu)建方法,包括如下步驟:
2、s1、構(gòu)建數(shù)據(jù)篩選單元,所述數(shù)據(jù)篩選單元通過計算貢獻值進行特征選擇,篩選得到多個對糖尿病風險有評估價值的重要特征參數(shù);
3、s2、構(gòu)建數(shù)據(jù)處理單元,所述數(shù)據(jù)篩選單元獲取每個重要
4、s3、構(gòu)建參數(shù)形成單元,所述參數(shù)形成單元計算每個特征參數(shù)的歸一化數(shù)據(jù)序列的噪聲指數(shù),根據(jù)噪聲指數(shù)為多個特征參數(shù)賦予權(quán)重;
5、s4、構(gòu)建深度學(xué)習(xí)單元,所述深度學(xué)習(xí)單元將各個特征參數(shù)的歸一化數(shù)據(jù)序列中的噪聲數(shù)據(jù)去除,得到去除噪聲數(shù)據(jù)后的歸一化數(shù)據(jù)序列,基于所述去除噪聲數(shù)據(jù)后的歸一化數(shù)據(jù)序列進行深度學(xué)習(xí),輸出糖尿病風險類型。
6、進一步地,所述步驟s2中,對每個重要特征參數(shù)i在多個監(jiān)測時間點的監(jiān)測數(shù)據(jù)進行歸一化處理,使監(jiān)測數(shù)據(jù)映射到區(qū)間[-1,1],得到歸一化數(shù)據(jù):
7、,t=1,2,……t;
8、其中,xit是特征參數(shù)i的第t個監(jiān)測時間點的監(jiān)測數(shù)據(jù),t為監(jiān)測時間點的總數(shù),xmax是監(jiān)測數(shù)據(jù)中的最大數(shù)據(jù)值,xmin是監(jiān)測數(shù)據(jù)中的最小數(shù)據(jù)值,表示特征參數(shù)i的歸一化數(shù)據(jù)序列{}。
9、進一步地,所述步驟s3包括:
10、s31、構(gòu)建噪聲識別子模塊,所述噪聲識別子模塊通過數(shù)據(jù)密度評估方法識別每個特征參數(shù)的歸一化數(shù)據(jù)序列的噪聲數(shù)據(jù);
11、s32、構(gòu)建指數(shù)計算子模塊,所述指數(shù)計算子模塊根據(jù)噪聲數(shù)據(jù),計算每個特征參數(shù)的歸一化數(shù)據(jù)序列的噪聲指數(shù);
12、s33、構(gòu)建權(quán)重賦予子模塊,所述權(quán)重賦予子模塊根據(jù)噪聲指數(shù)為每個特征參數(shù)賦予權(quán)重。
13、進一步地,所述步驟s4包括:
14、s41、構(gòu)建噪聲剔除子模塊,所述噪聲剔除子模塊將各個特征參數(shù)的歸一化數(shù)據(jù)序列中的噪聲數(shù)據(jù)去除,得到去除噪聲數(shù)據(jù)后的歸一化數(shù)據(jù)序列;
15、s42、構(gòu)建深度學(xué)習(xí)子模塊,所述深度學(xué)習(xí)子模塊基于輸入的多個特征參數(shù)的去除噪聲數(shù)據(jù)后的歸一化數(shù)據(jù)序列形成特征參數(shù)相似度矩陣;
16、s43、構(gòu)建風險預(yù)測子模塊,所述風險預(yù)測子模塊基于特征參數(shù)相似度矩陣,獲取風險預(yù)測結(jié)果。
17、進一步地,所述步驟s3包括:
18、s31、構(gòu)建噪聲識別子模塊,所述噪聲識別子模塊通過數(shù)據(jù)密度評估方法識別每個特征參數(shù)的歸一化數(shù)據(jù)序列的噪聲數(shù)據(jù);
19、s32、構(gòu)建指數(shù)計算子模塊,所述指數(shù)計算子模塊根據(jù)噪聲數(shù)據(jù),計算每個特征參數(shù)的歸一化數(shù)據(jù)序列的噪聲指數(shù);
20、s33、構(gòu)建權(quán)重賦予子模塊,所述權(quán)重賦予子模塊根據(jù)噪聲指數(shù)為每個特征參數(shù)賦予權(quán)重。
21、進一步地,所述步驟s4包括:
22、s41、構(gòu)建噪聲剔除子模塊,所述噪聲剔除子模塊將各個特征參數(shù)的歸一化數(shù)據(jù)序列中的噪聲數(shù)據(jù)去除,得到去除噪聲數(shù)據(jù)后的歸一化數(shù)據(jù)序列;
23、s42、構(gòu)建深度學(xué)習(xí)子模塊,所述深度學(xué)習(xí)子模塊基于輸入的多個特征參數(shù)的去除噪聲數(shù)據(jù)后的歸一化數(shù)據(jù)序列形成特征參數(shù)相似度矩陣;
24、s43、構(gòu)建風險預(yù)測子模塊,所述風險預(yù)測子模塊基于特征參數(shù)相似度矩陣,獲取風險預(yù)測結(jié)果。
25、進一步地,所述步驟s32中,對每個特征參數(shù)i的歸一化數(shù)據(jù)序列進行噪聲數(shù)據(jù)統(tǒng)計,計算噪聲指數(shù)zi:
26、;
27、其中,q是特征參數(shù)i的歸一化數(shù)據(jù)序列中的噪聲數(shù)據(jù)總數(shù);fj是第j個噪聲數(shù)據(jù)在特征參數(shù)i的歸一化數(shù)據(jù)序列中出現(xiàn)的次數(shù),是第j個噪聲數(shù)據(jù)在特征參數(shù)i的歸一化數(shù)據(jù)序列中的位置系數(shù)。
28、進一步地,所述步驟s42中,計算去除噪聲數(shù)據(jù)后的歸一化數(shù)據(jù)序列中每個數(shù)據(jù)gin與該特征參數(shù)i對應(yīng)類別的風險特征wi的相似度h(in):
29、;
30、中n個數(shù)據(jù)計算得到的n個相似度h(in)組成特征參數(shù)i的相似度列向量,m個特征參數(shù)的相似度列向量組合成為相似度矩陣hz=[h1…h(huán)i…h(huán)m]。
31、進一步地,所述步驟s43中,計算相似度矩陣的平均相似度:
32、;
33、其中,為每個特征參數(shù)i的權(quán)重,將平均相似度和風險閾值ht進行比對,如果平均相似度超過風險閾值,則判斷該個體存在糖尿病風險;如果平均相似度不超過風險閾值,則判斷該個體不存在糖尿病風險。
34、進一步地,設(shè)定動態(tài)風險閾值dh:
35、dh=ht?-?maxd×y-1×r-1;
36、其中:r為考慮性別及年齡的綜合因子,男性綜合因子為log9(a),女性綜合因子為log8(a);y為飲食因子;ht為固定的風險閾值;maxd為大數(shù)據(jù)中統(tǒng)計的最大風險閾值。
37、進一步地,所述步驟s31中,數(shù)據(jù)密度評估方法中密度值f表示為:
38、;
39、其中,是表示特征參數(shù)i的歸一化數(shù)據(jù)序列{}的均值,t是每個特征參數(shù)的歸一化數(shù)據(jù)序列的數(shù)據(jù)數(shù)量,是邊界檢測半徑;
40、選定最優(yōu)密度值從而得到最優(yōu)邊界檢測半徑,最優(yōu)邊界檢測半徑外的數(shù)據(jù)則為噪聲數(shù)據(jù)。
41、進一步地,所述步驟s1中,計算特征對患病風險的貢獻值v:
42、;
43、其中,n代表樣本在該類特征上分成的組數(shù),pbi表示第i組數(shù)據(jù)中壞樣本占所有樣本的比例,pyi表示第i組數(shù)據(jù)中好樣本占所有樣本的比例;最終選出貢獻值大于貢獻閾值的多個對糖尿病風險有評估價值的重要特征參數(shù)。
44、相比于現(xiàn)有技術(shù),本專利技術(shù)具有如下有益技術(shù)效果:
45、構(gòu)建數(shù)據(jù)篩選單元,通過計算貢獻值進行特征選擇,篩選得到多個對糖尿病風本文檔來自技高網(wǎng)...
【技術(shù)保護點】
1.一種基于深度學(xué)習(xí)的糖尿病風險評估模型構(gòu)建方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟S2中,對每個重要特征參數(shù)I在多個監(jiān)測時間點的監(jiān)測數(shù)據(jù)進行歸一化處理,使監(jiān)測數(shù)據(jù)映射到區(qū)間[-1,1],得到歸一化數(shù)據(jù):
3.根據(jù)權(quán)利要求1中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟S3包括:
4.根據(jù)權(quán)利要求1中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟S4包括:
5.根據(jù)權(quán)利要求3中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟S32中,對每個特征參數(shù)I的歸一化數(shù)據(jù)序列進行噪聲數(shù)據(jù)統(tǒng)計,計算噪聲指數(shù)ZI:
6.根據(jù)權(quán)利要求4中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟S42中,計算去除噪聲數(shù)據(jù)后的歸一化數(shù)據(jù)序列中每個數(shù)據(jù)GIn與該特征參數(shù)I對應(yīng)類別的風險特征WI的相似度H(In):
7.根據(jù)權(quán)利要求6中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟S43中,計算相似度矩陣的平均相似度:
8.
9.根據(jù)權(quán)利要求3中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟S31中,數(shù)據(jù)密度評估方法中密度值F表示為:
10.根據(jù)權(quán)利要求1中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟S1中,計算特征對患病風險的貢獻值V:
...【技術(shù)特征摘要】
1.一種基于深度學(xué)習(xí)的糖尿病風險評估模型構(gòu)建方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟s2中,對每個重要特征參數(shù)i在多個監(jiān)測時間點的監(jiān)測數(shù)據(jù)進行歸一化處理,使監(jiān)測數(shù)據(jù)映射到區(qū)間[-1,1],得到歸一化數(shù)據(jù):
3.根據(jù)權(quán)利要求1中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟s3包括:
4.根據(jù)權(quán)利要求1中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟s4包括:
5.根據(jù)權(quán)利要求3中所述的糖尿病風險評估模型構(gòu)建方法,其特征在于,所述步驟s32中,對每個特征參數(shù)i的歸一化數(shù)據(jù)序列進行噪聲數(shù)據(jù)統(tǒng)計,計算噪聲指數(shù)zi:
6.根據(jù)權(quán)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:郭航,韓菲,王娟,吳曉明,潘從清,邢曉乾,
申請(專利權(quán))人:天津醫(yī)科大學(xué)朱憲彝紀念醫(yī)院天津醫(yī)科大學(xué)代謝病醫(yī)院,天津代謝病防治中心,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。