System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本申請涉及肥胖遺傳風(fēng)險(xiǎn)預(yù)測,尤其涉及一種基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法、電子設(shè)備及存儲介質(zhì)。
技術(shù)介紹
1、肥胖是全球范圍內(nèi)重要的公共衛(wèi)生問題,已被證實(shí)與多種慢性疾病(如心血管疾病、糖尿病、代謝綜合癥等)密切相關(guān)。近年來,隨著基因組學(xué)技術(shù)的發(fā)展,肥胖的遺傳基礎(chǔ)逐漸受到關(guān)注。研究表明,個(gè)體的肥胖易感性受基因多態(tài)性影響,這些多態(tài)性通常以單核苷酸多態(tài)性(snps)的形式存在。盡管已有大量基因相關(guān)的肥胖研究,但如何利用這些遺傳信息準(zhǔn)確評估個(gè)體的肥胖風(fēng)險(xiǎn),仍然是當(dāng)前科研和臨床實(shí)踐中的一大挑戰(zhàn)。
2、目前,相關(guān)技術(shù)中缺乏可靠的用于評估肥胖遺傳風(fēng)險(xiǎn)及評估與肥胖相關(guān)的死亡風(fēng)險(xiǎn)的工具。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,有必要提供一種基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法、電子設(shè)備及存儲介質(zhì),能夠至少克服以上缺陷之一。
2、第一方面,本申請實(shí)施例提供一種基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,所述方法包括:
3、獲取數(shù)據(jù)集,所述數(shù)據(jù)集包括遺傳特征數(shù)據(jù),所述遺傳特征數(shù)據(jù)包括單核苷酸多態(tài)性;
4、應(yīng)用隨機(jī)森林對單核苷酸多態(tài)性進(jìn)行篩選,以獲取肥胖遺傳風(fēng)險(xiǎn)相關(guān)的第一遺傳特征集;
5、應(yīng)用分布式梯度增強(qiáng)庫模型對單核苷酸多態(tài)性進(jìn)行篩選,以獲取肥胖遺傳風(fēng)險(xiǎn)相關(guān)的第二遺傳特征集;
6、根據(jù)所述第一遺傳特征集和所述第二遺傳特征集獲取顯著遺傳特征集;
7、構(gòu)建肥胖遺傳風(fēng)險(xiǎn)模型,所述肥胖遺傳風(fēng)險(xiǎn)模型為堆疊模型,所述肥胖遺傳風(fēng)險(xiǎn)模型包括基
8、所述基本學(xué)習(xí)器包括:隨機(jī)森林、分布式梯度增強(qiáng)庫模型、自適應(yīng)增強(qiáng)及邏輯回歸;
9、其中,所述基本學(xué)習(xí)器中的算法分別根據(jù)所述顯著遺傳特征集預(yù)測肥胖遺傳風(fēng)險(xiǎn),并分別輸出預(yù)測結(jié)果至所述元分類器,所述元分類器用于輸出肥胖遺傳風(fēng)險(xiǎn)預(yù)測結(jié)果;
10、獲取所述肥胖遺傳風(fēng)險(xiǎn)模型的模型評估結(jié)果,根據(jù)所述模型評估結(jié)果對所述肥胖遺傳風(fēng)險(xiǎn)模型的參數(shù)進(jìn)行優(yōu)化。
11、根據(jù)本申請的一個(gè)實(shí)施例,所述根據(jù)所述第一遺傳特征集和所述第二遺傳特征集獲取顯著遺傳特征集,包括:
12、對所述第一遺傳特征集和所述第二遺傳特征集取交集,以獲取所述顯著遺傳特征集。
13、根據(jù)本申請的一個(gè)實(shí)施例,所述根據(jù)所述第一遺傳特征集和所述第二遺傳特征集獲取顯著遺傳特征集,還包括:
14、根據(jù)套索回歸分析所述第一遺傳特征集和所述第二遺傳特征集,以獲取所述顯著遺傳特征集。
15、根據(jù)本申請的一個(gè)實(shí)施例,所述元分類器為邏輯回歸模型,所述元分類器通過整合所述基本學(xué)習(xí)器的預(yù)測結(jié)果,生成肥胖遺傳風(fēng)險(xiǎn)預(yù)測值。
16、根據(jù)本申請的一個(gè)實(shí)施例,所述第一遺傳特征集通過隨機(jī)森林算法獲取所述遺傳特征的重要性得分,所述重要性得分高于預(yù)設(shè)閾值的所述遺傳特征被篩選為第一遺傳特征集;
17、所述第二遺傳特征集通過分布式梯度增強(qiáng)庫模型獲取所述遺傳特征的重要性得分,所述重要性得分高于預(yù)設(shè)閾值的所述遺傳特征被篩選為第二遺傳特征集。
18、根據(jù)本申請的一個(gè)實(shí)施例,所述方法還包括:
19、將所述顯著遺傳特征集隨機(jī)劃分為五個(gè)數(shù)據(jù)量相等的子集;
20、依次應(yīng)用四個(gè)所述子集對所述基礎(chǔ)學(xué)習(xí)器進(jìn)行訓(xùn)練,并應(yīng)用一個(gè)所述子集用于驗(yàn)證所述肥胖遺傳風(fēng)險(xiǎn)模型,以形成交叉驗(yàn)證;
21、完成五次交叉驗(yàn)證后,獲取五組預(yù)測值;
22、根據(jù)五組所述預(yù)測值形成訓(xùn)練集。
23、根據(jù)本申請的一個(gè)實(shí)施例,所述數(shù)據(jù)集包括內(nèi)部測試隊(duì)列和外部測試隊(duì)列,所述方法還包括:
24、將所述內(nèi)部測試隊(duì)列輸入到每個(gè)所述基礎(chǔ)學(xué)習(xí)器中,以獲取五組內(nèi)部預(yù)測值,將所述內(nèi)部預(yù)測值的平均值作為內(nèi)部測試集;
25、將所述外部測試隊(duì)列輸入到每個(gè)所述基礎(chǔ)學(xué)習(xí)器中,以獲取五組外部預(yù)測值,將所述外部預(yù)測值的平均值作為外部測試集;
26、根據(jù)所述外部測試集輸入及所述分布式梯度增強(qiáng)庫模型輸出肥胖遺傳風(fēng)險(xiǎn)預(yù)測結(jié)果。
27、根據(jù)本申請的一個(gè)實(shí)施例,所述獲取所述肥胖遺傳風(fēng)險(xiǎn)模型的模型評估結(jié)果,包括:
28、根據(jù)模型評估方法評估所述肥胖遺傳風(fēng)險(xiǎn)模型的模型評估結(jié)果;
29、所述模型評估方法包括計(jì)算所述肥胖遺傳風(fēng)險(xiǎn)模型的準(zhǔn)確率、召回率、f1分?jǐn)?shù)及roc曲線下的面積。
30、第二方面,本申請實(shí)施例提供一種電子設(shè)備,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,所述處理器被配置為執(zhí)行所述指令時(shí)實(shí)現(xiàn)第一方面所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法。
31、第三方面,本申請實(shí)施例提供一種計(jì)算機(jī)可讀存儲介質(zhì),包括指令,所述指令指示設(shè)備執(zhí)行如第一方面所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法。
32、本申請實(shí)施方式提供的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法、電子設(shè)備及存儲介質(zhì),通過整合基礎(chǔ)學(xué)習(xí)器,結(jié)合元分類器邏輯回歸進(jìn)行堆疊訓(xùn)練,有效融合了不同算法的優(yōu)勢,提升了肥胖遺傳風(fēng)險(xiǎn)預(yù)測的準(zhǔn)確性和穩(wěn)定性。對單核苷酸多態(tài)性數(shù)據(jù)進(jìn)行多重篩選,并取交集獲取顯著遺傳特征集,確保篩選出的特征與肥胖遺傳風(fēng)險(xiǎn)的關(guān)聯(lián)性強(qiáng),進(jìn)一步提高了模型的特征提取效率。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述根據(jù)所述第一遺傳特征集和所述第二遺傳特征集獲取顯著遺傳特征集,包括:
3.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述根據(jù)所述第一遺傳特征集和所述第二遺傳特征集獲取顯著遺傳特征集,還包括:
4.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述元分類器為邏輯回歸模型,所述元分類器通過整合所述基本學(xué)習(xí)器的預(yù)測結(jié)果,生成肥胖遺傳風(fēng)險(xiǎn)預(yù)測值。
5.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述第一遺傳特征集通過隨機(jī)森林算法獲取所述遺傳特征的重要性得分,所述重要性得分高于預(yù)設(shè)閾值的所述遺傳特征被篩選為第一遺傳特征集;
6.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特
8.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述獲取所述肥胖遺傳風(fēng)險(xiǎn)模型的模型評估結(jié)果,包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,包括指令,所述指令指示設(shè)備執(zhí)行如權(quán)利要求1至8任一項(xiàng)所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法。
...【技術(shù)特征摘要】
1.一種基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述根據(jù)所述第一遺傳特征集和所述第二遺傳特征集獲取顯著遺傳特征集,包括:
3.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述根據(jù)所述第一遺傳特征集和所述第二遺傳特征集獲取顯著遺傳特征集,還包括:
4.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述元分類器為邏輯回歸模型,所述元分類器通過整合所述基本學(xué)習(xí)器的預(yù)測結(jié)果,生成肥胖遺傳風(fēng)險(xiǎn)預(yù)測值。
5.根據(jù)權(quán)利要求1所述的基于堆疊模型的肥胖遺傳風(fēng)險(xiǎn)模型構(gòu)建方法,其特征在于,所述第一遺傳特征集通過隨...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:劉莉,肖蘆山,梁盛興,
申請(專利權(quán))人:南方醫(yī)科大學(xué)南方醫(yī)院,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。