本發明專利技術提供了一種監測重癥監護室心衰患者院內死亡風險的機器學習模型,屬于風險監測技術領域,機器學習模型的構建方法包括:從多個數據庫采集數據;對采集的數據進行病例篩選;納入變量;對數據進行標準化處理;進行機器學習模型的特征篩選;構建機器學習模型并對其進行驗證,開發機器學習模型的Windows應用程序。本申請根據患者的生理參數、年齡、實驗室指標等因素,用機器學習模型進行患者院內死亡概率預測,相比于APACHE評分更加精準。本機器學習模型應用程序在給出患者院內死亡概率的同時,還能夠給出每個納入變量在預測結果中的定量化貢獻。
【技術實現步驟摘要】
本專利技術涉及風險監測,特別是涉及一種監測重癥監護室心衰患者院內死亡風險的機器學習模型。
技術介紹
1、心衰作為一種退行性慢性病,不能完全治愈,心衰病人在治療后,病情也往往會出現反復惡化。在心衰急性惡化之初,由于心臟內沒有神經系統去感知惡化,只有等到病人出現嚴重癥狀如呼吸困難等時才被發現,而這時心肌已經嚴重受損。這時將患者送入重癥監護室進行監護治療時,患者存在一定的死亡風險,現有的apache(acute?physiology?andchronic?health?evaluation)評分系統是一種在重癥監護病房(icu)中常用的評分工具,用于評估患者的疾病嚴重程度和預測死亡率。它根據患者的生理參數、年齡、既往健康狀況等因素進行評分,幫助醫生判斷患者的病情和制定治療方案,但此評分工具的預測準確性較低,不能準確地預測死亡率。
2、因此,本領域亟需一種能夠準確監測重癥監護室心衰患者院內死亡風險的的技術方案和工具。
3、公開于該
技術介紹
部分的信息僅僅旨在增加對本專利技術的總體背景的理解,而不應當被視為承認或以任何形式暗示該信息構成已為本領域一般技術人員所公知的現有技術。
技術實現思路
1、本專利技術的目的是提供一種能夠準確監測重癥監護室心衰患者院內死亡風險的技術方案和應用程序。
2、為實現上述目的,本專利技術提供了如下方案:
3、一種監測重癥監護室心衰患者院內死亡風險的機器學習模型,所述機器學習模型用于監測重癥監護室心衰患者院內死亡風險。</p>4、所述機器學習模型的構建方法包括:
5、從數據庫采集數據;
6、對采集的數據進行病例篩選;
7、納入變量;
8、對數據進行標準化處理;
9、數據集的劃分;
10、進行機器學習模型的特征篩選;
11、構建機器學習模型并對其進行驗證;
12、開發機器學習模型的windows應用程序。
13、可選的,所述機器學習模型的構建方法還包括:
14、模型特征解釋、繪制決策曲線以及統計分析。
15、可選的,所述數據庫包括臨床數據庫eicu-crd和mimic-iv。
16、可選的,所述病例篩選具體為:排除有兩次及以上icu住院記錄和/或患有終末期心力衰竭、惡性腫瘤、癌癥、動脈瘤、胰腺炎、白血病、敗血癥、急性呼吸衰竭、主動脈夾層、肝功能衰竭和紅斑狼瘡的患者,選取在icu住院時間大于4小時小于28天且只有一次icu住院記錄的診斷為心衰的患者。
17、可選的,還包括預處理步驟,所述預處理包括:
18、對于同一患者的同一檢測項目有多次結果的,取最近一次的檢測結果,去除缺失值比例大于30%的變量,采用r包mice進行多重插補填充缺失值。
19、所述納入的變量為分別比較所述臨床數據庫eicu-crd和mimic-iv中院內死亡和院內存活兩組之間各變量的差異,選取在兩個數據集中兩組之間都有顯著差異的變量
20、所述標準化處理具體為:
21、對于所有納入變量,中位數≥100的變量,對每一個變量值取以10為底的對數;中位數≥4并且<100的變量,對每一個變量值取以2為底的對數;中位數<4的變量保持原始數值不變。
22、可選的,所述進行機器學習模型的特征篩選包括:
23、分別比較所述臨床數據庫eicu-crd和mimic-iv中院內死亡和院內存活兩組之間各變量的差異,選取在兩個數據集中兩組之間都有顯著差異的變量,從這兩個數據庫中選擇一部分數據組成新的數據表,用于模型構建和驗證;
24、可選的,所述的兩個數據集中兩組之間共有的顯著差異變量包括:gender、age、gcs-eyes?opening、gcs-motor?response、heart?rate、non-invasive?systolic?bloodpressure、non-invasive?diastolic?blood?pressure、mean?blood?pressure、respiratory?rate、temperature、admission?weight、anion?gap、bicarbonate、calcium、chloride、creatinine、glucose、magnesium、potassium、sodium、hematocrit、hemoglobin、inr(pt)、mch、mchc、mcv、platelet?count、rdw、rbc?count、wbc?count。
25、采用lasso分析,進一步篩選變量,從院內非死亡病例中抽取一部分病例與院內死亡病例組成模型數據集,進行多次迭代,按8:2將所述模型數據集隨機分成訓練集和測試集,用訓練集數據構建lasso模型,并評估模型的預測性能,選取模型驗證性能最優時的非零系數變量和所述模型數據集用于后續模型構建。
26、可選的,所述的利用lasso回歸分析篩選出的最終模型變量包括:格拉斯哥昏迷評分-睜眼評分(gcs-eyes)、格拉斯哥昏迷評分-動作反應評分(gcs-motor)、非侵入收縮壓(sbp)、心率(heart_rate)、年齡(age)、陰離子間隙(anion_gap)、紅細胞計數(rbc_count)、鈉(sodium)、肌酸酐(creatinine)、鈣(calcium)、國際標準化率(inr)、平均血紅蛋白濃度(mchc)、血糖(glucose)、碳酸氫鹽(bicarbonate)、白細胞計數(wbc_count)和血小板計數(platelet_count)。
27、可選的,所述構建機器學習模型并對其進行驗證具體為:
28、利用構建lasso最優模型的訓練集數據和特征組合構建隨機森林模型、支持向量機模型、樸素貝葉斯模型、xgboost模型,利用構建lasso模型劃分的測試集數據、外部數據集、總數據集分別驗證以上模型的預測性能,分別從受試者工作曲線下面積、預測精確性、敏感性、特異性等評估模型的性能。
29、可選的,所述開發隨機森林模型的windows應用程序,具體包括:
30、打開應用程序,窗口特征包括:
31、顯示所述的機器學習模型的排除標準;
32、顯示所述的機器學習模型所納入的16個變量名稱和單位;
33、顯示所述的機器學習模型所納入的16個變量所對應的數據輸入欄;
34、顯示所述的機器學習模型預測結果中16個的各自定量化貢獻(shap值);
35、顯示所述的機器學習模型預測的院內死亡概率(the?predicted?probability?ofin-hospital?expired);
36、顯示所述的機器學習模型預測結果的風險分級(risk?level);
37、顯示所述的機器學習模型對正向預測(院內死亡)貢獻最大的5個變量本文檔來自技高網
...
【技術保護點】
1.一種監測重癥監護室心衰患者院內死亡風險的機器學習模型,其特征在于,所述機器學習模型用于監測重癥監護室心衰患者院內死亡風險。
2.根據權利要求1所述的機器學習模型,其特征在于,所述機器學習模型的構建方法包括:
3.根據權利要求2所述的機器學習模型,其特征在于,所述數據庫包括臨床數據庫eICU-CRD和MIMIC-IV。
4.根據權利要求2所述的機器學習模型,其特征在于,所述病例篩選具體為:排除有兩次及以上ICU住院記錄和/或患有終末期心力衰竭、惡性腫瘤、癌癥、動脈瘤、胰腺炎、白血病、敗血癥、急性呼吸衰竭、主動脈夾層、肝功能衰竭和紅斑狼瘡的患者,選取在ICU住院時間大于4小時小于28天且只有一次ICU住院記錄的診斷為心衰的患者。
5.根據權利要求2所述的機器學習模型,其特征在于,所述的納入變量包括:
6.根據權利要求2所述的機器學習模型,其特征在于,所述的納入變量的數據標準化處理具體為:
7.根據權利要求2所述的機器學習模型,其特征在于,所述的數據集的劃分包括:
8.根據權利要求6所述的機器學習模型,其特征在于,所述的特征篩選具體為:
9.根據權利要求8所述的機器學習模型,其特征在于,所述的構建機器學習模型并對其進行驗證,具體為:
10.根據權利要求2所述的機器學習模型,其特征在于,所述開發隨機森林模型的Windows應用程序,具體包括:
...
【技術特征摘要】
1.一種監測重癥監護室心衰患者院內死亡風險的機器學習模型,其特征在于,所述機器學習模型用于監測重癥監護室心衰患者院內死亡風險。
2.根據權利要求1所述的機器學習模型,其特征在于,所述機器學習模型的構建方法包括:
3.根據權利要求2所述的機器學習模型,其特征在于,所述數據庫包括臨床數據庫eicu-crd和mimic-iv。
4.根據權利要求2所述的機器學習模型,其特征在于,所述病例篩選具體為:排除有兩次及以上icu住院記錄和/或患有終末期心力衰竭、惡性腫瘤、癌癥、動脈瘤、胰腺炎、白血病、敗血癥、急性呼吸衰竭、主動脈夾層、肝功能衰竭和紅斑狼瘡的患者,選取在icu住院時間大于4小時小于28天且只...
【專利技術屬性】
技術研發人員:劉本榮,區文超,胡文韜,譚杰,鄒達濤,梁桓瑞,凌絲絲,劉世明,劉慰華,繆春霞,文欣語,鄭秀妙,
申請(專利權)人:廣州醫科大學附屬第二醫院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。