System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及機器學習,特別涉及膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法。
技術介紹
1、膿毒癥引起的凝血功能障礙(sic)是危重癥膿毒癥患者中常見且嚴重的并發癥,通常導致不良結局。
2、膿毒癥引起的凝血功能障礙在臨床上通常表現有彌散性血管內凝血、凝血因子異常、血小板功能障礙、纖維蛋白降解異常以及凝血與纖溶系統失衡,在進行這類疾病的臨床治療過程中,上述凝血功能障礙會顯著增加膿毒癥患者的住院死亡率,因此在臨床管理中需要密切監測患者的凝血功能,及時調整治療策略,采取適當的干預措施來改善預后,而由于上述功能障礙出現后已經為時已晚,若是不能夠提前進行病人臨床前行為的預測,則會造成難以避免的情況產生,因此,提出一種膿毒癥凝血紊亂患者住院死亡風險預測模型構建方法。
技術實現思路
1、本專利技術的目的在于提供膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,以解決上述
技術介紹
中提出的問題。
2、為實現上述目的,本專利技術提供如下技術方案:膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,所述構建方法包括以下幾個步驟:
3、s1,建立訓練隊列,所述訓練隊列的數據內容由mimic-iv數據庫記錄的診斷為膿毒癥患者的數據集構成;
4、s2,建立外部驗證隊列,所述驗證隊列的數據內容由預測時間前3-5年內醫院泌尿系統膿毒癥患者數據集構成;
5、s3,進行數據提取,所述數據的提取使用navicat?premium軟件,且通過結構化查詢語言初
6、s4,進行候選變量和預測因子的選擇,篩選出數據之后,將膿毒癥患者的臨床特征連續變量標準化,分類變量使用單熱編碼方法進行編碼;
7、s5,構建機器學習模型,通過多種機器學習模型分別進行訓練和驗證,且每個模型都配置以利用特定特征;
8、s6,進行模型的開發和比較,將mimic-iv數據集按照7:3的比例進行劃分,其中占比七成的數據用于模型訓練,剩余三成用于測試模型性能,且通過內部五折交叉驗證確定每個模型的最適合超參數,通過外部五折交叉驗證比較機器學習模型,確定表現最好的模型作為最終預測模型。
9、優選的,所述s1中mimic-iv數據庫的數據內容為膿毒癥患者的臨床信息,且所述臨床信息包括人口統計數據、生命體征、影像結果、實驗室測試、數據字典、包含國際疾病分類代碼的文檔以及經過icu護士驗證的每小時生理數據。
10、優選的,根據膿毒癥引起的凝血功能障礙評分系統,確定符合條件的膿毒癥患者是否患有凝血功能障礙,如果患者在icu入院的第一天內總評分大于等于四,且凝血酶原時間國際標準化比值和血小板計數參數的組合評分超過二,則認為患有凝血功能障礙。
11、優選的,所述s3中結構化查詢語言用于提取患者信息,包括社會人口學特征、生命體征、實驗室結果、并發癥和微生物數據。
12、優選的,所述社會人口學特征內容包括膿毒癥患者入院年齡、性別、種族、體重、身高、icu停留時間和首次icu入院時的住院死亡標志;
13、所述生命體征為膿毒癥患者icu入住前24小時內的體征,包括心率、體溫、呼吸頻率和血氧飽和度;
14、所述實驗室結果包括常規血液測試、肝腎功能測試、血糖和動脈血氣分析參數;
15、所述并發癥使用charlson表格識別;
16、所述微生物數據包括機械通氣和腎替代治療。
17、優選的,若患者信息特征存在缺失數據,則對于每個特征缺失值少于30%的缺失數據,使用r的“dmwr2”包中的k近鄰分類算法進行處理。
18、優選的,所述s3數據篩選剔除的判別標準包括年齡小于十八歲、非首次入院膿毒癥患者、妊娠婦女、先天性凝血障礙者、入住icu后24小時內死亡或離開者以及非凝血功能障礙患者。
19、優選的,所述s4中預測因子編碼完成之后,使用最小絕對收縮和選擇算子回歸將系數估計值收縮為零,且收縮程度由額外參數懲罰因子確定。
20、優選的,所述s5中模型的種類包括支持向量機模型、邏輯回歸模型、隨機森林模型、輕量級梯度提升機模型、遞歸分區和回歸樹模型、通過彈性網的廣義線性模型、k近鄰模型、神經網絡模型以及極限梯度提升模型。
21、優選的,所述s6中最終模型的評估指標包括接收者操作特征曲線下面積、精確召回曲線下面積、f1分數、準確性、正預測值、精度和召回率;
22、且使用接收者操作特征曲線、精確召回曲線和kaplan-meier校準曲線,統計分析采用描述性統計方法總結患者的基線特征;
23、并使用卡方檢驗比較分類變量,使用t檢驗比較連續變量,統計顯著性水平設定為p<0.05,其中數據分析使用r和python編程語言。
24、本專利技術的技術效果和優點:
25、本專利技術分析了各種機器學習模型在預測sic患者住院死亡率方面的預測性能,使用mimic-iv數據集進行模型評估,并使用泌尿系統數據集進行外部驗證,對于訓練隊列中的每種算法,進行五折交叉驗證網格搜索以確定最佳超參數,結果為具有最高預測準確性的模型,然后在測試隊列中評估這個最佳模型,通過該模型預測sic患者住院死亡率,提供了臨床見解,有助于精準患者管理,減少患者死亡率。
本文檔來自技高網...【技術保護點】
1.膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述構建方法包括以下幾個步驟:
2.根據權利要求1所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述S1中MIMIC-IV數據庫的數據內容為膿毒癥患者的臨床信息,且所述臨床信息包括人口統計數據、生命體征、影像結果、實驗室測試、數據字典、包含國際疾病分類代碼的文檔以及經過ICU護士驗證的每小時生理數據。
3.根據權利要求2所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,根據膿毒癥引起的凝血功能障礙評分系統,確定符合條件的膿毒癥患者是否患有凝血功能障礙,如果患者在ICU入院的第一天內總評分大于等于四,且凝血酶原時間國際標準化比值和血小板計數參數的組合評分超過二,則認為患有凝血功能障礙。
4.根據權利要求1所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述S3中結構化查詢語言用于提取患者信息,包括社會人口學特征、生命體征、實驗室結果、并發癥和微生物數據。
5.根據權利要求4所述的膿毒癥凝血紊亂患者住院死亡風險預
6.根據權利要求5所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,若患者信息特征存在缺失數據,則對于每個特征缺失值少于30%的缺失數據,使用R的“DMwR2”包中的K近鄰分類算法進行處理。
7.根據權利要求1所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述S3數據篩選剔除的判別標準包括年齡小于十八歲、非首次入院膿毒癥患者、妊娠婦女、先天性凝血障礙者、入住ICU后24小時內死亡或離開者以及非凝血功能障礙患者。
8.根據權利要求1所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述S4中預測因子編碼完成之后,使用最小絕對收縮和選擇算子回歸將系數估計值收縮為零,且收縮程度由額外參數懲罰因子確定。
9.根據權利要求1所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述S5中模型的種類包括支持向量機模型、邏輯回歸模型、隨機森林模型、輕量級梯度提升機模型、遞歸分區和回歸樹模型、通過彈性網的廣義線性模型、K近鄰模型、神經網絡模型以及極限梯度提升模型。
10.根據權利要求1所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述S6中最終模型的評估指標包括接收者操作特征曲線下面積、精確召回曲線下面積、F1分數、準確性、正預測值、精度和召回率;
...【技術特征摘要】
1.膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述構建方法包括以下幾個步驟:
2.根據權利要求1所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述s1中mimic-iv數據庫的數據內容為膿毒癥患者的臨床信息,且所述臨床信息包括人口統計數據、生命體征、影像結果、實驗室測試、數據字典、包含國際疾病分類代碼的文檔以及經過icu護士驗證的每小時生理數據。
3.根據權利要求2所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,根據膿毒癥引起的凝血功能障礙評分系統,確定符合條件的膿毒癥患者是否患有凝血功能障礙,如果患者在icu入院的第一天內總評分大于等于四,且凝血酶原時間國際標準化比值和血小板計數參數的組合評分超過二,則認為患有凝血功能障礙。
4.根據權利要求1所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述s3中結構化查詢語言用于提取患者信息,包括社會人口學特征、生命體征、實驗室結果、并發癥和微生物數據。
5.根據權利要求4所述的膿毒癥凝血紊亂患者住院死亡風險預測模型的構建方法,其特征在于,所述社會人口學特征內容包括膿毒癥患者入院年齡、性別、種族、體重、身高、icu停留時間和首次icu入院時的住院死亡標志;
6.根據權利要求5...
【專利技術屬性】
技術研發人員:潘景業,錢松贊,鄭瑞,史怡怡,曾晗,
申請(專利權)人:溫州醫科大學附屬第一醫院,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。