System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及計(jì)算機(jī),具體涉及一種非計(jì)劃性再入院風(fēng)險(xiǎn)預(yù)測方法及系統(tǒng)。
技術(shù)介紹
1、肝硬化是一種病情嚴(yán)重的疾病,是大多數(shù)慢性肝病的最終共同路徑,包括慢性乙型肝炎、丙型肝炎、酒精相關(guān)性肝病和非酒精性脂肪肝疾病。與其他慢性疾病相比,慢性肝病導(dǎo)致更高的住院率、更長的住院時(shí)間和更多的再入院次數(shù)。研究報(bào)告顯示,肝硬化患者在出院后的7到90天內(nèi)的再入院率在10%-50%之間,其中大多數(shù)為非計(jì)劃性再入院。而非計(jì)劃性再入院中有很大一部分是可避免的。早期識(shí)別高風(fēng)險(xiǎn)患者可以進(jìn)行前瞻性干預(yù),從而改善醫(yī)療結(jié)果。
2、近年來,電子健康記錄,即電子病歷,被廣泛應(yīng)用于各種臨床和研究領(lǐng)域,機(jī)器學(xué)習(xí)算法在挖掘電子健康記錄數(shù)據(jù)方面取得了巨大成功。電子健康記錄中捕獲的各種臨床指標(biāo)(如實(shí)驗(yàn)室結(jié)果和生命體征)為開發(fā)前沿的預(yù)測模型提供了數(shù)據(jù)支持,可以為臨床決策提供有用的指導(dǎo)。例如,kenneth?berman等人進(jìn)行了一項(xiàng)研究,使用兩家大型學(xué)術(shù)醫(yī)學(xué)中心的住院肝病科數(shù)據(jù)進(jìn)行多變量分析,以識(shí)別與30天再入院相關(guān)的變量,并研究其與晚期肝病患者90天死亡率的關(guān)系。chang?hu和vikram?amjur等人使用邏輯回歸(lr)、核支持向量機(jī)(svm)和隨機(jī)森林分類器(rf)分析了一組來自北美終末期肝病研究聯(lián)盟(nacseld)的肝硬化住院患者的30天和90天再入院情況。其他各種機(jī)器學(xué)習(xí)方法,包括貝葉斯條件概率、深度學(xué)習(xí)、梯度提升以及新型集成方法,也被用來開發(fā)住院再入院的風(fēng)險(xiǎn)預(yù)測模型。
3、盡管電子健康記錄中提供了豐富的信息,但患者的多樣性以及數(shù)據(jù)相關(guān)的問
4、多分類器系統(tǒng)通過結(jié)合多個(gè)基礎(chǔ)分類器的輸出,通常比單個(gè)模型表現(xiàn)更好。這種技術(shù)的原理是并非每個(gè)分類器都是所有未知樣本的專家。相反,每個(gè)基礎(chǔ)分類器都是特征空間中不同局部區(qū)域的專家。多分類器系統(tǒng)的開發(fā)通常包括三個(gè)關(guān)鍵步驟:分類器池生成、分類器選擇和分類器聚合。分類器池生成步驟的目標(biāo)是創(chuàng)建一組多樣化的分類器,這些分類器可以相互補(bǔ)充,以減少預(yù)測中的錯(cuò)誤。為了探索多樣性,常用的策略是使用實(shí)例子集或特征空間子集來訓(xùn)練分類器。一旦生成了分類器池,接下來的關(guān)鍵步驟就是為特定任務(wù)選擇合適的基礎(chǔ)分類器。
5、動(dòng)態(tài)集成選擇(des)是一類集成學(xué)習(xí)技術(shù),在推理過程中對基礎(chǔ)分類器進(jìn)行即時(shí)選擇。動(dòng)態(tài)集成選擇通過估計(jì)分類器池中分類器在特征空間局部區(qū)域的能力來工作。局部區(qū)域通常是通過查詢樣本的鄰域來定義的。
6、可以在推理時(shí)為未知的測試實(shí)例選擇和融合異構(gòu)分類器。特別地,meta-des框架假設(shè)動(dòng)態(tài)分類器選擇問題可以被視為一個(gè)元問題。在生成分類器池后,使用訓(xùn)練和動(dòng)態(tài)選擇數(shù)據(jù)集提取與不同基礎(chǔ)分類器相關(guān)的元特征。這些元特征隨后用于訓(xùn)練元分類器,以估計(jì)基礎(chǔ)分類器是否能夠正確分類樣本。當(dāng)給定新的測試實(shí)例時(shí),從該測試實(shí)例中提取元特征并輸入到訓(xùn)練好的元分類器,以估計(jì)每個(gè)基礎(chǔ)分類器的能力水平。基于這些估計(jì)的能力,選擇最有能力的分類器并進(jìn)行整合,以進(jìn)行最終的決策過程。
7、值得注意的是,應(yīng)用現(xiàn)有的動(dòng)態(tài)集成選擇算法在表格數(shù)據(jù)分類中不一定優(yōu)于最先進(jìn)的集成模型,開發(fā)數(shù)據(jù)驅(qū)動(dòng)的方法以進(jìn)行如再入院風(fēng)險(xiǎn)預(yù)測的任務(wù)從多個(gè)角度來看是具有挑戰(zhàn)性的。首先,由于住院和出院流程的復(fù)雜性和多樣性,常用的機(jī)器學(xué)習(xí)模型難以在預(yù)測一定時(shí)間范圍內(nèi)的再入院風(fēng)險(xiǎn)方面實(shí)現(xiàn)高準(zhǔn)確率。其次,真實(shí)世界的電子健康記錄數(shù)據(jù)存在固有的局限性和質(zhì)量問題,包括不完整性、稀疏性和時(shí)間動(dòng)態(tài)性。而現(xiàn)有的技術(shù)無法克服這些問題。
技術(shù)實(shí)現(xiàn)思路
1、為了克服上述現(xiàn)有技術(shù)中存在的缺陷,本專利技術(shù)的目的是提供一種非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法及系統(tǒng)。
2、為了實(shí)現(xiàn)本專利技術(shù)的上述目的,本專利技術(shù)提供了一種非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,包括以下步驟:
3、獲取疾病數(shù)據(jù)集;
4、基于des框架構(gòu)建動(dòng)態(tài)選擇分類器,該動(dòng)態(tài)選擇分類器包括若干個(gè)基礎(chǔ)分類器以及元分類器,基于所述數(shù)據(jù)集對該動(dòng)態(tài)選擇分類器進(jìn)行訓(xùn)練:
5、設(shè)定若干可解釋的代表醫(yī)學(xué)診斷的二元變量作為規(guī)則集,將所述規(guī)則集作為提取規(guī)則從數(shù)據(jù)集中提取到若干數(shù)據(jù)子集;
6、基于所述數(shù)據(jù)子集對所述基礎(chǔ)分類器進(jìn)行訓(xùn)練,得到分類器池;
7、定義能力區(qū)域以及能力區(qū)域內(nèi)衡量分類器池中各基礎(chǔ)分類器能力的標(biāo)準(zhǔn),所述標(biāo)準(zhǔn)之一包括所述二元變量,將所述標(biāo)準(zhǔn)作為元特征;
8、在能力區(qū)域內(nèi)使用所述基礎(chǔ)分類器提取數(shù)據(jù)集中的元特征;
9、將所述元特征作為訓(xùn)練所述元分類器的訓(xùn)練集對元分類器進(jìn)行訓(xùn)練;
10、使用元分類器計(jì)算預(yù)測每組數(shù)據(jù)時(shí)分類器池中各基礎(chǔ)分類器的能力分?jǐn)?shù);
11、選擇具有最高能力分?jǐn)?shù)的基礎(chǔ)分類器作為預(yù)測對應(yīng)數(shù)據(jù)的最佳分類器;
12、將最佳分類器的預(yù)測結(jié)果作為最終預(yù)測結(jié)果。
13、本方法具有較高的預(yù)測準(zhǔn)確性,并且還允許以可解釋的方式生成分類器池和動(dòng)態(tài)選擇分類器。在動(dòng)態(tài)分類器選擇階段,該方法選擇具有最高能力分?jǐn)?shù)的分類器進(jìn)行預(yù)測,可為每個(gè)個(gè)體選擇了一個(gè)最佳分類器來預(yù)測再入院風(fēng)險(xiǎn)。當(dāng)所選基礎(chǔ)分類器本身具有可理解性和可解釋性時(shí),其預(yù)測可以直接被解釋和理解,比如,邏輯回歸lr,決策樹dt,k近鄰knn等模型作為基礎(chǔ)分類器是可解釋的,如基礎(chǔ)分類器為不可解釋的模型,采用shap對整個(gè)預(yù)測結(jié)果進(jìn)行解釋即可。
14、可選的,將所述數(shù)據(jù)集中部分?jǐn)?shù)據(jù)作為訓(xùn)練集,從每個(gè)訓(xùn)練樣本中提取一組代表醫(yī)學(xué)診斷的二元變量的規(guī)則,所有規(guī)則形成所述規(guī)則集。
15、在該非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法的可選方案中,所述能力區(qū)域包括第一能力區(qū)域以及第二能力區(qū)域;
16、所述第一能力區(qū)域?yàn)閲@預(yù)測數(shù)據(jù)樣本的鄰域,該鄰域內(nèi)的數(shù)據(jù)樣本為預(yù)測數(shù)據(jù)樣本的相似樣本,在所述第一能力區(qū)域內(nèi)提取第一組元特征;
17、所述第二能力區(qū)域?yàn)榛卺t(yī)學(xué)診斷包含有所述二元變量的數(shù)據(jù),在所述第二能力區(qū)域內(nèi)提取第二組元特征。
18、在該非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法的可選方案中,所述第一組元特征包括衡量第一能力區(qū)域內(nèi)局部準(zhǔn)確性的標(biāo)準(zhǔn)、第一能力區(qū)域內(nèi)共識(shí)程度、第一能力區(qū)域內(nèi)整體準(zhǔn)確性、決策空間中的準(zhǔn)確性、輸入樣本的置信度程度;
19、所述第二組元特征包括第二能力區(qū)域內(nèi)的局部準(zhǔn)確性。
20、可選的,所述可解釋的代表醫(yī)學(xué)診斷的二元變量為合并癥和/或并發(fā)癥的存在或缺失。
21、根據(jù)并發(fā)癥和/或合并癥的存在或缺失來解釋所述第二能力區(qū)域內(nèi)的局部準(zhǔn)確性。
22、在該非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法的可選方案中,若存在多個(gè)基礎(chǔ)分類器的能力分?jǐn)?shù)相同,則使用多數(shù)投票規(guī)則聚合此類基礎(chǔ)分類器的預(yù)測結(jié)果。
23、在該非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法的可選方案中,訓(xùn)練前,對所述數(shù)據(jù)集進(jìn)行預(yù)處理,包括計(jì)算所述數(shù)本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,將所述數(shù)據(jù)集中部分?jǐn)?shù)據(jù)作為訓(xùn)練集,從每個(gè)訓(xùn)練樣本中提取一組代表醫(yī)學(xué)診斷的二元變量的規(guī)則,所有規(guī)則形成所述規(guī)則集。
3.根據(jù)權(quán)利要求1所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,所述能力區(qū)域包括第一能力區(qū)域以及第二能力區(qū)域;
4.根據(jù)權(quán)利要求3所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,所述第一組元特征包括衡量第一能力區(qū)域內(nèi)局部準(zhǔn)確性的標(biāo)準(zhǔn)、第一能力區(qū)域內(nèi)共識(shí)程度、第一能力區(qū)域內(nèi)整體準(zhǔn)確性、決策空間中的準(zhǔn)確性、輸入樣本的置信度程度;
5.根據(jù)權(quán)利要求1所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,所述可解釋的代表醫(yī)學(xué)診斷的二元變量為合并癥和并發(fā)癥的存在或缺失。
6.根據(jù)權(quán)利要求4所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,根據(jù)并發(fā)癥和合并癥的存在或缺失解釋所述第二能力區(qū)域內(nèi)的局部準(zhǔn)確性。
7.根據(jù)權(quán)利要求1所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法
8.根據(jù)權(quán)利要求1所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,采用SHAP對動(dòng)態(tài)選擇分類器的預(yù)測結(jié)果進(jìn)行解釋。
9.根據(jù)權(quán)利要求1所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,訓(xùn)練前,對所述數(shù)據(jù)集進(jìn)行預(yù)處理,包括計(jì)算所述數(shù)據(jù)集中每個(gè)變量的P?value;
10.一種非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測系統(tǒng),其特征在于,包括用于獲取疾病數(shù)據(jù)集的數(shù)據(jù)獲取單元,處理單元和存儲(chǔ)單元;
...【技術(shù)特征摘要】
1.一種非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,將所述數(shù)據(jù)集中部分?jǐn)?shù)據(jù)作為訓(xùn)練集,從每個(gè)訓(xùn)練樣本中提取一組代表醫(yī)學(xué)診斷的二元變量的規(guī)則,所有規(guī)則形成所述規(guī)則集。
3.根據(jù)權(quán)利要求1所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,所述能力區(qū)域包括第一能力區(qū)域以及第二能力區(qū)域;
4.根據(jù)權(quán)利要求3所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,所述第一組元特征包括衡量第一能力區(qū)域內(nèi)局部準(zhǔn)確性的標(biāo)準(zhǔn)、第一能力區(qū)域內(nèi)共識(shí)程度、第一能力區(qū)域內(nèi)整體準(zhǔn)確性、決策空間中的準(zhǔn)確性、輸入樣本的置信度程度;
5.根據(jù)權(quán)利要求1所述的非計(jì)劃性再入院的疾病風(fēng)險(xiǎn)預(yù)測方法,其特征在于,所述可解釋的代表醫(yī)學(xué)診斷的二元變量為合并癥和并發(fā)癥的存在或...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:石子辛,王浩林,
申請(專利權(quán))人:重慶醫(yī)科大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。