System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專(zhuān)利技術(shù)涉及兒童藥物性肝損傷信息處理,尤其是涉及一種基于時(shí)序的兒童藥物性肝損傷數(shù)據(jù)融合與預(yù)測(cè)方法及系統(tǒng)。
技術(shù)介紹
1、藥物性肝損傷(dili)發(fā)病機(jī)制復(fù)雜,大多是多種機(jī)制先后或共同作用的結(jié)果,包括藥物的直接肝毒性和特異質(zhì)性肝毒性:藥物的直接肝毒性指攝入人體內(nèi)的藥物和/或其代謝產(chǎn)物,對(duì)肝臟產(chǎn)生的直接損傷,可進(jìn)一步引起其他免疫和炎癥反應(yīng);特異質(zhì)性肝毒性指因個(gè)體藥物代謝異常、藥物介導(dǎo)免疫損傷或個(gè)體遺傳差異等因素,導(dǎo)致增加個(gè)體藥物性肝損傷的易感性。
2、兒童尚處于發(fā)育階段,對(duì)dili具有較高易感性,針對(duì)兒童dili監(jiān)測(cè)具有重要臨床與公共衛(wèi)生意義。近年,為克服被動(dòng)監(jiān)測(cè)的局限性,采用電子病歷(emr)數(shù)據(jù)開(kāi)展dili主動(dòng)監(jiān)測(cè)已成為研究熱點(diǎn)。但是,dili相關(guān)事件(包括癥狀、體征等)的時(shí)序信息缺失,會(huì)嚴(yán)重影響dili的識(shí)別準(zhǔn)確性。因此,研究dili相關(guān)事件的時(shí)序處理策略是提高dili預(yù)測(cè)準(zhǔn)確性亟待解決的科學(xué)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本專(zhuān)利技術(shù)的目的在于提供一種基于時(shí)序的兒童藥物性肝損傷數(shù)據(jù)融合與預(yù)測(cè)方法及系統(tǒng),以解決現(xiàn)有技術(shù)中存在的至少一種上述技術(shù)問(wèn)題。
2、第一方面,為解決上述技術(shù)問(wèn)題,本專(zhuān)利技術(shù)提供一種基于時(shí)序的兒童藥物性肝損傷數(shù)據(jù)融合與預(yù)測(cè)方法,包括:
3、步驟1、采集住院患兒的歷史醫(yī)療數(shù)據(jù)作為縱向數(shù)據(jù)集,按照時(shí)間順序橫向排列,構(gòu)建得到臨床數(shù)據(jù)庫(kù);對(duì)所述臨床數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)清洗及標(biāo)準(zhǔn)化處理;計(jì)算兒童藥物性肝損傷預(yù)測(cè)模型的樣本量,并根據(jù)納入排除標(biāo)準(zhǔn),從臨
4、在一種可行的實(shí)施方式中,所述歷史醫(yī)療數(shù)據(jù)包括住院患兒電子病歷(emr)數(shù)據(jù)。
5、在一種可行的實(shí)施方式中,所述數(shù)據(jù)清洗包括數(shù)據(jù)脫敏、篩除錯(cuò)誤及重復(fù)記錄等。
6、在一種可行的實(shí)施方式中,所述標(biāo)準(zhǔn)化處理包括對(duì)診斷名稱(chēng)、藥品名稱(chēng)分別與國(guó)際疾病與相關(guān)健康問(wèn)題統(tǒng)計(jì)分類(lèi)第十版(icd-10)和藥物的解剖學(xué)、治療學(xué)及化學(xué)分類(lèi)法(atc)編碼等術(shù)語(yǔ)規(guī)范保持一致。
7、在一種可行的實(shí)施方式中,所述樣本量的計(jì)算方法包括:
8、根據(jù)文獻(xiàn)檢索及專(zhuān)家咨詢(xún),選定納入肝損傷特異性表征及相關(guān)臨床事件數(shù);
9、基于bmj文獻(xiàn)發(fā)表的有關(guān)預(yù)測(cè)模型樣本量計(jì)算四步法,計(jì)算樣本量。
10、在一種可行的實(shí)施方式中,所述納入排除標(biāo)準(zhǔn)包括:
11、納入預(yù)設(shè)年限且入院時(shí)首次實(shí)驗(yàn)室生化檢查指標(biāo):堿性磷酸酶(alp)、谷丙轉(zhuǎn)氨酶(alt)、谷草轉(zhuǎn)氨酶(ast)、總膽紅素(tb)、谷氨酰轉(zhuǎn)移酶(ggt)在正常值范圍內(nèi)的患兒;所述患兒年齡范圍為1月齡至18歲;
12、排除入院時(shí)存在影響肝臟相關(guān)功能基礎(chǔ)疾病的患兒,以及使用目標(biāo)藥物前肝功能出現(xiàn)異常的患兒。
13、在一種可行的實(shí)施方式中,所述研究數(shù)據(jù)集包括標(biāo)準(zhǔn)陽(yáng)性事件組和對(duì)照組:
14、所述標(biāo)準(zhǔn)陽(yáng)性事件組,是通過(guò)adr因果評(píng)價(jià)法及rucam量表,從所述縱向數(shù)據(jù)集中選取dili患兒的歷史醫(yī)療數(shù)據(jù);
15、所述對(duì)照組,是按照預(yù)設(shè)對(duì)照比例,從所述縱向數(shù)據(jù)集中隨機(jī)選取,非dili患兒且使用過(guò)目標(biāo)藥物(誘發(fā)dili的藥物)的歷史醫(yī)療數(shù)據(jù)。
16、在一種可行的實(shí)施方式中,所述相關(guān)事件表型是基于本領(lǐng)域文獻(xiàn),例如《常用臨床醫(yī)學(xué)名詞2023年版》等,同時(shí)結(jié)合住院患兒電子病歷書(shū)寫(xiě)特點(diǎn),經(jīng)過(guò)多輪德?tīng)柗茖?zhuān)家咨詢(xún)法進(jìn)行確定的,包括癥狀指標(biāo)、實(shí)驗(yàn)室檢查指標(biāo)、人口學(xué)指標(biāo)、目標(biāo)藥物使用指標(biāo)及疾病指標(biāo);
17、所述癥狀指標(biāo)包括黃疸、惡心、嘔吐、皮疹、皮膚瘙癢、腹部不適、上腹不適、右上腹疼痛、發(fā)熱、食欲不振、食欲下降、疲乏、乏力、輕度黃疸、中度黃疸、重度黃疸、黃疸未褪盡;
18、所述實(shí)驗(yàn)室檢查指標(biāo)包括堿性磷酸酶、谷丙轉(zhuǎn)氨酶、谷草轉(zhuǎn)氨酶、總膽紅素及谷氨酰轉(zhuǎn)移酶;
19、所述人口學(xué)指標(biāo)包括年齡、身高、體重及性別;
20、所述目標(biāo)藥物使用指標(biāo)包括劑量、劑型、給藥途徑、是否換藥及合并用藥;
21、所述疾病指標(biāo)包括疾病出院診斷及合并癥。
22、在一種可行的實(shí)施方式中,所述非結(jié)構(gòu)化信息包括住院患兒電子病歷數(shù)據(jù)中的病案首頁(yè)信息、入院記錄、日常病程、交接班記錄、查房記錄及術(shù)后首次病程等文本數(shù)據(jù)。
23、在一種可行的實(shí)施方式中,所述實(shí)體關(guān)系標(biāo)注的具體方法包括:
24、對(duì)非結(jié)構(gòu)化信息進(jìn)行分段和分詞,得到語(yǔ)料集;對(duì)語(yǔ)料集,進(jìn)行非標(biāo)準(zhǔn)的實(shí)體命名和對(duì)應(yīng)關(guān)系提??;所述實(shí)體命名包括:癥狀(黃疸、惡心、嘔吐、皮疹、皮膚瘙癢、腹部不適、上腹不適、右上腹疼痛、發(fā)熱、食欲不振、食欲下降、疲乏、乏力、輕度黃疸、中度黃疸、重度黃疸、黃疸未褪盡)及相應(yīng)癥狀的嚴(yán)重程度等級(jí);出現(xiàn)這些癥狀前后的用藥名稱(chēng)及屬性(劑量、頻率及療程等);
25、再通過(guò)預(yù)訓(xùn)練的medbert模型,對(duì)所述語(yǔ)料集進(jìn)行標(biāo)準(zhǔn)的實(shí)體命名和對(duì)應(yīng)關(guān)系提取。
26、在一種可行的實(shí)施方式中,所述缺失值和異常值處理包括:
27、對(duì)缺失值先進(jìn)行統(tǒng)一標(biāo)注,再進(jìn)行統(tǒng)計(jì)分析、填補(bǔ)或剔除;
28、對(duì)異常值,先根據(jù)變量特征和編碼表進(jìn)行識(shí)別,對(duì)識(shí)別不到的異常值作為缺失值處理。
29、步驟2、構(gòu)建并訓(xùn)練醫(yī)學(xué)非結(jié)構(gòu)化信息基于時(shí)序的重構(gòu)和融合模型,簡(jiǎn)稱(chēng)muirfti模型,用于對(duì)非結(jié)構(gòu)化文本進(jìn)行基于時(shí)序信息的結(jié)構(gòu)化映射重構(gòu);將所述研究數(shù)據(jù)集的非結(jié)構(gòu)化文本,輸入至訓(xùn)練完成的muirfti模型中,根據(jù)muirfti模型中各模塊規(guī)則進(jìn)行結(jié)構(gòu)化重建,得到重建結(jié)構(gòu)化文本后,再與所述研究數(shù)據(jù)集中原有結(jié)構(gòu)化文本進(jìn)行融合,得到基于時(shí)序融合的建模數(shù)據(jù)集。
30、在一種可行的實(shí)施方式中,所述muirfti模型包括依次設(shè)置的文本校正模塊(tc)、文本結(jié)構(gòu)化模塊(ts)、醫(yī)學(xué)事實(shí)和事件提取模塊(mfee)和時(shí)間信息提取模塊(tie);
31、所述文本校正模塊包括矯正策略庫(kù),用于通過(guò)自然語(yǔ)言處理(nlp)工具,根據(jù)正則策略,對(duì)文本中的拼寫(xiě)錯(cuò)誤進(jìn)行修正;
32、所述文本結(jié)構(gòu)化模塊包括語(yǔ)法規(guī)則庫(kù),用于通過(guò)自然語(yǔ)言處理(nlp)工具,根據(jù)語(yǔ)法規(guī)則,對(duì)文本中的語(yǔ)法錯(cuò)誤進(jìn)行調(diào)整及語(yǔ)句粒度分割;所述語(yǔ)法規(guī)則庫(kù)包括兒童病例癥狀描述規(guī)則及藥物性肝損傷相關(guān)事件的術(shù)語(yǔ);這樣可以兼顧兒童病例癥狀描述的書(shū)寫(xiě)特征,確定藥物性肝損傷相關(guān)事件的名詞術(shù)語(yǔ);
33、所述醫(yī)學(xué)事實(shí)和事件提取模塊包括關(guān)鍵值模型(kv)、時(shí)間事件描述模型(ted)、醫(yī)學(xué)研究知識(shí)庫(kù)和標(biāo)記語(yǔ)料庫(kù),用于通過(guò)自然語(yǔ)言處理(nlp)工具,根據(jù)時(shí)序的映射,提取文本中的醫(yī)學(xué)事實(shí)和事件,得到以dili為目標(biāo)結(jié)局的臨床事件結(jié)構(gòu)化數(shù)據(jù)庫(kù);
34、所述時(shí)間信息提取模塊包括時(shí)間表達(dá)式規(guī)則庫(kù),用于通過(guò)自然語(yǔ)言本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于時(shí)序的兒童藥物性肝損傷數(shù)據(jù)融合與預(yù)測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟1中的納入排除標(biāo)準(zhǔn)包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟1中的研究數(shù)據(jù)集包括標(biāo)準(zhǔn)陽(yáng)性事件組和對(duì)照組:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述相關(guān)事件表型包括癥狀指標(biāo)、實(shí)驗(yàn)室檢查指標(biāo)、人口學(xué)指標(biāo)、目標(biāo)藥物使用指標(biāo)及疾病指標(biāo);
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述非結(jié)構(gòu)化信息包括住院患兒電子病歷數(shù)據(jù)中的病案首頁(yè)信息、入院記錄、日常病程、交接班記錄、查房記錄及術(shù)后首次病程。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述MUIRFTI模型包括依次設(shè)置的文本校正模塊、文本結(jié)構(gòu)化模塊、醫(yī)學(xué)事實(shí)和事件提取模塊和時(shí)間信息提取模塊;
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述關(guān)鍵值模型的具體公式包括:
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,評(píng)價(jià)MUIRFTI模型訓(xùn)練效果的方法為:通過(guò)計(jì)算MUIRFTI模型轉(zhuǎn)換前的非結(jié)構(gòu)化文本與轉(zhuǎn)換后的結(jié)構(gòu)化文本之
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獨(dú)立事件集策略是指計(jì)算每一種臨床事件的次數(shù)時(shí),計(jì)算出現(xiàn)藥物性肝損傷病情之前預(yù)設(shè)時(shí)間段內(nèi)該臨床事件的總計(jì)出現(xiàn)次數(shù);
10.一種基于時(shí)序的兒童藥物性肝損傷數(shù)據(jù)融合與預(yù)測(cè)系統(tǒng),其特征在于,包括數(shù)據(jù)接收模塊、數(shù)據(jù)處理模塊及結(jié)果生成模塊;
...【技術(shù)特征摘要】
1.一種基于時(shí)序的兒童藥物性肝損傷數(shù)據(jù)融合與預(yù)測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟1中的納入排除標(biāo)準(zhǔn)包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟1中的研究數(shù)據(jù)集包括標(biāo)準(zhǔn)陽(yáng)性事件組和對(duì)照組:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述相關(guān)事件表型包括癥狀指標(biāo)、實(shí)驗(yàn)室檢查指標(biāo)、人口學(xué)指標(biāo)、目標(biāo)藥物使用指標(biāo)及疾病指標(biāo);
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述非結(jié)構(gòu)化信息包括住院患兒電子病歷數(shù)據(jù)中的病案首頁(yè)信息、入院記錄、日常病程、交接班記錄、查房記錄及術(shù)后首次病程。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述muirfti模型包括依次設(shè)置的文本...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:聶曉璐,彭曉霞,彭亞光,
申請(qǐng)(專(zhuān)利權(quán))人:首都醫(yī)科大學(xué)附屬北京兒童醫(yī)院,
類(lèi)型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。