System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于自然語言處理,具體來說涉及從臨床診療文本中自動(dòng)抽取出診療決策,更具體地說,本專利技術(shù)提出了一種新的醫(yī)療文本決策表示方法,并且提供了一種基于預(yù)訓(xùn)練語言模型與提示工程的醫(yī)療文本決策抽取方法。
技術(shù)介紹
1、臨床決策支持系統(tǒng)(cdss)作為人工智能在醫(yī)學(xué)領(lǐng)域的重要應(yīng)用,旨在提升醫(yī)務(wù)人員在診療決策方面的效率,為醫(yī)學(xué)生的臨床學(xué)習(xí)提供協(xié)助,并為患者提供醫(yī)療建議。其核心在于診療決策規(guī)則,這些規(guī)則將特定的診斷條件與醫(yī)療決策緊密聯(lián)系,以協(xié)助醫(yī)生、患者以及其他相關(guān)方在處理、選擇和決策特定臨床問題時(shí)做出準(zhǔn)確的判斷。一般而言,這些規(guī)則是通過從臨床診療指南和醫(yī)學(xué)教科書的文本中提取,并以診療決策樹的形式進(jìn)行建模。然而,目前構(gòu)建診療決策樹主要依賴于醫(yī)學(xué)專家進(jìn)行繁瑣的手工標(biāo)注,這種方法既耗時(shí)又無法及時(shí)融入最新的研究成果。
2、因此,目前的研究重點(diǎn)集中在如何準(zhǔn)確地從龐大且迅速增長的臨床診療文本中提取診療決策樹的信息,研究學(xué)者目前提出來兩種比較有效的方式,使得醫(yī)學(xué)專家能夠大幅減輕繁瑣的手工標(biāo)注工作,能夠投入更多的人力在診療決策樹的質(zhì)量評(píng)估與應(yīng)用上。第一種方法是雙仿射模型,其核心思想是使用雙仿射模型來預(yù)測任意兩個(gè)三元組在診療決策樹中的位置關(guān)系。首先對(duì)任意兩個(gè)三元組的語義表示使用雙仿射注意力,在標(biāo)簽空間y上獲得概率張量p,然后通過解碼算法依次進(jìn)行節(jié)點(diǎn)、邏輯關(guān)系、樹結(jié)構(gòu)的解碼,將概率張量p解碼為診療決策樹。第二種是基于提示的對(duì)偶對(duì)比學(xué)習(xí)方法,其核心思想是依據(jù)貝葉斯網(wǎng)絡(luò)的假設(shè)對(duì)模型進(jìn)行建模和訓(xùn)練抽取出各個(gè)節(jié)點(diǎn),然后通過多輪問答的方式將模型推理出的
3、這兩種方法雖然減輕了醫(yī)學(xué)專家手工標(biāo)注的工作量,并且抽取的結(jié)果也具備一定的準(zhǔn)確性與實(shí)用性,但也存在一些不足之處。首先從決策知識(shí)的建模形式來講,傳統(tǒng)的診療決策樹建模方式通常是基于特定的診斷條件和醫(yī)療決策建立的。這種方式可能會(huì)忽視臨床文本中豐富的語義信息和上下文,因此無法充分捕捉到?jīng)Q策過程中的細(xì)微變化和復(fù)雜關(guān)聯(lián)。而在復(fù)雜的臨床環(huán)境中,醫(yī)學(xué)知識(shí)和最新的研究成果不斷更新,這些變化可能無法及時(shí)地反映在診療決策樹中,導(dǎo)致判斷依據(jù)的缺失。這可能導(dǎo)致cdss生成的決策無法執(zhí)行,或者在特定情況下產(chǎn)生錯(cuò)誤的結(jié)果。并且,決策樹中節(jié)點(diǎn)的建模方式通常是固定的,缺乏靈活性。這種剛性的建模方式難以應(yīng)對(duì)臨床實(shí)踐中的多樣性和復(fù)雜性,無法靈活地適應(yīng)不同患者的需求和變化的醫(yī)療環(huán)境。因此,在不同的臨床場景和專病中,傳統(tǒng)的決策樹建模方式可能無法提供準(zhǔn)確、個(gè)性化的決策支持。
4、其次,從方法的不足來講,第一種使用雙仿射模型的方式,依賴于預(yù)測三元組之間位置關(guān)系的準(zhǔn)確度。這種方法對(duì)于構(gòu)建決策樹的過程是間接的,需要通過解碼算法將預(yù)測的概率張量解碼為決策樹。因此,如果預(yù)測的位置關(guān)系不準(zhǔn)確,可能會(huì)導(dǎo)致最終生成的決策樹存在錯(cuò)誤或不完整的情況。而第二種基于提示的對(duì)偶對(duì)比學(xué)習(xí)方法,依賴于多輪問答的過程,可能會(huì)受限于問題的質(zhì)量和多輪推理的穩(wěn)定性。如果問題提問不當(dāng)或推理過程中出現(xiàn)錯(cuò)誤,可能會(huì)導(dǎo)致最終生成的決策樹不準(zhǔn)確或不完整。此外,為了訓(xùn)練模型,該方式需要手動(dòng)構(gòu)建對(duì)模型進(jìn)行提示的條件節(jié)點(diǎn)的自然語言描述,并將其拼接在原始文本后。這個(gè)過程需要醫(yī)學(xué)專家的參與,可能需要花費(fèi)大量的時(shí)間和精力。同時(shí),上述的兩種方式,對(duì)于訓(xùn)練數(shù)據(jù)都有著較高的需求,獲取這些標(biāo)注數(shù)據(jù)需要投入大量的人力資源和時(shí)間,并且標(biāo)注的過程可能存在主觀誤差,從而影響模型的性能。并且傳統(tǒng)的小規(guī)模預(yù)訓(xùn)練模型在邏輯推理能力方面表現(xiàn)不足,決策樹的生成過程主要依賴于機(jī)器學(xué)習(xí)中的概率模擬,而非真正對(duì)決策流程的邏輯理解。
5、綜上所述,亟需設(shè)計(jì)一種新的醫(yī)療文本決策表示方法以及一種基于預(yù)訓(xùn)練語言模型與提示工程的醫(yī)療文本決策抽取方法來解決上述問題。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本專利技術(shù)提出了一種新的決策表示方法,使用if-else與自然語言構(gòu)成的決策偽代碼,解決了傳統(tǒng)決策建模方案中,決策樹表示方法導(dǎo)致決策語義丟失所造成的決策樹實(shí)用性不強(qiáng)的問題。其次本專利技術(shù)提供了一種基于預(yù)訓(xùn)練語言模型與提示工程的醫(yī)療文本決策抽取方法。第一,為了將醫(yī)療文本轉(zhuǎn)化為決策偽代碼,本專利技術(shù)提出一種基于提示工程的樣例生成算法。第二,為了將決策偽代碼轉(zhuǎn)化為決策樹,本專利技術(shù)提出一種決策偽代碼轉(zhuǎn)換前序二叉樹的算法。第三,為了保證llm輸出的穩(wěn)定性,本專利技術(shù)構(gòu)建了一套完整的提示工程框架,增強(qiáng)了方法的魯棒性。
2、本專利技術(shù)的技術(shù)路線實(shí)現(xiàn)形式為:首先確定輕量的信息抽取模型,比如gplinker(一種基于globalpointer的實(shí)體關(guān)系聯(lián)合抽取模型),對(duì)醫(yī)療決策文本進(jìn)行三元組抽取。然后對(duì)醫(yī)療決策文本與醫(yī)療決策三元組進(jìn)行提示工程,使用大規(guī)模的預(yù)訓(xùn)練語言模型,比如chatgpt,依照預(yù)定義的決策偽代碼規(guī)范,抽取出醫(yī)療文本所對(duì)應(yīng)的決策偽代碼。最后通過決策偽代碼轉(zhuǎn)換前序二叉樹的算法,將決策偽代碼轉(zhuǎn)換為前序決策二叉樹。
3、本專利技術(shù)適用于從臨床診療文本中自動(dòng)抽取診療決策樹(完全二叉樹)任務(wù),并且提出的決策偽代碼表示方法適用于各種臨床醫(yī)療決策的下游任務(wù),如臨床醫(yī)療決策支持、臨床培訓(xùn)與教育、以及臨床研究和質(zhì)量評(píng)估等。具體步驟為:
4、s1、使用輕量的信息抽取模型,抽取出臨床診療文本所對(duì)應(yīng)的三元組,其中三元組依照關(guān)系類型被分為條件三元組與決策三元組;
5、s2、獲取示例數(shù)據(jù)集,使用knn鄰近算法計(jì)算臨床診療文本與示例數(shù)據(jù)集中各個(gè)示例文本之間的相似度,找到top?k個(gè)示例后,k為大于0且小于10的正整數(shù),通過樣例生成算法構(gòu)造k個(gè)示例文本所對(duì)應(yīng)的決策偽代碼,從而生成k個(gè)樣例,s1,s2,…,sk,所述示例數(shù)據(jù)集中包含了400條臨床診療文本以及其對(duì)應(yīng)的決策樹;
6、s3、將臨床診療文本、文本對(duì)應(yīng)的條件三元組、k個(gè)樣例、錯(cuò)誤信息,通過預(yù)定義的提示模版構(gòu)造提示,輸入到llm中,返回決策偽代碼,所述錯(cuò)誤信息是指條件三元組與決策三元組中,三元組所表示的語義沒有出現(xiàn)在決策偽代碼中的三元組,錯(cuò)誤信息的初始值為空,所述決策偽代碼為使用if-else關(guān)鍵字與自然語言構(gòu)成的決策流程表示;
7、s4、通過驗(yàn)證算法判斷決策偽代碼的生成質(zhì)量,如果質(zhì)量到達(dá)目標(biāo)要求或超過最大迭代次數(shù)m,執(zhí)行s5,如果質(zhì)量沒有到達(dá)目標(biāo)要求,將質(zhì)量沒有達(dá)到要求的部分加入到錯(cuò)誤信息后返回執(zhí)行s3,并且迭代次數(shù)加1;
8、s5、通過決策偽代碼轉(zhuǎn)換前序二叉樹的算法,將決策偽代碼轉(zhuǎn)化為決策樹。
9、進(jìn)一步地,步驟s2包括:
10、s21、將臨床診療文本通過embedding模型轉(zhuǎn)化為向量表示t0;
11、s22、使用knn鄰近算法計(jì)算出示例數(shù)據(jù)集中與臨床診療文本t0最相似的k個(gè)臨床診療文本,t1,t2,…,tk,并讀取k個(gè)鄰近本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于預(yù)訓(xùn)練語言模型與提示工程的醫(yī)療決策抽取方法,其特征在于,具體步驟為:
2.根據(jù)權(quán)利要求1所述的一種基于預(yù)訓(xùn)練語言模型與提示工程的醫(yī)療決策抽取方法,其特征在于,所述的步驟S2具體包括:
3.根據(jù)權(quán)利要求1所述的一種基于預(yù)訓(xùn)練語言模型與提示工程的醫(yī)療決策抽取方法,其特征在于,所述的步驟S4具體包括:
4.根據(jù)權(quán)利要求1所述的一種基于預(yù)訓(xùn)練語言模型與提示工程的醫(yī)療文本決策樹抽取方法,其特征在于,所述的步驟S5具體包括:
【技術(shù)特征摘要】
1.一種基于預(yù)訓(xùn)練語言模型與提示工程的醫(yī)療決策抽取方法,其特征在于,具體步驟為:
2.根據(jù)權(quán)利要求1所述的一種基于預(yù)訓(xùn)練語言模型與提示工程的醫(yī)療決策抽取方法,其特征在于,所述的步驟s2具體包括:
3.根據(jù)權(quán)利...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王曉俊,葉琪,侯瑞輝,阮彤,劉井平,翟潔,
申請(qǐng)(專利權(quán))人:華東理工大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。