System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及醫(yī)學(xué)影像數(shù)據(jù)處理,具體涉及一種針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法。
技術(shù)介紹
1、醫(yī)學(xué)影像報(bào)告是醫(yī)生根據(jù)醫(yī)學(xué)影像設(shè)備生成的圖像,經(jīng)過觀察和分析后撰寫的一份詳細(xì)報(bào)告,其在醫(yī)學(xué)診斷中扮演著重要角色。醫(yī)學(xué)影像報(bào)告能夠提供診斷依據(jù),能夠?yàn)獒t(yī)生提供詳細(xì)的患者病情信息,有助于醫(yī)生做出準(zhǔn)確的診斷和治療方案,同時(shí)醫(yī)學(xué)影像報(bào)告是醫(yī)生與患者進(jìn)行有效溝通的重要工具,能夠幫助患者更好地了解自己的病情,提高治療的依從性,進(jìn)一步促進(jìn)醫(yī)患溝通。
2、隨著計(jì)算機(jī)和大數(shù)據(jù)技術(shù)的快速發(fā)展,深度學(xué)習(xí)在各個(gè)領(lǐng)域取得了顯著成果。研究者們通過不斷增加模型的參數(shù)數(shù)量,以提升模型的性能,從而誕生了大模型這一概念。大模型利用大量的數(shù)據(jù)和計(jì)算資源來訓(xùn)練具有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)模型,能夠在各種任務(wù)中取得較好表現(xiàn)。因此,對(duì)大模型進(jìn)行醫(yī)學(xué)知識(shí)的訓(xùn)練,學(xué)習(xí)模擬人類醫(yī)生是當(dāng)前一大發(fā)展趨勢(shì),而醫(yī)學(xué)影像報(bào)告拆分就隸屬于訓(xùn)練醫(yī)學(xué)影像大模型的上游任務(wù)。
3、目前,對(duì)醫(yī)學(xué)影像大模型訓(xùn)練的過程中,對(duì)醫(yī)學(xué)影像報(bào)告并不進(jìn)行相應(yīng)拆分,而是直接全部輸入模型進(jìn)行訓(xùn)練。雖然這種方式能夠?qū)︶t(yī)學(xué)影像大模型進(jìn)行訓(xùn)練,但當(dāng)大模型需要生成針對(duì)性報(bào)告(如鼻咽部報(bào)告等)時(shí)準(zhǔn)確性略顯不足,同時(shí)數(shù)據(jù)標(biāo)注成本較高,不易獲取大批量符合要求的訓(xùn)練數(shù)據(jù)。
技術(shù)實(shí)現(xiàn)思路
1、(一)解決的技術(shù)問題
2、針對(duì)現(xiàn)有技術(shù)所存在的上述缺點(diǎn),本專利技術(shù)提供了一種針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,能夠有效克服現(xiàn)有技術(shù)所存在的難以對(duì)醫(yī)學(xué)影像報(bào)告中的檢查所見
3、(二)技術(shù)方案
4、為實(shí)現(xiàn)以上目的,本專利技術(shù)通過以下技術(shù)方案予以實(shí)現(xiàn):
5、一種針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,包括以下步驟:
6、s1、讀取待拆分的醫(yī)學(xué)影像報(bào)告,并對(duì)醫(yī)學(xué)影像報(bào)告進(jìn)行分句處理,得到檢查所見分句組合和檢查印象分句組合;
7、s2、提取檢查所見分句組合中各檢查所見分句、檢查印象分句組合中各檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量;
8、s3、將檢查所見分句組合中各檢查所見分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查所見分類模型,得到各檢查所見分句對(duì)應(yīng)的檢查所見分類結(jié)果;
9、s4、將檢查印象分句組合中各檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查印象分類模型,得到各檢查印象分句對(duì)應(yīng)的檢查印象分類結(jié)果;
10、s5、對(duì)檢查所見分類結(jié)果相同的檢查所見分句進(jìn)行合并輸出,對(duì)檢查印象分類結(jié)果相同的檢查印象分句進(jìn)行合并輸出,完成醫(yī)學(xué)影像報(bào)告拆分;
11、其中,檢查所見分類模型和檢查印象分類模型均基于roberta語(yǔ)言模型構(gòu)建。
12、優(yōu)選地,s1中讀取待拆分的醫(yī)學(xué)影像報(bào)告,并對(duì)醫(yī)學(xué)影像報(bào)告進(jìn)行分句處理,得到檢查所見分句組合和檢查印象分句組合,包括:
13、s11、讀取待拆分的醫(yī)學(xué)影像報(bào)告;
14、s12、根據(jù)預(yù)設(shè)文本結(jié)束符號(hào)對(duì)醫(yī)學(xué)影像報(bào)告進(jìn)行分句處理,并區(qū)分對(duì)應(yīng)于檢查所見、檢查印象的分句,分別得到檢查所見分句組合、檢查印象分句組合。
15、優(yōu)選地,s2中提取檢查所見分句組合中各檢查所見分句、檢查印象分句組合中各檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量,包括:
16、s21、統(tǒng)計(jì)檢查所見分句組合和檢查印象分句組合中所有分句包含的最大文字個(gè)數(shù)n;
17、s22、對(duì)bert分詞器進(jìn)行初始化,將分句最大長(zhǎng)度設(shè)置為最大文字個(gè)數(shù)n;
18、s23、將檢查所見分句組合中各檢查所見分句、檢查印象分句組合中各檢查印象分句分別輸入bert分詞器,得到對(duì)應(yīng)的詞向量和掩碼向量。
19、優(yōu)選地,s3中將檢查所見分句組合中各檢查所見分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查所見分類模型,得到各檢查所見分句對(duì)應(yīng)的檢查所見分類結(jié)果,包括:
20、s31、將檢查所見分句組合中檢查所見分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查所見分類模型,檢查所見分類模型輸出檢查所見分句屬于各類別標(biāo)簽的概率預(yù)測(cè)值;
21、s32、選擇最大概率預(yù)測(cè)值的類別標(biāo)簽作為候選分類結(jié)果,并判斷最大概率預(yù)測(cè)值與預(yù)設(shè)閾值之間的關(guān)系;
22、s33、若最大概率預(yù)測(cè)值大于預(yù)設(shè)閾值,則將候選分類結(jié)果作為檢查所見分句對(duì)應(yīng)的檢查所見分類結(jié)果,否則根據(jù)檢查所見分句內(nèi)容確定對(duì)應(yīng)的檢查所見分類結(jié)果;
23、s34、重復(fù)s31~s33,直至檢查所見分句組合中所有檢查所見分句均得到對(duì)應(yīng)檢查所見分類結(jié)果。
24、優(yōu)選地,s4中將檢查印象分句組合中各檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查印象分類模型,得到各檢查印象分句對(duì)應(yīng)的檢查印象分類結(jié)果,包括:
25、s41、將檢查印象分句組合中檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查印象分類模型,檢查印象分類模型輸出檢查印象分句屬于各類別標(biāo)簽的概率預(yù)測(cè)值;
26、s42、選擇最大概率預(yù)測(cè)值的類別標(biāo)簽作為候選分類結(jié)果,并判斷最大概率預(yù)測(cè)值與預(yù)設(shè)閾值之間的關(guān)系;
27、s43、若最大概率預(yù)測(cè)值大于預(yù)設(shè)閾值,則將候選分類結(jié)果作為檢查印象分句對(duì)應(yīng)的檢查印象分類結(jié)果,否則根據(jù)檢查印象分句內(nèi)容確定對(duì)應(yīng)的檢查印象分類結(jié)果;
28、s44、重復(fù)s41~s43,直至檢查印象分句組合中所有檢查印象分句均得到對(duì)應(yīng)檢查印象分類結(jié)果。
29、優(yōu)選地,s1中讀取待拆分的醫(yī)學(xué)影像報(bào)告,并對(duì)醫(yī)學(xué)影像報(bào)告進(jìn)行分句處理,得到檢查所見分句組合和檢查印象分句組合之前,包括:
30、s01、獲取相關(guān)的醫(yī)學(xué)影像報(bào)告及包含的檢查項(xiàng)目類別,根據(jù)檢查項(xiàng)目類別設(shè)置類別標(biāo)簽;
31、s02、根據(jù)檢查項(xiàng)目類別對(duì)醫(yī)學(xué)影像報(bào)告進(jìn)行分類,得到各類別標(biāo)簽對(duì)應(yīng)的醫(yī)學(xué)影像報(bào)告數(shù)據(jù)集;
32、s03、對(duì)各類別標(biāo)簽對(duì)應(yīng)的醫(yī)學(xué)影像報(bào)告數(shù)據(jù)集進(jìn)行分句處理,得到各類別標(biāo)簽對(duì)應(yīng)的檢查所見分句數(shù)據(jù)集和檢查印象分句數(shù)據(jù)集;
33、s04、將各類別標(biāo)簽對(duì)應(yīng)的檢查所見分句數(shù)據(jù)集合并為檢查所見分句集合,將各類別標(biāo)簽對(duì)應(yīng)的檢查印象分句數(shù)據(jù)集合并為檢查印象分句集合;
34、s05、提取檢查所見分句集合中各檢查所見分句、檢查印象分句集合中各檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量,完成檢查所見分句歷史數(shù)據(jù)集和檢查印象分句歷史數(shù)據(jù)集的構(gòu)建;
35、s06、利用檢查所見分句歷史數(shù)據(jù)集對(duì)檢查所見分類模型進(jìn)行模型訓(xùn)練;
36、s07、利用檢查印象分句歷史數(shù)據(jù)集對(duì)檢查印象分類模型進(jìn)行模型訓(xùn)練。
37、優(yōu)選地,s01中獲取相關(guān)的醫(yī)學(xué)影像報(bào)告及包含的檢查項(xiàng)目類別,根據(jù)檢查項(xiàng)目類別設(shè)置類別標(biāo)簽,包括:
38、獲取相關(guān)的醫(yī)學(xué)影像報(bào)告及包含的檢查項(xiàng)目類別,將各檢查項(xiàng)目類別從0開始編號(hào)作為對(duì)應(yīng)的類別標(biāo)簽。
39、優(yōu)選地,s03中對(duì)各類別標(biāo)簽對(duì)應(yīng)的醫(yī)學(xué)影像報(bào)告數(shù)據(jù)集進(jìn)行分句處理,得到各類別標(biāo)簽對(duì)應(yīng)的檢查所見分句數(shù)據(jù)集和本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:包括以下步驟:
2.根據(jù)權(quán)利要求1所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:S1中讀取待拆分的醫(yī)學(xué)影像報(bào)告,并對(duì)醫(yī)學(xué)影像報(bào)告進(jìn)行分句處理,得到檢查所見分句組合和檢查印象分句組合,包括:
3.根據(jù)權(quán)利要求2所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:S2中提取檢查所見分句組合中各檢查所見分句、檢查印象分句組合中各檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量,包括:
4.根據(jù)權(quán)利要求3所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:S3中將檢查所見分句組合中各檢查所見分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查所見分類模型,得到各檢查所見分句對(duì)應(yīng)的檢查所見分類結(jié)果,包括:
5.根據(jù)權(quán)利要求3所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:S4中將檢查印象分句組合中各檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查印象分類模型,得到各檢查印象分句對(duì)應(yīng)的檢查印象分類結(jié)果,包括:
6.根據(jù)權(quán)利要求3所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,
7.根據(jù)權(quán)利要求6所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:S01中獲取相關(guān)的醫(yī)學(xué)影像報(bào)告及包含的檢查項(xiàng)目類別,根據(jù)檢查項(xiàng)目類別設(shè)置類別標(biāo)簽,包括:
8.根據(jù)權(quán)利要求6所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:S03中對(duì)各類別標(biāo)簽對(duì)應(yīng)的醫(yī)學(xué)影像報(bào)告數(shù)據(jù)集進(jìn)行分句處理,得到各類別標(biāo)簽對(duì)應(yīng)的檢查所見分句數(shù)據(jù)集和檢查印象分句數(shù)據(jù)集,包括:
9.根據(jù)權(quán)利要求6所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:S06中利用檢查所見分句歷史數(shù)據(jù)集對(duì)檢查所見分類模型進(jìn)行模型訓(xùn)練,包括:
10.根據(jù)權(quán)利要求9所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:S07中利用檢查印象分句歷史數(shù)據(jù)集對(duì)檢查印象分類模型進(jìn)行模型訓(xùn)練,包括:
...【技術(shù)特征摘要】
1.一種針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:包括以下步驟:
2.根據(jù)權(quán)利要求1所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:s1中讀取待拆分的醫(yī)學(xué)影像報(bào)告,并對(duì)醫(yī)學(xué)影像報(bào)告進(jìn)行分句處理,得到檢查所見分句組合和檢查印象分句組合,包括:
3.根據(jù)權(quán)利要求2所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:s2中提取檢查所見分句組合中各檢查所見分句、檢查印象分句組合中各檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量,包括:
4.根據(jù)權(quán)利要求3所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:s3中將檢查所見分句組合中各檢查所見分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查所見分類模型,得到各檢查所見分句對(duì)應(yīng)的檢查所見分類結(jié)果,包括:
5.根據(jù)權(quán)利要求3所述的針對(duì)大模型訓(xùn)練的醫(yī)學(xué)影像報(bào)告拆分方法,其特征在于:s4中將檢查印象分句組合中各檢查印象分句對(duì)應(yīng)的詞向量和掩碼向量輸入預(yù)訓(xùn)練的檢查印象分類模型,得到各檢查印象分句對(duì)應(yīng)的檢查印象分類結(jié)果,包...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:劉明,楊保光,許曉倩,代詩(shī)琛,
申請(qǐng)(專利權(quán))人:安徽影聯(lián)云享醫(yī)療科技有限公司,
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。