System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及模型訓練,具體涉及一種基于數據驅動的炎癥性腸病診斷預測模型的訓練方法、系統、存儲介質和電子設備。
技術介紹
1、隨著經濟與科技水平的提升,人們愈發(fā)重視自身身體的健康狀況。特別地,炎性腸病的診斷逐漸成為人們關注的焦點之一。及時準確的檢測與診斷直接關系到炎癥性腸病患者的住院康復周期,進而節(jié)省大量人力與物力資源。
2、在現代醫(yī)療體系中,隨著醫(yī)學成像技術的快速發(fā)展,影像學在臨床疾病診斷中的作用愈發(fā)重要。尤其是超聲影像技術,它在多種疾病的診斷中扮演關鍵角色。然而,超聲診斷的效果在很大程度上取決于操作醫(yī)生的專業(yè)技能和經驗。同時,超聲醫(yī)生之間的診斷能力存在顯著差異,培養(yǎng)一名高水平的超聲醫(yī)生需要較高的成本與較長的周期。此外,由于診斷結果受到醫(yī)生主觀判斷的影響,導致對同一病例不同醫(yī)生會給出不同的診斷意見。因此,受限于醫(yī)生的專業(yè)知識和診斷經驗,炎性腸病的超聲診斷存在一定的誤診可能性,這直接影響了醫(yī)療診斷的一致性和準確性原則。
3、以計算數據處理技術為核心的輔助診斷系統為上述問題提供了一個突破口,也標志著精準醫(yī)療未來發(fā)展的一個重要趨勢。同時,隨新一代信息技術的發(fā)展及其在臨床中的廣泛應用,臨床診斷數據的大規(guī)模積累成為可能,為運用機器學習方法進行輔助診斷提供了數據基礎。結合計算機輔助診斷技術進行炎性腸病的診斷,不僅有助于構建量化的診斷指標,還可以確保診斷的客觀性和準確性。因此,研究如何快速精準地有效預測出炎性腸病的康復周期是一項有意義的工作,具有非常大的應用前景和經濟效益。
技術實現思路<
1、(一)解決的技術問題
2、針對現有技術的不足,本專利技術提供了一種基于數據驅動的炎癥性腸病診斷預測模型的訓練方法、系統、存儲介質和電子設備,解決了無法快速精準地有效預測出炎性腸病的康復周期的技術問題。
3、(二)技術方案
4、為實現以上目的,本專利技術通過以下技術方案予以實現:
5、一種基于數據驅動的炎癥性腸病診斷預測模型的訓練方法,包括:
6、獲取歷史炎癥性腸病數據;其中,所述歷史炎癥性腸病數據包括若干條涵蓋多項檢查指標的超聲診斷報告文本及其康復周期標簽;
7、對每一條所述超聲診斷報告文本依次進行分詞、關鍵詞信息提取和標準化處理,以獲取標準化后的炎癥性腸病特征矩陣;
8、將所有的標準化后的炎癥性腸病特征矩陣劃分為訓練集和驗證集;
9、將所述訓練集作為bp前饋神經網絡的輸入,并結合所述康復周期標簽,迭代優(yōu)化網絡直至滿足預設的終止條件,以搭建所述炎癥性腸病診斷預測模型;
10、將所述驗證集作為所述炎癥性腸病診斷預測模型的輸入,獲取驗證結果,以評估模型的性能。
11、優(yōu)選的,所述檢查指標包括量化指標和非量化指標;其中:
12、所述量化指標包括腸壁厚度、血流limberg分級、網膜增厚與低回聲結節(jié)、腸壁彈性值;
13、所述非量化指標包括腸管局部狹窄與擴張、cdfi血流信號。
14、優(yōu)選的,所述對每一條所述超聲診斷報告文本依次進行分詞、關鍵詞信息提取和標準化處理;包括:
15、將所述超聲診斷報告文本利用正向最大匹配與反向最大匹配分別進行切分處理,并對比兩種不同方式的切分結果,若切分結果一致,任選一種作為最終的分詞結果;若切分結果不一致,則將其歸為存在歧義的切分結果,隨后依據特定規(guī)則消除歧義;
16、通過預設的特征提取框架識別和提取分詞結果中的關鍵詞信息,并將提取的特征和實體關系轉化為結構化數據格式;
17、對于量化指標腸壁厚度、血流limberg分級、網膜增厚與低回聲結節(jié)、腸壁彈性值,采用如下標準化的處理公式:
18、
19、其中,x是任一量化指標的原始數據值,μ是原始數據的均值,σ是原始數據的標準差;
20、對于非量化指標腸管局部狹窄與擴張、cdfi血流信號,則分為0-1兩個等級。
21、優(yōu)選的,采用k折交叉驗證法劃分所述訓練集和所述驗證集。
22、優(yōu)選的,所述bp前饋神經網絡的訓練過程;包括:
23、step10、網絡初始化:
24、將各層的連接權值賦一個(-1,1)之間的非零隨機數,并設定隱含層各神經元的閾值aj和輸出層各神經元的閾值bk;
25、step20、輸入信號正向傳播:
26、將標準化后的炎癥性腸病特征矩陣設為x=(x1,x2,...,xm)為變量,wij為輸入層的第i個神經元和隱含層的第j個神經元之間的權值,wjk為隱含層的第,個神經元和輸出層的第k個神經元之間的權值;隱含層的第k個神經元的輸入h,的計算公式為:
27、
28、其中,x1,x2,...,xm分別表示不同檢查指標數據的標準化取值,m表示檢查指標的總數;aj為隱含層的第j個神經元的閾值;q表示隱含層的神經元總數;
29、隱含層的第k個神經元的輸出ij的計算公式為:
30、
31、其中,f為激活函數;
32、同理,計算得到輸出層的第k個神經元的輸出值yk為:
33、
34、其中,q表示輸出層的神經元總數;
35、step30、誤差信號反向傳播:
36、輸出層的第k個神經元的預測輸出yk和相應的康復周期標簽tk的誤差公式為:
37、errk=yk(1-yk)(tk-yk),k=1,2,...,l
38、隱含層的第j個神經元的誤差計算公式為:
39、
40、step40、更新權值和閾值:
41、隱含層新的第j個神經元的權值計算公式為:
42、wij=wij+δwij=wij+lerrjxi
43、隱含層的第j個神經元的閾值更新公式為:
44、aj=aj+δaj=aj+lerrj
45、其中,δwij表示從輸入層的第k個神經元到隱含層的第j個神經元的權重變化量;δaj表示隱含層的第j個神經元的閾值變化量;l為學習速率;
46、同理,更新計算輸出層的第k個神經元的權值和閾值;
47、step50、判斷是否達到期望的誤差或最大迭代次數;若達到期望的誤差或最大迭代次數,則結束;否則返回step20。
48、優(yōu)選的,將正確率、roc曲線和auc值作為模型性能的評估指標。
49、一種基于數據驅動的炎癥性腸病診斷預測模型的訓練系統,包括:
50、獲取模塊,用于獲取歷史炎癥性腸病數據;其中,所述歷史炎癥性腸病數據包括若干條涵蓋多項檢查指標的超聲診斷報告文本及其康復周期標簽;
51、處理模塊,用于對每一條所述超聲診斷報告文本依次進行分詞、關鍵詞信息提取和標準化處理,以獲取標準化后的炎癥性腸病特征矩陣;
52、劃分模塊,用于將所有的標準化后的炎癥性腸病特征矩陣劃分為訓練集和本文檔來自技高網...
【技術保護點】
1.一種基于數據驅動的炎癥性腸病診斷預測模型的訓練方法,其特征在于,包括:
2.如權利要求1所述的訓練方法,其特征在于,所述檢查指標包括量化指標和非量化指標;其中:
3.如權利要求2所述的訓練方法,其特征在于,所述對每一條所述超聲診斷報告文本依次進行分詞、關鍵詞信息提取和標準化處理;包括:
4.如權利要求1所述的訓練方法,其特征在于,采用K折交叉驗證法劃分所述訓練集和所述驗證集。
5.如權利要求1所述的訓練方法,其特征在于,所述BP前饋神經網絡的訓練過程;包括:
6.如權利要求1所述的訓練方法,其特征在于,將正確率、ROC曲線和AUC值作為模型性能的評估指標。
7.一種基于數據驅動的炎癥性腸病診斷預測模型的訓練系統,其特征在于,包括:
8.一種存儲介質,其特征在于,其存儲有用于基于數據驅動的炎癥性腸病診斷預測模型的訓練的計算機程序,其中,所述計算機程序使得計算機執(zhí)行如權利要求1~6任一項所述的訓練方法。
9.一種電子設備,其特征在于,包括:
【技術特征摘要】
1.一種基于數據驅動的炎癥性腸病診斷預測模型的訓練方法,其特征在于,包括:
2.如權利要求1所述的訓練方法,其特征在于,所述檢查指標包括量化指標和非量化指標;其中:
3.如權利要求2所述的訓練方法,其特征在于,所述對每一條所述超聲診斷報告文本依次進行分詞、關鍵詞信息提取和標準化處理;包括:
4.如權利要求1所述的訓練方法,其特征在于,采用k折交叉驗證法劃分所述訓練集和所述驗證集。
5.如權利要求1所述的訓練方法,其特征在于...
【專利技術屬性】
技術研發(fā)人員:付超,邱一格,
申請(專利權)人:合肥工業(yè)大學,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。