System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于醫學圖像分類,具體是一種基于批通道歸一化和語義增強的多中心醫學圖像分類方法。
技術介紹
1、基于深度學習的醫學數據分析結果能夠為醫生提供便捷、安全的輔助診斷支持,不僅有助于降低傳統人工診斷的工作量,而且能提升診斷的準確性與效率,已經成為精準醫療領域重要的研究方向,并被廣泛用于疾病篩查、個性化治療方案設計和病情監測等場景。
2、由于醫學數據通常不易獲取,且隱私和倫理問題限制了數據的廣泛共享,醫學數據分析仍然面臨著小樣本問題。由于樣本數據量較少,準確估計真實數據分布變得更加困難,這直接影響了分析模型的可靠性和泛化能力。針對小樣本學習問題,研究者們提出了包括遷移學習、元學習和數據增強等在內的多種方式來增強模型的學習能力,緩解小樣本問題。但是,遷移學習可能因源域與目標域數據的特征差異而引入偏差,元學習通常需要大量樣本和高計算資源,數據增強可能導致增強樣本與真實數據分布不符。
3、相對而言,整合多個醫療中心的數據,構建更大的數據集以訓練高性能的分析模型更加有效。然而,不同醫療中心成像設備的不同會導致生成的數據存在不同程度的差異,同時受采集設備、參數設置以及個體病情差異的影響相同型號的設備生成的數據往往也會存在較大的差異,因此不同中心的數據存在異質性問題,會導致模型在不同中心數據集上的性能差異較大。使用多中心數據集直接進行聯合學習可能會提升模型在不同中心數據集上的泛化性能,但是提升程度有限,甚至會導致在同一中心數據集上的性能下降,有時表現還不及在單個數據集上訓練得到的模型。
4、為了有效解決
技術實現思路
1、針對現有技術的不足,本專利技術擬解決的技術問題是,提供一種基于批通道歸一化和語義增強的多中心醫學圖像分類方法。
2、本專利技術解決所述技術問題采用如下的技術方案:
3、一種基于批通道歸一化和語義增強的多中心醫學圖像分類方法,其特征在于,該方法包括如下步驟:
4、第一步:獲取多中心的醫學圖像,并進行預處理;
5、第二步:構建多中心分類模型;以covid-net網絡為主干網絡,在covid-net網絡的與pepx模塊相連的各個卷積層之后分別嵌入一個特定域批量通道歸一化模塊,得到多中心分類模型;
6、所述特定域批量通道歸一化模塊對每個中心的數據分別從批量和通道兩個維度進行歸一化,再對兩個維度的歸一化結果進行融合,得到歸一化后的特征圖;
7、批量維度的歸一化計算公式為:
8、
9、式中,是批量維度歸一化后的第s個中心的特征圖,是第s個中心的輸入特征圖,分別是第s個中心的批量均值和方差,∈是常數,n表示批量大小,h和w分別為特征圖的高度和寬度;
10、通道維度的歸一化計算公式為:
11、
12、式中,是通道維度歸一化后的第s個中心的特征圖,分別是第s個中心的通道均值和方差;
13、歸一化后的特征圖表示為:
14、
15、式中,ys是第s個中心歸一化后的特征圖,γs、βs、ιs是可學習參數;
16、第三步:對多中心分類模型進行訓練,將訓練后的多中心分類模型用于多中心醫學圖像的分類。
17、進一步的,在訓練過程中利用隱式語義數據增強算法對待饋送到全連接層的特征進行增強,通過式(10)的目標優化函數計算訓練損失;
18、
19、式中,是總訓練損失,是交叉熵損失,lisda是特征級增強損失,α是權重超參數;
20、其中,特征級增強損失lisda滿足:
21、
22、
23、式中,lm是增強特征的交叉熵損失,m是采樣方向的數量,是第i個樣本xi在第m個采樣方向上的特征向量在所有采樣方向上的期望值,是類別yi的權重向量,是類別yi的偏置項,wj、bj是類別j對應的全連接層的權重矩陣和偏置項,c是類別數量,ai是第i個樣本xi在所有采樣方向上的特征向量,是增強后的樣本分布對損失的影響量,是特征擾動方向向量,是類別yi的協方差。
24、進一步的,所述多中心分類模型首先利用一維卷積層對輸入圖像進行投影,投影得到的特征經過一個dsbcn模塊后再進入到兩個分支中進行特征提取;其中一個分支包含多個密集連接的pepx模塊,另一個分支包括四個一維卷積層,每個一維卷積層之后連接一個dsbcn模塊;兩個分支的輸出特征經過一個全局平均池化層生成語義嵌入特征,語義嵌入特征經過展平操作后,輸入到全連接層中進行分類。
25、現有技術相比,本專利技術的有益效果是:
26、1.與傳統的歸一化方法不同,特定域批量通道歸一化模塊(dsbcn)將每個中心作為一個特定域,分別對每個中心的數據從批量和通道兩個維度上進行歸一化,獲取不同中心數據的統計信息,使模型能夠捕捉不同中心的數據分布變化,更精細地提取不同中心的數據特征,有效緩解了跨中心的數據異質性問題,并優化了數據在多個中心間的一致性,顯著提升了在跨中心數據上的分類精度和泛化能力,避免了由于數據來源不同導致的性能下降。
27、2.在模型訓練過程中,采用隱式語義增強算法實現了特征級的數據增強,利用每個類別的特征均值和協方差矩陣生成特征向量,并添加到原始特征上,模擬類內變異性實現樣本的增強,無需額外的訓練開銷,擴展了訓練數據的多樣性,有效緩解了各中心數據不平衡導致模型偏向大樣本量中心的分類偏差和數據分布差異導致的分類性能不穩定,從而改善了模型在小樣本量中心上的分類性能。
本文檔來自技高網...【技術保護點】
1.一種基于批通道歸一化和語義增強的多中心醫學圖像分類方法,其特征在于,該方法包括如下步驟:
2.根據權利要求1所述的基于批通道歸一化和語義增強的多中心醫學圖像分類方法,其特征在于,在訓練過程中利用隱式語義數據增強算法對待饋送到全連接層的特征進行增強,通過式(10)的目標優化函數計算訓練損失;
3.根據權利要求1或2所述的基于批通道歸一化和語義增強的多中心醫學圖像分類方法,其特征在于,所述多中心分類模型首先利用一維卷積層對輸入圖像進行投影,投影得到的特征經過一個DSBCN模塊后再進入到兩個分支中進行特征提取;其中一個分支包含多個密集連接的PEPX模塊,另一個分支包括四個一維卷積層,每個一維卷積層之后連接一個DSBCN模塊;兩個分支的輸出特征經過一個全局平均池化層生成語義嵌入特征,語義嵌入特征經過展平操作后,輸入到全連接層中進行分類。
【技術特征摘要】
1.一種基于批通道歸一化和語義增強的多中心醫學圖像分類方法,其特征在于,該方法包括如下步驟:
2.根據權利要求1所述的基于批通道歸一化和語義增強的多中心醫學圖像分類方法,其特征在于,在訓練過程中利用隱式語義數據增強算法對待饋送到全連接層的特征進行增強,通過式(10)的目標優化函數計算訓練損失;
3.根據權利要求1或2所述的基于批通道歸一化和語義增強的多中心醫...
【專利技術屬性】
技術研發人員:劉坤,李美瑤,李宇航,黃思源,孔令軒,趙悅,張陳晨,王悅竹,李文淅,李基,董公明,
申請(專利權)人:河北工業大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。