System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及自然語言處理,更具體的說是涉及一種基于知識增強神經網絡模型的藥品不良事件檢測方法及系統。
技術介紹
1、目前,藥品不良反應(adverse?drug?reactions,adr)的檢測與分析是現代醫學和藥物監管領域中的關鍵問題。隨著生物醫學研究的不斷深入和醫療數據的快速增長,尤其是源自電子健康記錄、藥物數據庫和學術文獻的文本數據,如何高效識別和處理這些文本中的關鍵醫學信息成為一大挑戰。藥品不良反應的及時發現和準確檢測對于藥物安全、患者治療以及醫療決策具有重要意義,能夠幫助減少藥物相關的醫療風險,保障患者安全。
2、近年來,深度學習技術的發展為藥品不良反應檢測帶來了新思路。卷積神經網絡(cnn)、循環神經網絡(rnn)以及長短時記憶網絡(lstm)等模型能夠自動學習文本中的復雜特征,捕捉潛在的語義關聯,并提高檢測的精度。此外,基于自注意力機制的預訓練語言模型(如biobert)在處理生物醫學文本時表現出卓越的性能,這些模型能夠通過大規模預訓練捕捉藥物和不良反應的復雜關系。
3、盡管深度學習在藥品不良反應檢測中的應用取得了顯著進展,但仍然存在一些難題。現有的大多數模型主要聚焦于文本的內部特征分析,忽視了外部知識的引入與整合,而藥品不良反應的表達通常與特定的醫學背景和臨床語境高度相關。因此,僅依賴文本數據進行檢測,難以全面提升檢測的準確性和魯棒性。
4、因此,如何在藥品不良反應檢測中有效結合外部知識,進而提高藥品不良反應檢測的準確性和魯棒性是本領域技術人員亟需解決的問題。
/>技術實現思路
1、有鑒于此,本專利技術提供了一種基于知識增強神經網絡模型的藥品不良事件檢測方法及系統,通過整合外部醫學知識庫中的實體描述信息和深度學習技術,提高了藥品不良反應檢測的準確性和魯棒性。
2、為了實現上述目的,本專利技術采用如下技術方案:
3、一種基于知識增強神經網絡模型的藥品不良事件檢測方法,包括:
4、s1獲取待檢測的生物醫學文本并進行預處理,得到詞性標注張量、依存關系張量和實體跨度張量;
5、s2基于外部知識庫獲取與所述生物醫學文本中實體對應的描述信息并選取關鍵詞,得到實體關鍵詞集合;
6、s3基于預訓練語言模型對所述生物醫學文本和所述實體關鍵詞集合進行處理,對應得到文本語義向量和關鍵詞嵌入向量;
7、s4基于所述詞性標注張量、所述依存關系張量、所述實體跨度張量和所述文本語義向量融合后輸入至transformer網絡,得到文本全局語義表示;
8、s5基于所述關鍵詞嵌入向量輸入至卷積神經網絡,得到關鍵詞局部特征;
9、s6基于所述實體跨度張量、所述文本全局語義表示和所述關鍵詞局部特征,輸出實體關系聯合檢測結果。
10、優選的,s1中的預處理具體包括:
11、基于所述生物醫學文本進行分詞和句法分析,提取詞匯的詞性標注以及句子的依存關系對應生成詞性標簽序列和依存關系序列,并標注實體的起始結束位置;
12、所述詞性標簽序列和所述依存關系序列基于詞索引對應轉化為詞性標簽矩陣和所述依存關系矩陣;
13、基于所述實體的起始結束位置得到實體跨度信息;
14、基于所述詞性標簽矩陣、所述依存關系矩陣和所述實體跨度信息對應轉化為所述詞性標注張量、所述依存關系張量和所述實體跨度張量。
15、優選的,s2中得到實體關鍵詞集合,具體包括:
16、基于所述描述信息中的每個詞語分別計算tf-idf分數;
17、基于對應的所述tf-idf分數對所有的詞語進行降序排序,得到排序結果;
18、基于所述排序結果選取前預設數量的詞語作為實體關鍵詞,組成所述實體關鍵詞集合。
19、優選的,所述tf-idf分數計算公式為:
20、
21、其中,ft,d表示詞語t在描述信息d中的出現次數,ft',d表示描述信息d中所有詞(包括t本身)的總出現次數,n表示從外部知識庫中提取的所有相關文檔的總數,z表示針對某個特定實體從外部知識庫中提取的文檔集合,|{d'∈z:t∈d'}|表示包含詞語t的文檔數量。
22、優選的,s3中得到文本語義向量和關鍵詞嵌入向量,具體包括:
23、基于所述預訓練語言模型對所述生物醫學文本進行詞嵌入處理,得到所述文本語義向量v:
24、v=biobert(tokens);
25、其中,biobert表示預訓練語言模型,tokens表示經過預處理的生物醫學文本中的詞匯序列;
26、基于所述預訓練語言模型對所述實體關鍵詞集合進行詞嵌入處理,得到所述關鍵詞嵌入向量ke:
27、ke=biobert(keywords);
28、其中,keywords表示實體關鍵詞集合。
29、優選的,s4中得到文本全局語義表示,具體包括:
30、基于所述詞性標注張量tpos、所述依存關系張量tdep、所述實體跨度張量tspan和所述文本語義向量v進行融合,得到綜合語義特征表示f:
31、
32、其中,表示特征拼接操作;
33、基于所述綜合語義特征表示f輸入至所述transformer網絡,得到所述文本全局語義表示ht:
34、ht=transformer(f);
35、其中,transformer表示transformer網絡。
36、優選的,s6中輸出實體關系聯合檢測結果,具體包括:
37、基于所述文本全局語義表示ht和所述關鍵詞局部特征進行拼接,得到聯合特征;
38、基于所述聯合特征與所述實體跨度張量tspan進行最大池化操作,得到每個實體對應的實體特征;
39、基于所述實體特征得到實體類別概率分布;
40、基于任意兩個所述實體特征得到關系類別概率分布;
41、基于所述實體類別概率分布和所述關系類別概率分布作為所述實體關系聯合檢測結果。
42、優選的,所述實體類別概率分布獲取方法為:
43、基于所述實體特征通過全連接層映射到實體類別空間,并通過第一激活函數預測得到所述實體類別概率分布;
44、所述關系類別概率分布獲取方法為:
45、基于任意兩個所述實體特征進行拼接,得到實體對關系特征;
46、基于所述實體對關系特征通過所述全連接層映射到實體類別空間,并通過第二激活函數預測兩個實體之間的關系類別,得到所述關系類別概率分布。
47、優選的,從生物醫學數據庫和文獻資源中采集待檢測的生物醫學文本,通過自然語言處理工具進行文本解析,輸出藥品實體和不良反應實體之間的關系,作為實體關系聯合檢測結果。
48、一種基于知識增強神經網絡模型的藥品不良事件檢測系統,包括:數據處理模塊、實體關鍵詞生成模塊、預訓練本文檔來自技高網...
【技術保護點】
1.一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,包括:
2.根據權利要求1所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,S1中的預處理具體包括:
3.根據權利要求1所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,S2中得到實體關鍵詞集合,具體包括:
4.根據權利要求3所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,所述TF-IDF分數計算公式為:
5.根據權利要求3所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,S3中得到文本語義向量和關鍵詞嵌入向量,具體包括:
6.根據權利要求5所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,S4中得到文本全局語義表示,具體包括:
7.根據權利要求6所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,S6中輸出實體關系聯合檢測結果,具體包括:
8.根據權利要求7所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方
9.根據權利要求1所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,從生物醫學數據庫和文獻資源中采集待檢測的生物醫學文本,通過自然語言處理工具進行文本解析,輸出藥品實體和不良反應實體之間的關系,作為實體關系聯合檢測結果。
10.一種基于知識增強神經網絡模型的藥品不良事件檢測系統,應用權利要求1-9任一項所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,包括:數據處理模塊、實體關鍵詞生成模塊、預訓練語言模型處理模塊和模型構建與結果輸出模塊;
...【技術特征摘要】
1.一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,包括:
2.根據權利要求1所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,s1中的預處理具體包括:
3.根據權利要求1所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,s2中得到實體關鍵詞集合,具體包括:
4.根據權利要求3所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,所述tf-idf分數計算公式為:
5.根據權利要求3所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,s3中得到文本語義向量和關鍵詞嵌入向量,具體包括:
6.根據權利要求5所述的一種基于知識增強神經網絡模型的藥品不良事件檢測方法,其特征在于,s4中得到文本全局語義表示,具體包括:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。