• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于語音語義的疾病實體匹配方法、裝置及計算機設備制造方法及圖紙

    技術編號:27006815 閱讀:19 留言:0更新日期:2021-01-08 17:10
    本申請實施例屬于人工智能領域,可應用于醫療科技領域,涉及一種基于語音語義的疾病實體匹配方法、裝置、計算機設備及存儲介質,所述方法包括:獲取包含匹配疾病實體對的疾病實體匹配詞典以及候選疾病實體;對候選疾病實體進行兩兩組合,得到候選疾病實體對集合,并從中隨機抽取候選疾病實體對;以抽取到的候選疾病實體對作為負樣本、匹配疾病實體對作為正樣本,將正樣本和負樣本輸入初始疾病實體匹配模型進行模型訓練,得到疾病實體匹配模型;獲取待匹配實體并輸入疾病實體匹配模型,得到實體匹配結果。此外,本申請還涉及區塊鏈技術,疾病實體匹配詞典可存儲于區塊鏈中。本申請提高了疾病實體匹配效率。

    【技術實現步驟摘要】
    基于語音語義的疾病實體匹配方法、裝置及計算機設備
    本申請涉及人工智能
    ,尤其涉及一種基于語音語義的疾病實體匹配方法、裝置及計算機設備。
    技術介紹
    病歷是在醫療活動中記錄的個體健康信息,病歷中記錄了疾病實體,即病人所患疾病的名稱。病歷中記載的疾病實體可能存在多種表達,例如,強迫性障礙和強迫癥屬于同一種疾病,因此經常需要判斷兩個疾病實體是否匹配。傳統的疾病實體匹配,有的由人工進行判斷,在疾病實體較多時,人工判斷需要大量時間,效率低下。有的是借助計算機進行疾病實體匹配,例如對疾病實體進行屬性匹配、上下文匹配等。然而,這些匹配技術都需要預先獲取大規模的疾病語料,且對語料質量要求較高,因此語料的收集和預處理所需時間較長,導致疾病實體匹配的效率依然較低。
    技術實現思路
    本申請實施例的目的在于提出一種基于語音語義的疾病實體匹配方法、裝置、計算機設備及存儲介質,以解決疾病實體匹配效率較低的問題。為了解決上述技術問題,本申請實施例提供一種基于語音語義的疾病實體匹配方法,采用了如下所述的技術方案:獲取疾病實體匹配詞典以及候選疾病實體;其中,所述疾病實體匹配詞典中包括匹配疾病實體對;對所述候選疾病實體進行兩兩組合,得到候選疾病實體對集合;從所述候選疾病實體對集合中隨機抽取候選疾病實體對;以抽取到的候選疾病實體對作為負樣本、所述匹配疾病實體對作為正樣本,將所述正樣本和所述負樣本輸入初始疾病實體匹配模型;其中,所述初始疾病實體匹配模型為完成預訓練的BERT模型;根據所述正樣本和所述負樣本訓練所述初始疾病實體匹配模型,得到疾病實體匹配模型;獲取待匹配實體;將所述待匹配實體輸入所述疾病實體匹配模型進行實體匹配,得到實體匹配結果。進一步的,在所述獲取疾病實體匹配詞典以及候選疾病實體的步驟之前還包括:獲取疾病語料信息;通過語義信息識別所述疾病語料信息中的匹配疾病實體對;基于識別到的匹配疾病實體對構建疾病實體匹配詞典。進一步的,所述從所述候選疾病實體對集合中隨機抽取候選疾病實體對的步驟包括:獲取所述候選疾病實體對集合在所述疾病實體匹配詞典中的補集;從所述補集中隨機抽取預設數量的候選疾病實體對;計算抽取到的候選疾病實體對的實體相似度;篩選實體相似度小于相似度閾值的候選疾病實體對。進一步的,所述根據所述正樣本和所述負樣本訓練所述初始疾病實體匹配模型,得到疾病實體匹配模型的步驟包括:將所述正樣本和所述負樣本各自進行拼接,并添加樣本標簽,得到待處理樣本;將所述待處理樣本輸入所述初始疾病實體匹配模型的網絡層,得到所述待處理樣本的表征向量;對所述表征向量進行計算,輸出匹配預測概率;根據所述匹配預測概率和所述樣本標簽計算模型損失;根據所述模型損失調整所述初始疾病實體匹配模型的模型參數,直至模型收斂,得到疾病實體匹配模型。進一步的,在所述以抽取到的候選疾病實體對作為負樣本、所述匹配疾病實體對作為正樣本,將所述正樣本和所述負樣本輸入初始疾病實體匹配模型的步驟之前還包括:獲取醫學語料數據集;將所述醫學語料數據集輸入BERT模型以進行預訓練,得到初始疾病實體匹配模型。進一步的,所述將所述待匹配實體輸入所述疾病實體匹配模型進行實體匹配,得到實體匹配結果的步驟包括:獲取疾病實體詞典;將所述待匹配實體與所述疾病實體詞典中的各疾病實體進行組合,得到第一待匹配實體對;將所述第一待匹配實體對輸入所述疾病實體匹配模型,得到匹配疾病實體對;根據所述匹配疾病實體對,在所述疾病實體詞典中確定與所述待匹配實體相匹配的疾病實體,并將確定的疾病實體作為實體匹配結果。進一步的,所述將所述待匹配實體輸入所述疾病實體匹配模型進行實體匹配,得到實體匹配結果的步驟包括:對所述待匹配實體進行兩兩組合,得到第二待匹配實體對;將所述第二待匹配實體對輸入所述疾病實體匹配模型,得到所述第二待匹配實體對中的匹配疾病實體對,并將得到的匹配疾病實體對作為實體匹配結果。為了解決上述技術問題,本申請實施例還提供一種基于語音語義的疾病實體匹配裝置,采用了如下所述的技術方案:第一獲取模塊,用于獲取疾病實體匹配詞典以及候選疾病實體;其中,所述疾病實體匹配詞典中包括匹配疾病實體對;實體組合模塊,用于對所述候選疾病實體進行兩兩組合,得到候選疾病實體對集合;實體對抽取模塊,用于從所述候選疾病實體對集合中隨機抽取候選疾病實體對;樣本輸入模塊,用于以抽取到的候選疾病實體對作為負樣本、所述匹配疾病實體對作為正樣本,將所述正樣本和所述負樣本輸入初始疾病實體匹配模型;其中,所述初始疾病實體匹配模型為完成預訓練的BERT模型;模型訓練模塊,用于根據所述正樣本和所述負樣本訓練所述初始疾病實體匹配模型,得到疾病實體匹配模型;第二獲取模塊,用于獲取待匹配實體;實體匹配模塊,用于將所述待匹配實體輸入所述疾病實體匹配模型進行實體匹配,得到實體匹配結果。為了解決上述技術問題,本申請實施例還提供一種計算機設備,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器執行所述計算機程序時實現上述所述的基于語音語義的疾病實體匹配方法的步驟。為了解決上述技術問題,本申請實施例還提供一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現上述所述的基于語音語義的疾病實體匹配方法的步驟。與現有技術相比,本申請實施例主要有以下有益效果:獲取疾病實體匹配詞典以及候選疾病實體后,對候選疾病實體進行兩兩組合以構建負樣本,以疾病實體匹配詞典作為正樣本;將正樣本和負樣本輸入初始疾病實體匹配模型以進行充分訓練,初始疾病實體匹配模型可以是完成預訓練的BERT模型,具有豐富的語義信息,當訓練樣本規模較小時也可以獲得精準的匹配效果,縮短了訓練所需時間,提高了疾病實體匹配模型的訓練效率;訓練完成后,疾病實體匹配模型即可對輸入的待匹配實體進行實體匹配,提高了疾病實體匹配的效率。附圖說明為了更清楚地說明本申請中的方案,下面將對本申請實施例描述中所需要使用的附圖作一個簡單介紹,顯而易見地,下面描述中的附圖是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1是本申請可以應用于其中的示例性系統架構圖;圖2是根據本申請的基于語音語義的疾病實體匹配方法的一個實施例的流程圖;圖3是根據本申請的基于語音語義的疾病實體匹配裝置的一個實施例的結構示意圖;圖4是根據本申請的計算機設備的一個實施例的結構示意圖。具體實施方式除非另有定義,本文所使用的所有的技術和科學術語與屬于本申請的
    的技術人員通常理解的含義相同;本文中在申請的說明書中所使用的術語只是為了描述具體的實施例的目的,不是旨本文檔來自技高網
    ...

    【技術保護點】
    1.一種基于語音語義的疾病實體匹配方法,其特征在于,包括下述步驟:/n獲取疾病實體匹配詞典以及候選疾病實體;其中,所述疾病實體匹配詞典中包括匹配疾病實體對;/n對所述候選疾病實體進行兩兩組合,得到候選疾病實體對集合;/n從所述候選疾病實體對集合中隨機抽取候選疾病實體對;/n以抽取到的候選疾病實體對作為負樣本、所述匹配疾病實體對作為正樣本,將所述正樣本和所述負樣本輸入初始疾病實體匹配模型;其中,所述初始疾病實體匹配模型為完成預訓練的BERT模型;/n根據所述正樣本和所述負樣本訓練所述初始疾病實體匹配模型,得到疾病實體匹配模型;/n獲取待匹配實體;/n將所述待匹配實體輸入所述疾病實體匹配模型進行實體匹配,得到實體匹配結果。/n

    【技術特征摘要】
    1.一種基于語音語義的疾病實體匹配方法,其特征在于,包括下述步驟:
    獲取疾病實體匹配詞典以及候選疾病實體;其中,所述疾病實體匹配詞典中包括匹配疾病實體對;
    對所述候選疾病實體進行兩兩組合,得到候選疾病實體對集合;
    從所述候選疾病實體對集合中隨機抽取候選疾病實體對;
    以抽取到的候選疾病實體對作為負樣本、所述匹配疾病實體對作為正樣本,將所述正樣本和所述負樣本輸入初始疾病實體匹配模型;其中,所述初始疾病實體匹配模型為完成預訓練的BERT模型;
    根據所述正樣本和所述負樣本訓練所述初始疾病實體匹配模型,得到疾病實體匹配模型;
    獲取待匹配實體;
    將所述待匹配實體輸入所述疾病實體匹配模型進行實體匹配,得到實體匹配結果。


    2.根據權利要求1所述的基于語音語義的疾病實體匹配方法,其特征在于,在所述獲取疾病實體匹配詞典以及候選疾病實體的步驟之前還包括:
    獲取疾病語料信息;
    通過語義信息識別所述疾病語料信息中的匹配疾病實體對;
    基于識別到的匹配疾病實體對構建疾病實體匹配詞典。


    3.根據權利要求1所述的基于語音語義的疾病實體匹配方法,其特征在于,所述從所述候選疾病實體對集合中隨機抽取候選疾病實體對的步驟包括:
    獲取所述候選疾病實體對集合在所述疾病實體匹配詞典中的補集;
    從所述補集中隨機抽取預設數量的候選疾病實體對;
    計算抽取到的候選疾病實體對的實體相似度;
    篩選實體相似度小于相似度閾值的候選疾病實體對。


    4.根據權利要求1所述的基于語音語義的疾病實體匹配方法,其特征在于,所述根據所述正樣本和所述負樣本訓練所述初始疾病實體匹配模型,得到疾病實體匹配模型的步驟包括:
    將所述正樣本和所述負樣本各自進行拼接,并添加樣本標簽,得到待處理樣本;
    將所述待處理樣本輸入所述初始疾病實體匹配模型的網絡層,得到所述待處理樣本的表征向量;
    對所述表征向量進行計算,輸出匹配預測概率;
    根據所述匹配預測概率和所述樣本標簽計算模型損失;
    根據所述模型損失調整所述初始疾病實體匹配模型的模型參數,直至模型收斂,得到疾病實體匹配模型。


    5.根據權利要求1所述的基于語音語義的疾病實體匹配方法,其特征在于,在所述以抽取到的候選疾病實體對作為負樣本、所述匹配疾病實體對作為正樣本,將所述正樣本和所述負樣本輸入初始疾病實體匹配模型的步驟之前還包括:
    獲取醫學語料數據集;
    將所述醫...

    【專利技術屬性】
    技術研發人員:方春華
    申請(專利權)人:平安科技深圳有限公司
    類型:發明
    國別省市:廣東;44

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲精品国产日韩无码AV永久免费网| 中文字幕无码精品亚洲资源网久久| 永久免费无码网站在线观看个| av无码精品一区二区三区四区| 日韩精品无码视频一区二区蜜桃| 在线观看无码AV网址| 国产精品一区二区久久精品无码| 色欲A∨无码蜜臀AV免费播 | 无码高潮少妇毛多水多水免费| 中文字幕乱码无码人妻系列蜜桃| 亚洲成av人片天堂网无码】| 久久伊人亚洲AV无码网站| 内射人妻无码色AV天堂| 久久无码专区国产精品| 黄A无码片内射无码视频| 无码中文人妻在线一区二区三区| 亚洲大尺度无码专区尤物 | 最新中文字幕av无码专区| 亚洲中久无码永久在线观看同| 无码A级毛片日韩精品| 亚洲精品无码永久在线观看男男| 国产乱子伦精品无码码专区| 国产真人无码作爱免费视频| 国产午夜激无码av毛片| 亚洲熟妇无码一区二区三区导航 | 亚洲AV无码乱码在线观看裸奔| 免费无码国产在线观国内自拍中文字幕| 99久久国产热无码精品免费| 无码中文字幕日韩专区视频| 国产成人精品无码免费看| 亚洲国产综合无码一区| 中出人妻中文字幕无码| 狠狠躁狠狠躁东京热无码专区 | 免费无码黄网站在线看| 日韩精品无码一区二区三区四区| 国产精品无码免费专区午夜| 中文无码乱人伦中文视频在线V| 熟妇人妻中文av无码| 国产在线无码精品电影网| 国产无遮挡无码视频免费软件| 无码人妻AV一二区二区三区|