System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 黄桃AV无码免费一区二区三区,无码中文av有码中文a,精品人妻系列无码天堂
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于醫療術語的匹配方法及裝置制造方法及圖紙

    技術編號:44332854 閱讀:4 留言:0更新日期:2025-02-18 20:41
    本發明專利技術提供了一種基于醫療術語的匹配方法及裝置,其方法包括以下步驟:對依次分段的文本內容、日期和/或數值類型格式的自然語言采用相應的匹配分解方式,得到冗余的分解后的元素集合;將元素集合組合為多個拼接集合;遍歷所述拼接集合,提取拼接集合中元素關聯的字典值集合;得到多個多重集合;從多重集合中取每個分集合進行相似度匹配,并將匹配結果倒序排列,完成自動匹配。通過該方法及裝置,實現了醫療文書中語義識別的能力,不基于語義的規則引擎使得匹配算法泛化能力極大提升,并且在多個應用場景之間可以使用;減少了計算資源的使用量;提高了文本匹配醫療術語的精準性。

    【技術實現步驟摘要】

    本專利技術屬于醫療術語匹配領域,具體涉及一種基于醫療術語的匹配方法及裝置


    技術介紹

    1、電子病歷作為記錄病人在醫院中就診情況的基本信息載體,記錄了大量有意義的數據,然而在現階段的醫療環境中,這些病例信息充斥著大量分布式的異構數據,為醫療信息的表達、存儲、交換、共享、系統協同工作帶來了諸多障礙。若要實現醫療行業的數字化、信息化發展,進而實現高效的醫療資源共享,無疑需要一套電子病歷文書映射為基于醫療術語的標準化數據結構達到醫療信息的表達、交換和共享的目的。

    2、目前,傳統方法都是基于簡單的文本匹配、搜索引擎等,加上人工建立的規則庫進行匹配,存在規則互斥、規則維護效率低、匹配率低等問題。并且不同場景之間可移植性差,需要大量的規則建立,修改系統,并不能滿足后期決策模型的支持。

    3、雖然,近些年隨著人工智能的發展,很多科研工作者提使用基于大數據、深度學習等技術進行文本匹配的研究。但由于醫療術語與普通術語區別較大,對一般語料信息的標注識別難以用于醫療文本,這是因為醫療術語的判斷需要專業人士來進行,這大大提高了醫療文本識別和匹配的成本。


    技術實現思路

    1、本專利技術的目的在于克服以上問題,提供一種基于醫療術語的匹配方法及裝置。本技術中醫生可以自由輸入一段文本,回車后系統自動匹配成標準化結構化數據。

    2、為達到以上目的,本專利技術采取的技術方案是:

    3、一種基于醫療術語的匹配方法,包括如下步驟:

    4、對依次分段的文本內容、日期和/或數值類型格式的自然語言采用相應的匹配分解方式,得到冗余的分解后的元素集合;其中,所述文本內容的自然語言采用的匹配方法包括:將文本內容分為多個文本段;將每個所述文本段字符數+1與醫療術語集合內的元素匹配;其中,若匹配上,記錄所述元素在文本內容的起始偏移位和中止偏移位;

    5、使用遞歸的方法,基于起始偏移位和中止偏移位,將所述元素集合組合為多個拼接集合;

    6、遍歷所述拼接集合,提取所述拼接集合中元素關聯的字典值集合;

    7、基于所述字典值集合,計算笛卡爾積,得到多個多重集合,其中,所述多重集合由多個分集合組成;

    8、從所述多重集合中取每個分集合進行相似度匹配,并將匹配結果倒序排列,完成自動匹配。

    9、作為進一步改進,所述將每個所述文本段字符數+1與醫療術語集合內的元素匹配,包括以下步驟:

    10、若沒有匹配到,則重新取字符數+2與集合內的元素匹配,若再次沒有匹配上,依次遞推,直到匹配上為止;

    11、若匹配上,還記錄所述元素和類型。

    12、作為進一步改進,所述使用遞歸的方法,基于起始偏移位和中止偏移位,將所述元素集合組合為多個拼接集合,包括以下步驟:

    13、設定所取元素集合數量閾值和所述元素集合內部元素數量閾值;

    14、基于所述集合數量閾值和所述元素數量閾值,從所述元素集合中取閾值范圍內的集合數量組成基礎集合;

    15、對所述基礎集合拼接和倒排,得到所述拼接集合。

    16、作為進一步改進,所述基于所述字典值集合,計算笛卡爾積,得到多個多重集合,包括以下步驟:

    17、計算倒序排列完成的所述字典值集合的每層的笛卡爾積,并統計所述笛卡爾積的總量;其中,當所述總量大于500時,中斷計算集合的笛卡爾積;所述笛卡爾積的計算多重集合的公式為a=ai*ai+1,式中,a表示多重集合,ai表示字典值集合;

    18、求得集合的集合x,其中,所述集合x包括多個集合x,所述集合x包括多個元素ai,ai∈a。

    19、作為進一步改進,所述從所述多重集合中取每個分集合進行相似度匹配,包括以下步驟:

    20、取所述集合x中的每個所述集合x,匹配閔主任編寫的全部術語組合的集合y;其中,若沒有查詢到匹配的所述集合y,則返回空集合;其中,所述集合y中包括多個術語組合元素yi,所述術語組合元素yi中包含唯一的匹配度,為基礎匹配得分。

    21、作為進一步改進,所述從所述多重集合中取每個分集合進行相似度匹配,進一步包括以下步驟:

    22、將所述元素ai逐個與所述術語組合元素yi中的數據元匹配;

    23、其中,將匹配到的所述元素ai的值賦予值編碼和值名稱屬性,得到病例的基本元素。

    24、作為進一步改進,所述從所述多重集合中取每個分集合進行相似度匹配,進一步還包括以下步驟:

    25、在匹配的過程中,當匹配失敗時,在所述基礎匹配得分的基礎上按照設定權重降低匹配得分;其中,每匹配失敗一次,降低一次所述設定權重值,作為匹配得分;

    26、其中,對于固定預設值的所述術語組合元素yi且和所述元素ai不一致,則所述匹配得分為所述基礎匹配得分-1。

    27、作為進一步改進,所述從所述多重集合中取每個分集合進行相似度匹配,進一步還包括以下步驟:

    28、如果所述自然語言和所述術語組合元素yi等同,則匹配得分為所述基礎匹配得分+10。

    29、作為進一步改進,所述將匹配結果倒序排列,完成自動匹配,包括以下步驟:

    30、基于匹配得分由高到低的順序,對所述元素集合中的所述拼接集合獲取的所述集合y進行第二次合并和排列。

    31、另一方面,本專利技術還提供了一種基于醫療術語的匹配系統,所述系統包括至少一個處理器,以及存儲器,其存儲有指令,當通過至少一個處理器來執行該指令時,實現上述技術方案中的方法。

    32、一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行以實現上述技術方案中的步驟所述的方法。

    33、一種計算機程序產品,所述計算機程序產品包括計算機程序,所述計算機程序被處理器執行時,實現上述技術方案中的步驟所述的方法。

    34、本專利技術的有益效果:

    35、通過該方法及裝置,實現了醫療文書中語義識別的能力,不基于語義的規則引擎使得匹配算法泛化能力極大提升,并且在多個應用場景之間可以使用,不僅可移植性很強,而且也減少了人力資源的介入;當醫療文書匹配時,準確率匹配率能穩定在95%,達到了使用的要求;當文本內容過長時,組合的數量可能很多,所以只考慮內部元素數量少于等于8個的集合,然后對集合內元素做文本拼接、倒排,將最接近用戶輸入的內容放在最前面,減少了計算資源的使用量;醫療術語引入數據元的概念,提高了文本匹配醫療術語的精準性;通過本專利技術可以將醫療文字內容進行結構化分解和存儲,有利于進行科研分析。

    本文檔來自技高網...

    【技術保護點】

    1.一種基于醫療術語的匹配方法,其特征在于,包括以下步驟:

    2.根據權利要求1所述的一種基于醫療術語的匹配方法,其特征在于,所述將每個所述文本段字符數+1與醫療術語集合內的元素匹配,包括以下步驟:

    3.根據權利要求1所述的一種基于醫療術語的匹配方法,其特征在于,所述使用遞歸的方法,基于起始偏移位和中止偏移位,將所述元素集合組合為多個拼接集合,包括以下步驟:

    4.根據權利要求1所述的一種基于醫療術語的匹配方法,其特征在于,所述基于所述字典值集合,計算笛卡爾積,得到多個多重集合,包括以下步驟:

    5.根據權利要求4所述的一種基于醫療術語的匹配方法,其特征在于,所述從所述多重集合中取每個分集合進行相似度匹配,包括以下步驟:

    6.根據權利要求5所述的一種基于醫療術語的匹配方法,其特征在于,所述從所述多重集合中取每個分集合進行相似度匹配,進一步包括以下步驟:

    7.根據權利要求5所述的一種基于醫療術語的匹配方法,其特征在于,所述從所述多重集合中取每個分集合進行相似度匹配,進一步還包括以下步驟:

    8.根據權利要求5所述的一種基于醫療術語的匹配方法,其特征在于,所述從所述多重集合中取每個分集合進行相似度匹配,進一步還包括以下步驟:

    9.根據權利要求5所述的一種基于醫療術語的匹配方法,其特征在于,所述將匹配結果倒序排列,完成自動匹配,包括以下步驟:

    10.一種基于醫療術語的匹配裝置,所述裝置包括至少一個處理器,以及存儲器,其存儲有指令,當通過至少一個處理器來執行該指令時,實現如權利要求1-9任一項所述的一種基于醫療術語的匹配方法。

    ...

    【技術特征摘要】

    1.一種基于醫療術語的匹配方法,其特征在于,包括以下步驟:

    2.根據權利要求1所述的一種基于醫療術語的匹配方法,其特征在于,所述將每個所述文本段字符數+1與醫療術語集合內的元素匹配,包括以下步驟:

    3.根據權利要求1所述的一種基于醫療術語的匹配方法,其特征在于,所述使用遞歸的方法,基于起始偏移位和中止偏移位,將所述元素集合組合為多個拼接集合,包括以下步驟:

    4.根據權利要求1所述的一種基于醫療術語的匹配方法,其特征在于,所述基于所述字典值集合,計算笛卡爾積,得到多個多重集合,包括以下步驟:

    5.根據權利要求4所述的一種基于醫療術語的匹配方法,其特征在于,所述從所述多重集合中取每個分集合進行相似度匹配,包括以下步驟:

    6.根據權利要求5所述的一種基于醫療...

    【專利技術屬性】
    技術研發人員:陸軍
    申請(專利權)人:常州昊澤信息科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产精品无码一区二区三区电影| 成人免费无遮挡无码黄漫视频| 中文成人无码精品久久久不卡| 九九久久精品无码专区| 亚洲国产一二三精品无码| 无码人妻精品一区二区三区99性 | 亚洲精品无码人妻无码| 无码AV动漫精品一区二区免费| 色欲A∨无码蜜臀AV免费播 | 国产台湾无码AV片在线观看| 精品国产aⅴ无码一区二区| 天堂Aⅴ无码一区二区三区| 亚洲精品无码mⅴ在线观看| 亚洲av无码一区二区三区网站| 国产精品成人一区无码| 中文字幕无码免费久久99| 无码专区久久综合久中文字幕| 亚洲AV无码乱码在线观看| 97无码免费人妻超级碰碰夜夜| 91精品久久久久久无码| 人妻无码αv中文字幕久久 | 久久精品aⅴ无码中文字字幕不卡 久久精品aⅴ无码中文字字幕重口 | 免费看又黄又无码的网站| 中文字幕无码日韩专区免费| 国产在线拍揄自揄拍无码视频| 亚洲va成无码人在线观看| 国产激情无码一区二区app| 精品无码综合一区| 曰韩无码AV片免费播放不卡| 无码人妻精品丰满熟妇区| 日本精品人妻无码免费大全| 亚洲av永久无码嘿嘿嘿| 色综合久久无码中文字幕| 无码乱人伦一区二区亚洲| 午夜亚洲AV日韩AV无码大全 | 人妻无码αv中文字幕久久琪琪布| 亚洲AV无码乱码在线观看富二代| 国产AV巨作情欲放纵无码| 无码人妻精品一区二区三区东京热| 亚洲va无码专区国产乱码| 久久久无码精品亚洲日韩按摩|