System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及文本處理,尤其涉及一種文本語義相似性的判斷方法、電子設備、存儲介質及產品。
技術介紹
1、隨著文本處理技術的飛速發展,通過比較兩個文本在語義上的相似程度,能夠在各種應用場景中實現高效、準確的信息處理和決策制定。
2、目前,對兩段文本的語義進行相似性判斷時,通常是使用預設的模型分別提取兩段文本的句向量特征,進而根據預設的相似性函數算法,來計算兩段文本的句向量特征的語義相似性。
3、但是,上述方式判斷的兩段文本的語義相似性不夠準確,影響用戶體驗。
技術實現思路
1、本申請實施例提供的文本語義相似性的判斷方法、電子設備、存儲介質及產品,用以提高兩段文本語義相似性判斷結果的準確性。
2、第一方面,本申請實施例提供一種文本語義相似性的判斷方法,包括:
3、獲取目標文本以及與所述目標文本相似的標準文本;
4、計算所述目標文本與所述標準文本的相似度;
5、若所述相似度超過預設的相似度閾值,則對所述目標文本中包括的數字與所述標準文本中包括的數字進行一致性判斷,得到數字的判斷結果;
6、若所述數字的判斷結果指示一致,則對所述目標文本中包括的命名體與所述標準文本中包括的命名體進行一致性判斷,得到命名體的判斷結果;
7、若所述命名體的判斷結果指示一致,則輸出用于指示所述目標文本的語義與所述標準文本的語義相似的提示信息。
8、在一種可能的實施方式中,所述對所述目標文本中包括的數字與所述標準
9、基于預設的正則匹配算法,根據所述目標文本中出現的數字的順序,依次提取所述目標文本中包括的數字,以及根據所述標準文本中出現的數字的順序,依次提取所述標準文本中包括的數字;
10、根據提取順序,將所述目標文本中包括的數字依次與所述標準文本中包括的數字進行一致性判斷,得到所述數字的判斷結果;
11、其中,所述數字的判斷結果用于指示所述目標文本中包括的數字與所述標準文本中包括的數字是否相同。
12、在一種可能的實施方式中,所述對所述目標文本中包括的命名體與所述標準文本中包括的命名體進行一致性判斷,得到命名體的判斷結果,包括:
13、基于預設的第一語言模型,設置命名體包含的實體對象的標簽;
14、基于所述實體對象的標簽,根據所述目標文本中出現的標簽的順序,依次識別所述目標文本中包括的命名體,以及根據所述標準文本中出現的標簽的順序,依次識別所述標準文本中包括的命名體;
15、根據識別順序,將所述目標文本中包括的命名體依次與所述標準文本中包括的命名體進行一致性判斷,得到所述命名體的判斷結果;
16、其中,所述命名體的判斷結果用于指示所述目標文本中包括的命名體與所述標準文本中包括的命名體是否相同。
17、在一種可能的實施方式中,所述計算所述目標文本與所述標準文本的相似度,包括:
18、基于預設的第二語言模型,獲取所述目標文本的句子向量特征以及所述標準文本的句子向量特征;
19、基于預設的余弦函數算法,對所述目標文本的句子向量特征以及所述標準文本的句子向量特征進行相似度計算,得到所述相似度。
20、在一種可能的實施方式中,所述獲取目標文本以及與所述目標文本相似的標準文本之后,還包括:
21、基于預設的比較算法,對所述目標文本與所述標準文本進行文字內容相似性判斷,得到判斷結果,所述判斷結果無法指示所述目標文本中包括的數字和命名體是否與所述標準文本中包括的數字和命名體一致;
22、若所述判斷結果指示所述目標文本與所述標準文本的文字內容相似,則執行所述計算所述目標文本與所述標準文本的相似度的步驟。
23、在一種可能的實施方式中,所述方法還包括:
24、若所述命名體的判斷結果指示不一致,則輸出用于指示所述目標文本的語義與所述標準文本的語義不相似的提示信息。
25、第二方面,本申請實施例提供一種文本語義相似性的判斷裝置,包括:
26、獲取模塊,用于獲取目標文本以及與所述目標文本相似的標準文本;
27、計算模塊,用于計算所述目標文本與所述標準文本的相似度;
28、判斷模塊,用于若所述相似度超過預設的相似度閾值,則對所述目標文本中包括的數字與所述標準文本中包括的數字進行一致性判斷,得到數字的判斷結果;
29、所述判斷模塊,還用于若所述數字的判斷結果指示一致,則對所述目標文本中包括的命名體與所述標準文本中包括的命名體進行一致性判斷,得到命名體的判斷結果;
30、輸出模塊,用于若所述命名體的判斷結果指示一致,則輸出用于指示所述目標文本的語義與所述標準文本的語義相似的提示信息。
31、第三方面,本申請實施例提供一種電子設備,包括:存儲器,處理器;
32、所述存儲器存儲計算機執行指令;
33、所述處理器執行所述存儲器存儲的計算機執行指令,使得所述處理器執行如上第一方面各種可能的實施方式。
34、第四方面,本申請實施例提供一種計算機可讀存儲介質,所述計算機可讀存儲介質中存儲有計算機執行指令,所述計算機執行指令被處理器執行時用于實現如上第一方面各種可能的實施方式。
35、第五方面,本申請實施例提供一種計算機程序產品,包括計算機程序,該計算機程序被處理器執行時實現如上第一方面各種可能的實施方式。
36、本申請實施例提供的文本語義相似性的判斷方法、電子設備、存儲介質及產品,通過獲取目標文本以及與目標文本相似的標準文本,若目標文本與標準文本的相似度超過預設的相似度閾值,則說明目標文本與標準文本的文字內容存在相似性,進而對目標文本中包括的數字與標準文本中包括的數字進行一致性判斷,若一致,則說明目標文本與標準文本中包括的數字相同,進而對目標文本中包括的命名體與標準文本中包括的命名體進行一致性判斷,若一致,則說明目標文本與標準文本中的命名體相同,最終輸出用于指示目標文本的語義與標準文本的語義相似的提示信息。本申請通過判斷目標文本與標準文本中的文字內容、數字以及命名體,通過進行多次判斷,提高了目標文本的語義與標準文本的語義相似性判斷的準確性。
本文檔來自技高網...【技術保護點】
1.一種文本語義相似性的判斷方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述對所述目標文本中包括的數字與所述標準文本中包括的數字進行一致性判斷,得到數字的判斷結果,包括:
3.根據權利要求2所述的方法,其特征在于,所述對所述目標文本中包括的命名體與所述標準文本中包括的命名體進行一致性判斷,得到命名體的判斷結果,包括:
4.根據權利要求3所述的方法,其特征在于,所述計算所述目標文本與所述標準文本的相似度,包括:
5.根據權利要求4所述的方法,其特征在于,所述獲取目標文本以及與所述目標文本相似的標準文本之后,還包括:
6.根據權利要求1-5任一項所述的方法,其特征在于,所述方法還包括:
7.一種文本語義相似性的判斷裝置,其特征在于,包括:
8.一種電子設備,其特征在于,包括:存儲器,處理器;
9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有計算機執行指令,所述計算機執行指令被處理器執行時用于實現如權利要求1-6任一項所述的文本語義相似性的判斷方
10.一種計算機程序產品,其特征在于,包括計算機程序,該計算機程序被處理器執行時實現權利要求1-6任一項所述的文本語義相似性的判斷方法。
...【技術特征摘要】
1.一種文本語義相似性的判斷方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述對所述目標文本中包括的數字與所述標準文本中包括的數字進行一致性判斷,得到數字的判斷結果,包括:
3.根據權利要求2所述的方法,其特征在于,所述對所述目標文本中包括的命名體與所述標準文本中包括的命名體進行一致性判斷,得到命名體的判斷結果,包括:
4.根據權利要求3所述的方法,其特征在于,所述計算所述目標文本與所述標準文本的相似度,包括:
5.根據權利要求4所述的方法,其特征在于,所述獲取目標文本以及與所述目標文本相似的標準文...
【專利技術屬性】
技術研發人員:何曉霞,顏巍,張鐸,紀根苗,
申請(專利權)人:中國人民財產保險股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。