System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及數據處理領域,特別是涉及一種數據匹配方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品。
技術介紹
1、在數據處理領域中,數據匹配是一項至關重要的任務,它涉及從大量數據中識別并關聯相似或相關的記錄。一般的數據匹配主要基于文本與文本之間的相似性進行,通過比較文本內容來評估匹配程度。一些資料數據遵循特定的結構框架存儲數據,并通過編碼指代實現調用,如為每一項資料數據分配唯一的長整型數值,在節省存儲空間的同時方便檢索和調用。
2、資料數據以編碼格式進行流通,而待匹配的數據卻往往以文本格式呈現,二者格式的差異性使得資料數據和文本數據難以通過傳統的文本相似度匹配方法進行匹配。如何在這種差異性的基礎上實現有效的匹配,成了數據處理領域亟待解決的問題。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種能夠實現資料數據和文本數據匹配的數據匹配方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品。
2、第一方面,本申請提供一種數據匹配方法,包括:
3、獲取待匹配的文本數據;
4、基于所述文本數據與預設關系表中的提示語的匹配結果,確定出與所述文本數據匹配的業務對象,并基于所述業務對象的字段標識獲取候選資料數據標識,所述預設關系表用于表征提示語與業務對象的關聯關系;
5、從所述候選資料數據標識對應的候選資料數據中,提取出所述候選資料數據的描述字段;
6、基于各候選資料數據的描述字段與所述文本數據的相似度
7、第二方面,本申請提供一種數據匹配裝置,包括:
8、文本獲取模塊,用于獲取待匹配的文本數據;
9、數據候選模塊,用于基于所述文本數據與預設關系表中的提示語的匹配結果,確定出與所述文本數據匹配的業務對象,并基于所述業務對象的字段標識獲取候選資料數據標識,所述預設關系表用于表征提示語與業務對象的關聯關系;
10、描述提取模塊,用于從所述候選資料數據標識對應的候選資料數據中,提取出所述候選資料數據的描述字段;
11、數據確定模塊,用于基于各候選資料數據的描述字段與所述文本數據的相似度,從所述候選資料數據中確定出與所述文本數據匹配的目標資料數據。
12、第三方面,本申請提供一種計算機設備,包括存儲器和處理器,存儲器存儲有計算機程序,處理器執行計算機程序時實現:
13、獲取待匹配的文本數據;
14、基于所述文本數據與預設關系表中的提示語的匹配結果,確定出與所述文本數據匹配的業務對象,并基于所述業務對象的字段標識獲取候選資料數據標識,所述預設關系表用于表征提示語與業務對象的關聯關系;
15、從所述候選資料數據標識對應的候選資料數據中,提取出所述候選資料數據的描述字段;
16、基于各候選資料數據的描述字段與所述文本數據的相似度,從所述候選資料數據中確定出與所述文本數據匹配的目標資料數據。
17、第四方面,本申請提供一種計算機可讀存儲介質,其上存儲有計算機程序,計算機程序被處理器執行時實現:
18、獲取待匹配的文本數據;
19、基于所述文本數據與預設關系表中的提示語的匹配結果,確定出與所述文本數據匹配的業務對象,并基于所述業務對象的字段標識獲取候選資料數據標識,所述預設關系表用于表征提示語與業務對象的關聯關系;
20、從所述候選資料數據標識對應的候選資料數據中,提取出所述候選資料數據的描述字段;
21、基于各候選資料數據的描述字段與所述文本數據的相似度,從所述候選資料數據中確定出與所述文本數據匹配的目標資料數據。
22、第五方面,本申請提供一種計算機程序產品,包括計算機程序,計算機程序被處理器執行時實現:
23、獲取待匹配的文本數據;
24、基于所述文本數據與預設關系表中的提示語的匹配結果,確定出與所述文本數據匹配的業務對象,并基于所述業務對象的字段標識獲取候選資料數據標識,所述預設關系表用于表征提示語與業務對象的關聯關系;
25、從所述候選資料數據標識對應的候選資料數據中,提取出所述候選資料數據的描述字段;
26、基于各候選資料數據的描述字段與所述文本數據的相似度,從所述候選資料數據中確定出與所述文本數據匹配的目標資料數據。
27、上述數據匹配方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品,獲取待匹配的文本數據;基于文本數據與預設關系表中的提示語的匹配結果,確定出與文本數據匹配的業務對象,并基于業務對象的字段標識獲取候選資料數據標識,預設關系表用于表征提示語與業務對象的關聯關系;從候選資料數據標識對應的候選資料數據中,提取出候選資料數據的描述字段;基于各候選資料數據的描述字段與文本數據的相似度,從候選資料數據中確定出與文本數據匹配的目標資料數據。本申請通過預設關系表配置各種提示語與業務對象、字段標識的關聯,基于確定出的字段標識從大量的資料數據標識中篩選出了候選資料數據標識。通過確定各候選資料數據的描述字段與文本數據的相似度,可以實現描述字段與文本數據的匹配。由于描述字段為描述資料數據的文本,進而,資料數據與文本數據的匹配被轉換成了文本與文本之間的匹配,從而實現資料數據與文本數據的有效匹配。
本文檔來自技高網...【技術保護點】
1.一種數據匹配方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述預設關系表中包含提示語與業務對象編碼、業務對象的字段標識、字段標識的字段類型的關聯關系,所述基于所述文本數據與預設關系表中的提示語的匹配結果,確定出與所述文本數據匹配的業務對象,并基于所述業務對象的字段標識獲取候選資料數據標識包括:
3.根據權利要求2所述的方法,其特征在于,所述從所述業務對象編碼對應的字段標識中,確定出字段類型為資料數據的目標字段標識包括:
4.根據權利要求1所述的方法,其特征在于,所述獲取待匹配的文本數據之前,還包括:
5.根據權利要求4所述的方法,其特征在于,所述對各資料數據的描述字段進行分詞處理,得到資料數據的分詞結果之后,還包括:
6.根據權利要求4所述的方法,其特征在于,所述基于各候選資料數據的描述字段與所述文本數據的相似度,從所述候選資料數據中確定出與所述文本數據匹配的目標資料數據包括:
7.一種數據匹配裝置,其特征在于,包括:
8.一種計算機設備,包括存儲器和處理器,所述存儲器存
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至6中任一項所述的方法的步驟。
10.一種計算機程序產品,包括計算機程序,其特征在于,該計算機程序被處理器執行時實現權利要求1至6中任一項所述的方法的步驟。
...【技術特征摘要】
1.一種數據匹配方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述預設關系表中包含提示語與業務對象編碼、業務對象的字段標識、字段標識的字段類型的關聯關系,所述基于所述文本數據與預設關系表中的提示語的匹配結果,確定出與所述文本數據匹配的業務對象,并基于所述業務對象的字段標識獲取候選資料數據標識包括:
3.根據權利要求2所述的方法,其特征在于,所述從所述業務對象編碼對應的字段標識中,確定出字段類型為資料數據的目標字段標識包括:
4.根據權利要求1所述的方法,其特征在于,所述獲取待匹配的文本數據之前,還包括:
5.根據權利要求4所述的方法,其特征在于,所述對各資料數據的描述字段進行分詞處理,得到資料數據的分詞結果之后,還...
【專利技術屬性】
技術研發人員:李鑄,董創鋒,雷詩敏,廖毅,石巖,
申請(專利權)人:金蝶軟件中國有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。