System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及自然語言處理,具體而言,涉及一種地址匹配方法、裝置及計算機設備。
技術介紹
1、地址匹配是指將用戶提供的輸入地址與已有的地址數據庫進行匹配,確定最佳匹配或相似匹配的過程。隨著商品即時配送行業的興起,地址匹配、定位,成為各個網絡銷售平臺不可或缺的能力,而在具體的使用場景中,例如客戶填寫地址的時候,輸入地址經常存在因此地址不規范等問題,導致訂單卡滯無法下單,影響業務發展和客戶感知。傳統的地址搜索側重于對文本進行分析提取數據特征向量,利用數據特征相似進行搜索,容易受到用戶輸入的搜索條件本身的文本噪聲影響,前在地址搜索中,對文本的降噪處理主要關注拼寫錯誤,對文本的前后邏輯順序不關注,導致地址文本糾錯準確率低,進而導致匹配效率低。
2、針對上述的問題,目前尚未提出有效的解決方案。
技術實現思路
1、本申請實施例提供了一種地址匹配方法、裝置及計算機設備,以至少解決相關技術中由于對地址文本的糾錯準確率低導致地址匹配的效率較低的技術問題。
2、根據本申請實施例的一個方面,提供了一種地址匹配方法,包括:接收初始地址文本;采用檢測網絡對所述初始地址文本進行檢測,得到所述初始地址文本中的錯誤分詞,其中,所述錯誤分詞包括:拼寫錯誤的分詞和排序錯誤的分詞,所述檢測網絡包括方向相反的兩個門控循環單元gru網絡;對所述錯誤分詞進行糾錯,得到目標地址文本,將所述目標地址文本與預設索引進行匹配得到匹配結果,所述匹配結果表示所述目標地址文本與所述預設索引是否對應。
3、可
4、可選地,根據所述特征向量確定所述初始地址文本中的錯誤分詞,包括:基于所述特征向量確定所述初始地址文本中每個分詞的錯誤概率;將所述錯誤概率高于第一預設值的分詞確定為所述錯誤分詞。
5、可選地,對所述錯誤分詞進行糾錯,得到目標地址文本,包括:獲取所述錯誤分詞對應的遮蓋率,所述遮蓋率用于表示分詞的遮蓋程度;根據每個錯誤分詞的遮蓋率對所述錯誤分詞對應的嵌入向量進行遮蓋,得到遮蓋后的嵌入向量;采用預設糾錯模型對遮蓋后的嵌入向量進行修正,得到所述目標地址文本。
6、可選地,采用預設糾錯模型對遮蓋后的嵌入向量進行修正,得到所述目標地址文本,包括:采用預設糾錯模型對遮蓋后的嵌入向量,填入修正后的正確分詞對應的嵌入向量,得到修正后的地址文本;采用預設糾錯模型對修正后的地址文本進行填充處理,得到所述目標地址文本。
7、可選地,采用預設糾錯模型對修正后的地址文本進行填充處理,得到所述目標地址文本,包括:將所述修正后的地址文本進行分詞處理,得到多個目標詞;在所述多個目標詞之間添加目標標識,將所述多個目標詞分割;采用所述預設糾錯模型對分割后的所述多個目標詞的連續概率進行評估,得到每個目標詞之間的連續概率;在連續概率低于第二預設值的兩個目標詞之間添加遮蓋標識;采用所述預設糾錯模型在所述遮蓋標識的位置填充缺失文本,得到所述目標地址文本。
8、可選地,將所述目標地址文本與預設索引進行匹配得到匹配結果,包括:對所述目標地址文本進行分詞,得到分詞后的文本;對所述分詞后的文本進行特征提取,得到目標特征向量;采用所述目標特征向量與多個預設索引進行匹配,選取相似度高于第三預設值的索引確定為匹配結果。
9、根據本申請實施例的另一方面,還提供了一種地址匹配裝置,包括:接收模塊,用于接收初始地址文本;檢測模塊,用于采用檢測網絡對所述初始地址文本進行檢測,得到所述初始地址文本中的錯誤分詞,其中,所述錯誤分詞包括:拼寫錯誤的分詞和排序錯誤的分詞,所述檢測網絡包括方向相反的兩個門控循環單元gru網絡;匹配模塊,用于對所述錯誤分詞進行糾錯,得到目標地址文本,將所述目標地址文本與預設索引進行匹配得到匹配結果,所述匹配結果表示所述目標地址文本與所述預設索引是否對應。
10、根據本申請實施例的又一方面,還提供了一種計算機設備,包括:存儲器和處理器,其中,存儲器用于存儲程序指令;處理器,與存儲器連接,用于執行上述地址匹配方法。
11、根據本申請實施例的再一方面,還提供了一種非易失性存儲介質,該非易失性存儲介質包括存儲的計算機程序,其中,該非易失性存儲介質所在設備通過運行計算機程序執行上述地址匹配方法。
12、根據本申請實施例的再一方面,還提供了一種計算機程序產品,包括計算機指令,該計算機指令被處理器執行時實現上述地址匹配方法。
13、在本申請實施例中,通過接收初始地址文本;采用檢測網絡對所述初始地址文本進行檢測,得到所述初始地址文本中的錯誤分詞,其中,所述錯誤分詞包括:拼寫錯誤的分詞和排序錯誤的分詞,所述檢測網絡包括方向相反的兩個門控循環單元gru網絡;對所述錯誤分詞進行糾錯,得到目標地址文本,將所述目標地址文本與預設索引進行匹配得到匹配結果,所述匹配結果表示所述目標地址文本與所述預設索引是否對應,達到了不僅對拼寫錯誤的分詞進行糾錯,同時對排序錯誤的分詞進行糾錯的目的,從而實現了提升地址文本的糾錯準確率的技術效果,進而解決了相關技術中由于對地址文本的糾錯準確率低導致地址匹配的效率較低的技術問題。
本文檔來自技高網...【技術保護點】
1.一種地址匹配方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,采用檢測網絡對所述初始地址文本進行檢測,得到所述初始地址文本中的錯誤分詞,包括:
3.根據權利要求2所述的方法,其特征在于,根據所述特征向量確定所述初始地址文本中的錯誤分詞,包括:
4.根據權利要求1所述的方法,其特征在于,對所述錯誤分詞進行糾錯,得到目標地址文本,包括:
5.根據權利要求4所述的方法,其特征在于,采用預設糾錯模型對遮蓋后的嵌入向量進行修正,得到所述目標地址文本,包括:
6.根據權利要求5所述的方法,其特征在于,采用預設糾錯模型對修正后的地址文本進行填充處理,得到所述目標地址文本,包括:
7.根據權利要求1所述的方法,其特征在于,將所述目標地址文本與預設索引進行匹配得到匹配結果,包括:
8.一種地址匹配裝置,其特征在于,包括:
9.一種計算機設備,其特征在于,包括:存儲器和處理器,其中,所述存儲器用于存儲程序指令;所述處理器,與所述存儲器連接,用于執行權利要求1至7中任意一項所述的地址匹
10.一種非易失性存儲介質,其特征在于,所述非易失性存儲介質包括存儲的計算機程序,其中,所述非易失性存儲介質所在設備通過運行所述計算機程序執行權利要求1至7中任意一項所述的地址匹配方法。
11.一種計算機程序產品,包括計算機指令,其特征在于,所述計算機指令被處理器執行時實現權利要求1至7中任意一項所述的地址匹配方法。
...【技術特征摘要】
1.一種地址匹配方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,采用檢測網絡對所述初始地址文本進行檢測,得到所述初始地址文本中的錯誤分詞,包括:
3.根據權利要求2所述的方法,其特征在于,根據所述特征向量確定所述初始地址文本中的錯誤分詞,包括:
4.根據權利要求1所述的方法,其特征在于,對所述錯誤分詞進行糾錯,得到目標地址文本,包括:
5.根據權利要求4所述的方法,其特征在于,采用預設糾錯模型對遮蓋后的嵌入向量進行修正,得到所述目標地址文本,包括:
6.根據權利要求5所述的方法,其特征在于,采用預設糾錯模型對修正后的地址文本進行填充處理,得到所述目標地址文本,包括:
7.根據...
【專利技術屬性】
技術研發人員:肖凱烽,張皛晶,田容,羅佳,邱素華,游遠方,趙興番,林晶,
申請(專利權)人:中國電信股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。