【技術實現步驟摘要】
一種提高相似物流單號識別精度的算法和物流查詢系統
[0001]本申請涉及計算機
,特別涉及一種提高相似物流單號識別精度的算法和物流查詢系統,以及一種通過郵件查詢物流單號的方法和系統。
技術介紹
[0002]目前的全球綜合物流查詢平臺(也稱“物流查詢系統”),由于物流行業沒有約束性的標準,每家物流渠道(也稱“物流商”)都有自己的物流單號自動生成方式和規則。沒有統一約束和規范的物流單號,對于綜合物流查詢系統而言,如果支持的物流渠道越多,相似物流單號(指物流單號規則一樣或者非常相似,肉眼不易分辨的物流單號)在查詢時發生沖突的概率就會越高,從而導致物流渠道不能被自動識別,使得用戶查詢物流單號的效率降低,影響用戶對物流查詢系統的體驗效果。
[0003]目前通常的做法是根據不同的物流渠道配置物流單號的正則匹配規則,然后通過規則來區分一部分物流單號;但是對于規則非常接近的相似物流單號,難以在正則匹配基礎上進一步的提高物流渠道的識別精度,即便在正則匹配基礎上實現了物流渠道的識別,其規則配置會非常復雜,不便于維護和使用。在物流查詢系統的相關技術中,對于不能識別的相似物流單號,通常是由用戶手動指定相應的物流渠道,這種操作方式會耗費用戶很多時間,對于采用其他語言的跨國物流渠道而言,也給用戶的物流單號查詢工作帶來很大困擾和麻煩。
[0004]此外,對于物流單號查詢頻率非常高的電商領域,買家在各電商平臺購買的商品發貨后,一般都會收到賣家的發貨郵件;發貨郵件主要用于通知買家訂單商品已經發貨,同時提供發貨的物流單號或者物流單 ...
【技術保護點】
【技術特征摘要】
1.一種提高相似物流單號識別精度的算法,用于在物流查詢系統中識別物流渠道,其特征在于,所述方法包括以下步驟:步驟S1:獲取物流單號,計算所述物流單號的長度,根據所述物流單號的長度從規則庫中篩選具有相同物流單號長度的物流渠道,記錄具有相同長度的全部所述物流渠道并計算所述物流渠道的數量N;步驟S2:根據N值進行所述物流單號的初步識別,所述物流單號的初步識別包括:當N=1時,將所述唯一的物流渠道作為所述物流單號的識別結果;當N≥2時,執行步驟S3;步驟S3:進行所述物流單號的匹配精度計算,所述匹配精度計算包括步驟S31
?
S34:步驟S31:根據各物流渠道的號段信息拆分所述物流單號正則表達式中的常數部分和變數部分,所述物流單號中與所述號段信息的內容相同且位置相同的部分作為所述正則表達式的常數部分,其余部分作為所述正則表達式的變數部分;步驟S32:計算各物流渠道對應正則表達式中所述常數部分的長度在整個規則中匹配到的長度比例,所述長度比例作為所述物流單號在相應物流渠道規則下的匹配精度值;步驟S33:將各物流渠道規則的匹配精度值按大小進行排序;步驟S34:取出匹配精度值最高的規則所對應的物流渠道;步驟S4:將匹配精度值最高的物流渠道作為所述物流單號的識別結果。2.如權利要求1所述提高相似物流單號識別精度的算法,其特征在于,在執行步驟S1之前,先將各物流渠道的信息數據存儲在所述規則庫中,物流渠道的信息數據包括物流渠道的名稱、物流單號長度和號段信息,所述號段信息包括號段內容、號段位置和號段長度,每個物流渠道具有相應的號段信息:當某物流渠道的各物流單號中不包含內容相同且位置相同的字符串時,該物流渠道的號段信息為空,相應的該物流渠道的號段內容為空、號段位置為空、號段長度為零;當某物流渠道的各物流單號中包含內容相同且位置相同的字符串時,該字符串作為物流渠道的號段信息,該字符串的內容、位于物流單號的位置和字符長度信息分別作為該號段信息的號段內容、號段位置和號段長度。3.如權利要求2所述提高相似物流單號識別精度的算法,其特征在于,對于步驟S3,在執行步驟S31之前,對具有相同長度的N個物流渠道進行篩選,分析該N個物流渠道的號段信息,當某物流渠道的號段信息為非空時,對該物流渠道執行步驟S31的操作;當某物流渠道的號段信息為空時,放棄針對該物流渠道的匹配精度計算,該物流渠道不作為該物流單號的識別對象。4.如權利要求2所述提高相似物流單號識別精度的算法,其特征在于,當步驟S33中出現多個并列最大的匹配精度值時,終止進一步的匹配精度計算,并提示無法識別物流渠道,提請用戶手動指定物流渠道。5.如權利要求2所述提高相似物流單號識別精度的算法,其特征在于,所述物流查詢系統還包括物流單號庫,所述物流單號庫存儲已完成查詢的歷史物流單號,根據所述歷史物流單號計算相關物流渠道的號段信息,包括:步驟P1:選擇需要計算號段信息的物流渠道,設置歷史物流單號的調取規則,根據調取規則從物流單號庫調取相應數量的M個該物流渠道的歷史物流單號;步驟P2:設置預設相似值Y的大小,Y≤100%;
步驟P3:對該M個物流單號依次按最短長度L截取相應的字符串,每次截取的位置比前一次截取的位置增加一位,從各物流單號的首位字符開始截取,同一批次截取的字符串長度和位置相同,...
【專利技術屬性】
技術研發人員:侯毅,李浩雄,陳壽寶,梁金鑒,
申請(專利權)人:深圳市帝盟網絡科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。