System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本說明書實施例涉及計算機,尤其涉及一種商戶名稱確認方法、裝置、電子設備及程序。
技術介紹
1、隨著計算機技術的快速發展,在線購物成為主流的購物方式。在購物過程中,商戶端通常會向用戶端發送短信或者其它提醒信息,以告知目前的進展或情況。
2、服務商平臺具有多個不同的商戶端,且不同的商戶端存在售賣同一物品的概率,或者同一商戶端入駐到不同的服務商平臺,這樣,在向用戶端發送提醒信息時,難以準確匹配并展示正確的商戶名稱。
3、目前,通過采用人工和分詞模糊查詢的手段協助處理,準確性極低,且浪費了大量的人力成本和時間成本。
技術實現思路
1、針對上述技術問題,本說明書實施例提供一種商戶名稱確認方法、裝置、電子設備及程序,能夠提高商戶名稱的確認效率及準確性。
2、本說明書實施例提供一種商戶名稱確認方法,包括:
3、獲取商戶端向用戶端發送的簽名信息;
4、對所述簽名信息進行分詞處理,生成多個詞語;
5、基于預設數據庫,確定與各個所述詞語相對應的目標標簽,以及各個所述目標標簽對應的商戶名稱;
6、根據各個所述目標標簽對應的商戶名稱,從所述預設數據庫中選取與各個所述商戶名稱相對應的標簽數量和號碼數量;
7、根據各個所述商戶名稱的標簽數量、號碼數量和類別信息,以及各個所述詞語和所述詞語對應的目標標簽,從多個所述商戶名稱中選取目標商戶名稱。
8、可選地,多個所述詞語具有不同的詞性;所述預設數據庫包括標簽
9、所述基于預設數據庫,確定與各個所述詞語相對應的目標標簽,以及各個所述目標標簽對應的商戶名稱,包括:
10、將具有不同詞性的詞語進行組合,得到多個組合詞語;
11、分別確定各個詞語的分值,以及各個組合詞語的分值,并將分值大于設定分值的詞語和/或組合詞語作為目標詞語;
12、從所述標簽庫中選取與所述目標詞語相匹配的目標標簽;
13、根據所述目標標簽,通過執行關鍵詞匹配和相似度計算,從所述商戶庫內選取與目標標簽對應的商戶名稱。
14、可選地,通過如下方式,分別確定各個詞語的分值,以及各個組合詞語的分值:
15、score1=a1*math.sin(x/b1-b2)+a2*math.exp(-x/b3)+a3*math.log(x+c1)+a4
16、其中,score1表示分值,x表示詞語或組合詞語的長度,a1表示第一權重系數、a2表示第二權重系數、b1表示周期縮放參數、b2表示相位平移參數、b3表示衰減速率參數、b4表示基準偏移量、c1表示位移參數。
17、可選地,所述從所述標簽庫中選取與所述目標詞語相匹配的目標標簽,包括:
18、采用搜索算法,從所述預設數據庫中選取包含所述目標詞語的標簽;
19、采用編輯距離算法,分別計算各個目標詞語與所述目標詞語相對應的標簽之間的第一相似度得分;
20、將數值最高的所述第一相似度對應的標簽作為所述目標標簽。
21、可選地,所述根據各個所述商戶名稱的標簽數量、號碼數量和類別信息,以及各個所述詞語和所述詞語對應的目標標簽,從多個所述商戶名稱中選取目標商戶名稱,包括:
22、根據各個所述商戶名稱的類別信息、各個商戶名稱相對應的標簽數量和號碼數量,確定第一分值;
23、根據各個商戶名稱和所述商戶名稱對應的目標標簽,確定第二相似度得分;
24、根據各個所述詞語和所述詞語對應的目標標簽,確定第三相似度得分;
25、根據所述第一分值、所述第二相似度得分和第三相似度得分,確定各個商戶名稱的綜合得分;
26、將數值最高的所述綜合得分對應的商戶名稱作為所述商戶名稱。
27、可選地,采用如下方式,確定所述第一分值:
28、score2=(w1*shop_logo+w2*(shop_mark**a5)+w3*(shop_tel**a6)+w4*shop_key)*((b4+shop_mes)**(b5*shop_mes_i));(2)
29、采用如下方式,確定各個商戶名稱的綜合得分:
30、score=score2/((d1+epsilon)-(shop_df**d2)*d3);(3)
31、其中,shop_logo表示商戶名稱類別信息中的商標的標識、shop_mark表示商戶名稱對應的標簽數量、shop_tel表示商戶名稱關聯的電話號碼數量、shop_key表示基于商戶與關鍵詞的關聯程度評估、shop_mes表示第二相似度得分(即商戶名稱與關鍵詞之間的相似度得分)、shop_mes_i表示相似度得分的指數調整系數、shop_df表示第三相似度得分、w1表示商戶標識的第一權重系數、w2表示標簽數量的第二權重系數、w3表示號碼數量的第三權重系數、w4表示商戶關鍵性指標的第四權重系數、a5表示商戶名稱對應的標簽數量的指數系數、a6表示商戶名稱關聯的電話號碼數量的指數系數、b4表示相似度基準偏移量、b5表示相似度指數權重、d1表示基準值、d2相似度指數參數、d3表示縮放系數、epsilon表示極小值。
32、可選地,所述根據各個商戶名稱的標簽數量、號碼數量和類別信息,以及各個所述詞語和所述詞語對應的目標標簽,從多個商戶名稱中選取目標商戶名稱之前,還包括:
33、根據各個商戶名稱的標簽數量和號碼數量,確定各個商戶名稱的使用頻次得分,并過濾所述使用頻次得分低于設定使用頻次得分的商戶名稱。
34、可選地,采用如下方式,確定使用頻次得分:
35、score3=shop_mark*e1+shop_tel*e2+q1;
36、其中,shop_mark表示商戶名稱對應的標簽數量、shop_tel表示商戶名稱對應的號碼數量、e1表示標簽權重系數、e2表示電話號碼權重系數、q1表示偏置項。
37、可選地,所述商戶名稱確認方法還包括:
38、在向所述用戶端發送的簽名信息中顯示所述目標商戶名稱。
39、本說明書實施例還提供一種商戶名稱確認裝置,包括:
40、數據獲取單元,適于獲取商戶端向用戶端發送的簽名信息;
41、分詞單元,對所述簽名信息進行分詞處理,生成多個詞語;
42、處理單元,適于基于預設數據庫,確定與各個所述詞語相對應的目標標簽,以及各個所述目標標簽對應的商戶名稱;以及,根據各個所述目標標簽對應的商戶名稱,從所述預設數據庫中選取與各個所述商戶名稱相對應的標簽數量和號碼數量;以及,根據各個所述商戶名稱的標簽數量、號碼數量和類別信息,以及各個所述詞語和所述詞語對應的目標標簽,從多個所述商戶名稱中選取目標商戶名稱。
43、本說明書實施例還提供一種電子設備,包括:至少一個處理器和至少一個存儲器,所述存儲器存儲一條或多條計本文檔來自技高網...
【技術保護點】
1.一種商戶名稱確認方法,其特征在于,包括:
2.根據權利要求1所述的商戶名稱確認方法,其特征在于,多個所述詞語具有不同的詞性;所述預設數據庫包括標簽庫和商戶庫;
3.根據權利要求2所述的商戶名稱確認方法,其特征在于,通過如下方式,分別確定各個詞語的分值,以及各個組合詞語的分值:
4.根據權利要求2所述的商戶名稱確認方法,其特征在于,所述從所述標簽庫中選取與所述目標詞語相匹配的目標標簽,包括:
5.根據權利要求1所述的商戶名稱確認方法,其特征在于,所述根據各個所述商戶名稱的標簽數量、號碼數量和類別信息,以及各個所述詞語和所述詞語對應的目標標簽,從多個所述商戶名稱中選取目標商戶名稱,包括:
6.根據權利要求5所述的商戶名稱確認方法,其特征在于,采用如下方式,確定所述第一分值:
7.根據權利要求1或6所述的商戶名稱確認方法,其特征在于,所述根據各個商戶名稱的標簽數量、號碼數量和類別信息,以及各個所述詞語和所述詞語對應的目標標簽,從多個商戶名稱中選取目標商戶名稱之前,還包括:
8.根據權利要求7所述的商
9.根據權利要求1所述的商戶名稱確認方法,其特征在于,還包括:
10.一種商戶名稱確認裝置,其特征在于,包括:
11.一種電子設備,其特征在于,包括:至少一個處理器和至少一個存儲器,所述存儲器存儲一條或多條計算機可執行指令,所述處理器調用所述一條或多條計算機可執行指令,以執行如權利要求1至9任一項所述的商戶名稱確認方法。
12.一種計算機程序產品,其特征在于,包括計算機指令,所述計算機指令被處理器執行時實現權利要求1至9任一項所述的商戶名稱確認方法。
...【技術特征摘要】
1.一種商戶名稱確認方法,其特征在于,包括:
2.根據權利要求1所述的商戶名稱確認方法,其特征在于,多個所述詞語具有不同的詞性;所述預設數據庫包括標簽庫和商戶庫;
3.根據權利要求2所述的商戶名稱確認方法,其特征在于,通過如下方式,分別確定各個詞語的分值,以及各個組合詞語的分值:
4.根據權利要求2所述的商戶名稱確認方法,其特征在于,所述從所述標簽庫中選取與所述目標詞語相匹配的目標標簽,包括:
5.根據權利要求1所述的商戶名稱確認方法,其特征在于,所述根據各個所述商戶名稱的標簽數量、號碼數量和類別信息,以及各個所述詞語和所述詞語對應的目標標簽,從多個所述商戶名稱中選取目標商戶名稱,包括:
6.根據權利要求5所述的商戶名稱確認方法,其特征在于,采用如下方式,確定所述第一分值:
7.根據權利要求1或6所...
【專利技術屬性】
技術研發人員:楊澤,
申請(專利權)人:北京羽樂創新科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。