【技術實現步驟摘要】
一種識別商戶類型的方法及裝置
本專利技術涉及數據分析領域,尤其涉及一種識別商戶類型的方法及裝置。
技術介紹
目前,通過分析持卡人的交易數據、識別持卡人的消費偏好,有助于銀行對持卡人開展精準營銷活動。其中,在識別持卡人的消費偏好時,一方面是基于持卡人消費過的商戶類型的相關數據,但是由于商戶在POS機注冊時將商戶類型的錯填,以及商戶在實際經營過程中的業務改變、但未更改POS機的商戶類型的信息,因此僅僅使用未校正的商戶類型作為識別持卡人的消費偏好的依據,則很大程度上會產生誤差;另一方面,在計算持卡人的消費偏好時普遍根據持卡人在某個消費類型上的金額頻次來定義該持卡人的消費偏好,而未考慮與其他持卡人的對比,因此也會造成對持卡人的消費偏好的錯誤判斷。現有技術一般通過商戶名稱以及商戶交易數據來確定商戶類型:1、基于關鍵詞匹配的商戶類型識別方法。基于商戶名稱能夠在一定程度上反映商戶的主營業務的前提假設,該類方法通過關鍵詞表進行正則匹配的方式對商戶對應的商戶類型是否準確進行判斷。該方法的缺點在于對詞表的完整性以及關鍵詞的排他性要求很高,對于商戶名稱中不包含明確商戶類型關鍵詞的商戶無區分能力。2、基于交易信息的商戶類型識別方法。基于不同商戶類型的商戶交易行為存在差異性的前提假設,該類方法通過利用商戶的交易數據計算交易特征變量,再通過分類器對商戶類型進行重標注。該類方法對訓練集的準確性和區分性要求較高,對于待分類的商戶,其交易不能過于稀疏,因此,在應用于實際場景時,較難做到對海量數據的及時性糾正。綜 ...
【技術保護點】
1.一種識別商戶類型的方法,其特征在于,包括:/n從持卡人的交易信息中獲取商戶的商戶名稱;/n通過所述商戶名稱與各商戶類型的預設詞表的匹配,確定所述商戶對應的第一商戶類型;所述各商戶類型的預設詞表包括每個商戶類型對應的多個詞分類下的各詞語;其中,每個詞語所屬的詞分類是根據該詞語在該詞分類下的詞頻確定的;/n若確定所述第一商戶類型存在相似的第二商戶類型,則將所述交易信息輸入相似商戶分類模型,所述相似商戶分類模型是由所述第一商戶類型所對應的歷史交易信息與所述第二商戶類型所對應的歷史交易信息訓練得到的;/n獲取由所述相似商戶分類模型輸出的第三商戶類型;確定所述第三商戶類型為所述商戶所屬的商戶類型。/n
【技術特征摘要】
1.一種識別商戶類型的方法,其特征在于,包括:
從持卡人的交易信息中獲取商戶的商戶名稱;
通過所述商戶名稱與各商戶類型的預設詞表的匹配,確定所述商戶對應的第一商戶類型;所述各商戶類型的預設詞表包括每個商戶類型對應的多個詞分類下的各詞語;其中,每個詞語所屬的詞分類是根據該詞語在該詞分類下的詞頻確定的;
若確定所述第一商戶類型存在相似的第二商戶類型,則將所述交易信息輸入相似商戶分類模型,所述相似商戶分類模型是由所述第一商戶類型所對應的歷史交易信息與所述第二商戶類型所對應的歷史交易信息訓練得到的;
獲取由所述相似商戶分類模型輸出的第三商戶類型;確定所述第三商戶類型為所述商戶所屬的商戶類型。
2.如權利要求1所述的方法,其特征在于,所述多個詞分類包括白詞、黑詞及模糊詞;各商戶類型對應的白詞均不同;同一類型的商戶類型對應的白詞和黑詞均不同;
通過所述商戶名稱與各商戶類型的預設詞表的匹配,確定所述商戶對應的第一商戶類型,包括:
將所述商戶名稱切分成至少一個分詞;
在確定所述至少一個分詞中包含白詞、黑詞及模糊詞或所述至少一個分詞中不包含任一白詞且包含模糊詞后,針對每個商戶類型,根據每個分詞屬于所述商戶類型的概率,確定所述商戶名稱屬于所述商戶類型的概率;其中,每個分詞屬于所述商戶類型的概率是根據歷史交易信息確定的;
確定概率最高的商戶類型為所述商戶對應的第一商戶類型。
3.如權利要求2所述的方法,其特征在于,通過公式(1)確定所述商戶名稱屬于所述商戶類型的概率,包括:
公式(1)
其中,wi(i=1,2,3,……,n)為商戶名稱中包含的第i個分詞;mcci表示第i個商戶類型;p(wi)表示分詞wi在所有商戶名稱中出現的概率;p(wi|mcci)表示分詞wi在商戶類型mcci下的商戶名稱中出現的概率;p(mcci|w1w2w3……wn)表示包含詞匯w1、w2、w3……wn的商戶名稱屬于商戶類型mcci的概率。
4.如權利要求2所述的方法,其特征在于,還包括:
在確定所述至少一個分詞中包含白詞且不包含黑詞時,將所述白詞所對應的商戶類型確定為所述商戶對應的第一商戶類型。
5.如權利要求2所述的方法,其特征在于,還包括:
在確定所述至少一個分詞中包含白詞、黑詞且不包含任一模糊詞;或,所述至少一個分詞中不包含任一白詞且不包含任一模糊詞后,將所述商戶申報的商戶類型確定為所述商戶對應的第一商戶類型。
6.如權利要求2所述的方法,其特征在于,
確定概率最高的商戶類型為所述商戶對應的第一商戶類型,包括:
確定概率最高的商戶類型為所述商戶對應的初始商戶類型;
在確定所述至少一個分詞中不包含所述初始商戶類型下的任一黑詞,則確定所述概率最高的商戶類型為所述商戶對應的第一商戶類型。
7.如權利要求6所述的方法,其特征在于,所述確定概率最高的商戶類型為所述商戶對應的初始商戶類型之后,還包括:
在確定所述至少一個分詞中包含所述初始商戶類型下的任一黑詞,則將所述商戶申報的商戶類型確定為所述商戶對應的第一商戶類型。
8.如權利要求1-7任一項所述的方法,其特征在于,包括:
若確定所述第一商戶類型不存在相似的第二商戶類型,則確定所述第一商戶類型為所述商戶所屬的商戶類型。
9.如權利要求1-7任一項所述的方法,其特征在于,還包括:
根據所述持卡人的多個交易信息對應的多個商戶類型,確定所述持卡人在各個消費類型下的交易情況;
針對任一消費類型,比較持卡人在所述消費類型下的交易情況與設定區域的全部持卡人在所述消費類型下的交易情況,得到所述消費類型下的比較結果;
根據各個消費類型下的比較結果,確定所述持卡人的消費偏好。
10.一種識別商戶類型的裝置,其特征在于,包括:
獲取單元,用于從持卡人的交易信息中獲取商戶的商戶名稱;
確定單元,用于通過所述商戶名稱與各商戶類型的預設詞...
【專利技術屬性】
技術研發人員:付翔鵬,周航,徐婷婷,趙萌,
申請(專利權)人:銀聯智策顧問上海有限公司,
類型:發明
國別省市:上海;31
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。