• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    意圖識別模型的確定及檢索意圖識別方法、裝置制造方法及圖紙

    技術編號:21224694 閱讀:91 留言:0更新日期:2019-05-29 05:26
    本公開實施例公開了一種意圖識別模型的確定及檢索意圖識別方法、裝置。所述意圖識別模型的確定方法包括:獲取訓練關鍵詞相關的用戶日志;基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,所述擴展因子至少包括主題在所述訓練關鍵詞上的概率分布和已有系統對象信息在主題上的概率分布;利用所述訓練關鍵詞以及所述擴展因子訓練機器學習模型,得到意圖識別模型。本公開可利用一個輕量級的原始訓練樣本得到一個較為精確的意圖識別分類模型,節省了成本,提高了檢索的準確性。

    Determination of Intention Recognition Model and Method and Device of Retrieval Intention Recognition

    The embodiment of the present disclosure discloses a method and device for determining an intent recognition model and identifying a search intent. The determination method of the intention recognition model includes: acquiring user logs related to training keywords; determining the expansion factor of the training keywords based on the user logs and existing system object information, which includes at least the probability distribution of the subject on the training keywords and the probability distribution of the existing system object information on the subject; and utilizing the training gateway. The keywords and the extended factor train the machine learning model to obtain the intention recognition model. The present disclosure can use a lightweight original training sample to obtain a more accurate classification model of intention recognition, save cost and improve the accuracy of retrieval.

    【技術實現步驟摘要】
    意圖識別模型的確定及檢索意圖識別方法、裝置本申請為分案申請,其母案申請的申請日為“2017年10月31日”、申請號為“2017110537100”、專利技術名稱為“檢索意圖識別方法、裝置、電子設備及可讀存儲介質”。
    本公開涉及計算機
    ,具體涉及一種意圖識別模型的確定及檢索意圖識別方法、裝置。
    技術介紹
    傳統的搜索技術使用倒排索引構建數據索引關系,搜索過程往往是一個簡單的字符串匹配算法。而高階的搜索引擎,除了基本的性能優化以外,更多的考慮是如何提升用戶的點擊率,這就需要去挖掘用戶輸入關鍵字背后包含的更深層次的信息。例如:用戶搜索“附近高端的賓館”一詞,從搜索意圖角度看,包含了地理信息——“附近的”,需求信息——“賓館住宿”、價格信息——“高消費水平”,從而為搜索引擎描繪了一副用戶“搜索畫像”,因此在對召回結果排序時,就需要考慮價格、評價、距用戶的距離等信息。
    技術實現思路
    本公開實施例提供一種意圖識別模型的確定及檢索意圖識別方法、裝置、電子設備及計算機可讀存儲介質。第一方面,本公開實施例中提供了一種意圖識別模型的確定方法。具體的,所述意圖識別模型的確定方法,包括:獲取訓練關鍵詞相關的用戶日志;基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,所述擴展因子至少包括主題在所述訓練關鍵詞上的概率分布和已有系統對象信息在主題上的概率分布;利用所述訓練關鍵詞以及所述擴展因子訓練機器學習模型,得到意圖識別模型。結合第一方面,所述擴展因子還包括:所述訓練關鍵詞與已有關鍵詞在主題維度上的概率分布以及所述訓練關鍵詞與所述已有系統對象信息在主題維度上的概率分布中的至少之一。結合第一方面,本公開在第一方面的第一種實現方式中,獲取訓練關鍵詞相關的用戶日志,包括:獲取預定時間段內以所述訓練關鍵詞作為輸入的搜索日志。結合第一方面,本公開在第一方面的第二種實現方式中,所述擴展因子包括主題在所述訓練關鍵詞上的概率分布,則基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,包括:基于所述用戶日志提取第一主題;計算所述第一主題與所述訓練關鍵詞之間的邊緣分布;根據所述第一主題與所述訓練關鍵詞之間的邊緣分布確定所述第一主題在所述訓練關鍵詞上的概率分布。結合第一方面,本公開在第一方面的第三種實現方式中,所述擴展因子包括已有系統對象信息在主題上的概率分布,則基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,包括:基于所述已有系統對象信息提取第二主題;計算所述第二主題與所述已有系統對象信息之間的邊緣分布;根據所述第二主題與所述已有系統對象信息之間的邊緣分布確定所述已有系統對象信息在所述第二主題上的概率分布。結合第一方面、第一方面的第二種實現方式或第一方面的第三種實現方式,本公開在第一方面的第四種實現方式中,所述擴展因子包括主題在所述訓練關鍵詞上的概率分布、已有系統對象信息在主題上的概率分布、所述訓練關鍵詞與已有關鍵詞在主題維度上的概率分布以及所述訓練關鍵詞與所述已有系統對象信息在主題維度上的概率分布,則基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,包括:將主題在所述訓練關鍵詞上的概率分布和已有系統對象信息在主題上的概率分布作為PLSA主題模型的輸入,確定所述訓練關鍵詞與已有關鍵詞在主題維度上的概率分布以及所述訓練關鍵詞與所述已有系統對象信息在主題維度上的概率分布;所述PLSA主題模型是預先訓練好的。結合第一方面,本公開在第一方面的第五種實現方式中,利用所述訓練關鍵詞以及所述擴展因子訓練機器學習模型,得到意圖識別模型,包括:將所述訓練關鍵詞以及所述擴展因子作為輸入,對樸素貝葉斯模型進行訓練,最終得到意圖識別模型。第二方面,本公開實施例中提供了一種檢索意圖識別方法。具體的,所述檢索意圖識別方法,包括:接收用戶輸入的查詢關鍵詞;將所述查詢關鍵詞輸入至預先訓練好的意圖識別模型進行處理,并得到所述用戶的檢索意圖;其中,所述意圖識別模型根據第一方面所述的方法訓練得到。結合第二方面,本公開在第二方面的第一種實現方式中,將所述查詢關鍵詞輸入至預先訓練好的意圖識別模型進行處理,并得到所述用戶的檢索意圖,包括:將所述查詢關鍵詞分別輸入至預先訓練好的不同意圖類別對應的意圖識別模型中,并得到所述查詢關鍵詞與每個意圖識別模型的意圖識別結果之間的相關度;根據所述相關度獲得所述用戶的檢索意圖。第三方面,本公開實施例提供了一種意圖識別模型的確定裝置,包括:獲取模塊,被配置為獲取訓練關鍵詞相關的用戶日志;擴展模塊,被配置為基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,所述擴展因子至少包括主題在所述訓練關鍵詞上的概率分布和已有系統對象信息在主題上的概率分布;訓練模塊,被配置為利用所述訓練關鍵詞以及所述擴展因子訓練機器學習模型,得到意圖識別模型。所述功能可以通過硬件實現,也可以通過硬件執行相應的軟件實現。所述硬件或軟件包括一個或多個與上述功能相對應的模塊。在一個可能的設計中,意圖識別模型的確定裝置的結構中包括存儲器和處理器,所述存儲器用于存儲一條或多條支持意圖識別模型的確定裝置執行上述第一方面中意圖識別模型的確定方法的計算機指令,所述處理器被配置為用于執行所述存儲器中存儲的計算機指令。所述意圖識別模型的確定裝置還可以包括通信接口,用于意圖識別模型的確定裝置與其他設備或通信網絡通信。第四方面,本公開實施例提供了一種檢索意圖識別裝置,包括:接收模塊,被配置為接收用戶輸入的查詢關鍵詞;輸入模塊,被配置為將所述查詢關鍵詞輸入至預先訓練好的意圖識別模型進行處理,并得到所述用戶的檢索意圖;其中,所述意圖識別模型根據第三方面所述的意圖識別模型的確定裝置訓練得到。所述功能可以通過硬件實現,也可以通過硬件執行相應的軟件實現。所述硬件或軟件包括一個或多個與上述功能相對應的模塊。在一個可能的設計中,檢索意圖識別裝置的結構中包括存儲器和處理器,所述存儲器用于存儲一條或多條支持檢索意圖識別裝置執行上述第二方面中檢索意圖識別裝置方法的計算機指令,所述處理器被配置為用于執行所述存儲器中存儲的計算機指令。所述檢索意圖識別裝置還可以包括通信接口,用于檢索意圖識別裝置與其他設備或通信網絡通信。第五方面,本公開實施例提供了一種電子設備,包括存儲器和處理器;其中,所述存儲器用于存儲一條或多條計算機指令,其中,所述一條或多條計算機指令被所述處理器執行以實現:獲取訓練關鍵詞相關的用戶日志;基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,所述擴展因子至少包括主題在所述訓練關鍵詞上的概率分布和已有系統對象信息在主題上的概率分布;利用所述訓練關鍵詞以及所述擴展因子訓練機器學習模型,得到意圖識別模型。結合第五方面,所述擴展因子還包括:所述訓練關鍵詞與已有關鍵詞在主題維度上的概率分布以及所述訓練關鍵詞與所述已有系統對象信息在主題維度上的概率分布中的至少之一。結合第五方面,本公開在第五方面的第一種實現方式中,獲取訓練關鍵詞相關的用戶日志,包括:獲取預定時間段內以所述訓練關鍵詞作為輸入的搜索日志。結合第五方面,本公開在第五方面的第二種實現方式中,所述擴展因子包括主題在所述訓練關鍵詞上的概率分布,則基于所述用戶日志以及已有系統對象本文檔來自技高網...

    【技術保護點】
    1.一種意圖識別模型的確定方法,其特征在于,包括:獲取訓練關鍵詞相關的用戶日志;基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,所述擴展因子至少包括主題在所述訓練關鍵詞上的概率分布和已有系統對象信息在主題上的概率分布;利用所述訓練關鍵詞以及所述擴展因子訓練機器學習模型,得到意圖識別模型。

    【技術特征摘要】
    1.一種意圖識別模型的確定方法,其特征在于,包括:獲取訓練關鍵詞相關的用戶日志;基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,所述擴展因子至少包括主題在所述訓練關鍵詞上的概率分布和已有系統對象信息在主題上的概率分布;利用所述訓練關鍵詞以及所述擴展因子訓練機器學習模型,得到意圖識別模型。2.根據權利要求1所述的意圖識別模型的確定方法,其特征在于,所述擴展因子還包括:所述訓練關鍵詞與已有關鍵詞在主題維度上的概率分布以及所述訓練關鍵詞與所述已有系統對象信息在主題維度上的概率分布中的至少之一。3.根據權利要求1所述的意圖識別模型的確定方法,其特征在于,獲取訓練關鍵詞相關的用戶日志,包括:獲取預定時間段內以所述訓練關鍵詞作為輸入的搜索日志。4.根據權利要求1所述的意圖識別模型的確定方法,其特征在于,所述擴展因子包括主題在所述訓練關鍵詞上的概率分布,則基于所述用戶日志以及已有系統對象信息確定所述訓練關鍵詞的擴展因子,包括:基于所述用戶日志提取第一主題;計算所述第一主題與所述訓練關鍵詞之間的邊緣分布;根據所述第一主題與所述訓練關鍵詞之間的邊緣分布確定所述第一主題在所述訓練關鍵詞上的概率分布。5.一種檢索意圖識別方法,其特征在于,包括:接收用戶輸入的查詢關鍵詞;將所述查詢關鍵詞輸入至預先訓練好的意圖識別模型進行處理,并得到所述用戶的檢索意圖;其中,所述意圖識別模型根據權利要求1-4任一項所述的方法訓練得到。6.一種意圖識別模型的確定裝置,其特征在于,包括:獲取模塊,被配置為獲取訓練關鍵詞相關的用戶日志;擴展模塊,被配置為基于所述用...

    【專利技術屬性】
    技術研發人員:張瀟李澤中茍秋媛梁東
    申請(專利權)人:北京小度信息科技有限公司
    類型:發明
    國別省市:北京,11

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无翼乌工口肉肉无遮挡无码18| 蜜臀AV无码精品人妻色欲| 国产成人精品无码免费看| 亚洲Av无码专区国产乱码DVD| 色窝窝无码一区二区三区| 无码毛片一区二区三区中文字幕| 久久无码人妻精品一区二区三区| 最新无码人妻在线不卡| 亚洲精品午夜无码专区| 无码国内精品久久人妻麻豆按摩 | 免费无码中文字幕A级毛片| 成人免费无码精品国产电影| 人妻少妇偷人精品无码| 亚洲欧洲无码AV电影在线观看| 少妇无码AV无码专区线| 精品视频无码一区二区三区| 亚洲精品无码成人片久久| 久久久久无码精品| 亚洲无码精品浪潮| 日韩少妇无码喷潮系列一二三| 伊人久久大香线蕉无码| 精品无码人妻一区二区三区| 国产精品无码无需播放器| 中文字幕无码av激情不卡| 一区二区三区无码高清| 日韩经典精品无码一区| 日韩AV片无码一区二区不卡| 午夜麻豆国产精品无码| 精品少妇无码AV无码专区| 国产精品无码专区| 久久午夜无码免费| 国产成人AV片无码免费| 无码精品人妻一区二区三区人妻斩 | 国产午夜无码片在线观看影院| 亚洲AV日韩AV永久无码色欲| 人妻少妇看A偷人无码精品视频| 无码丰满熟妇juliaann与黑人| 无码毛片AAA在线| 亚洲Aⅴ在线无码播放毛片一线天| 精品无码久久久久久国产| 精品韩国亚洲av无码不卡区|