本發明專利技術提供一種從查詢詞中提取中心詞的方法和裝置,方法包括:獲取用戶輸入的第一查詢詞;基于已知的多個查詢詞以及所述多個查詢詞的中心詞訓練得到的模型,從所述第一查詢詞中提取所述第一查詢詞的中心詞。根據本發明專利技術,通過對已知查詢詞以及已知查詢詞的中心詞進行訓練,能夠得到用于提取查詢詞中心詞的模型,利用該模型可以自動進行對查詢詞的中心詞提取,提取速度、準確率都非常高,有利于后續的基于中心詞推薦查詢詞的快速進行。
【技術實現步驟摘要】
本專利技術涉及計算機
,具體而言,涉及一種從查詢詞中提取中心詞的方法和裝置。
技術介紹
查詢詞推薦是根據用戶當前進行搜索的查詢詞,通過機器學習算法,提取查詢詞的中心詞,并以此為用戶推薦其最可能感興趣的其他查詢詞。目前,提取中心詞的方式主要是通過人工標注的方式提取中心詞:人工標注中心詞只能適用于非常少量的查詢詞,當查詢詞數目巨大的時候人工標注顯然是不可行的,而且人工標注提取中心詞不能自動化,所以具有以下不足之處:(1)需要較多的人力、時間、費時費力;(2)每個人的評價標準不一樣,導致標注的中心詞有偏差;(3)無法自動化提取查詢詞的中心詞;(4)不適用于大量查詢詞的中心詞提取。
技術實現思路
鑒于上述問題,提出了本專利技術以便提供一種克服上述問題或者至少部分地解決上述問題的從查詢詞中提取中心詞的方法和裝置。依據本專利技術的一種從查詢詞中提取中心詞的方法,包括:獲取用戶輸入的第一查詢詞;基于已知的多個查詢詞以及所述多個查詢詞的中心詞訓練得到的模型,從所述第一查詢詞中提取所述第一查詢詞的中心詞。可選地,前述的方法,基于已知的多個查詢詞以及所述多個查詢詞的中心詞訓練得到的模型,從所述第一查詢詞中提取所述第一查詢詞的中心詞,具體包括:基于所述多個查詢詞的特征屬性以及所述多個查詢詞的中心詞訓練得到的所述模型,對所述第一查詢詞的特征屬性進行分析得到所述第一查詢詞的中心詞。可選地,前述的方法,還包括:從預設的點擊記錄中,獲取所述用戶點擊的同一地址對應的多個第二查詢詞;所述點擊記錄用于記錄所述用戶已輸入的查詢詞以及已點擊的地址;對所述多個第二查詢詞分詞得到多個詞;根據所述多個詞的指定屬性從所述多個詞中選擇一個詞,將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中心詞;選出中心詞的第二查詢詞用于訓練所述模型。可選地,前述的方法,所述指定屬性為所述多個詞在所述多個第二查詢詞中的詞頻;根據所述多個詞的指定屬性從所述多個詞中選擇一個詞,具體包括:選擇所述多個詞中詞頻最高的詞。可選地,前述的方法,將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中心詞,具體包括:將所述所選詞作為所述多個第二查詢詞中對應的頁面瀏覽量最高的第二查詢詞的中心詞。可選地,前述的方法,在將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中心詞之前,還包括:判斷所述所選詞是否包含在所述至少一個第二查詢詞中,在判斷結果為是時,執行將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中心詞。可選地,前述的方法,在將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中心詞之前,還包括:判斷所述所選詞與所述至少一個第二查詢詞的長度差是否位于預設區間,在判斷結果為是時,執行將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中心詞。依據本專利技術的一種從查詢詞中提取中心詞的裝置,包括:查詢詞獲取模塊,用于獲取用戶輸入的第一查詢詞;中心詞提取模塊,用于基于已知的多個查詢詞以及所述多個查詢詞的中心詞訓練得到的模型,從所述第一查詢詞中提取所述第一查詢詞的中心詞。可選地,前述的裝置,所述中心詞提取模塊基于所述多個查詢詞的特征屬性以及所述多個查詢詞的中心詞訓練得到的所述模型,對所述第一查詢詞的特征屬性進行分析得到所述第一查詢詞的中心詞。可選地,前述的裝置,還包括:記錄獲取模塊,用于從預設的點擊記錄中,獲取所述用戶點擊的同一地址對應的多個第二查詢詞;所述點擊記錄用于記錄所述用戶已輸入的查詢詞以及已點擊的地址;分詞模塊,用于對所述多個第二查詢詞分詞得到多個詞;中心詞選擇模塊,用于根據所述多個詞的指定屬性從所述多個詞中選擇一個詞,將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中心詞;選出中心詞的第二查詢詞用于訓練所述模型。可選地,前述的裝置,所述中心詞選擇模塊選擇所述多個詞中詞頻最高的詞。可選地,前述的裝置,所述中心詞選擇模塊將所述所選詞作為所述多個第二查詢詞中對應的頁面瀏覽量最高的第二查詢詞的中心詞。可選地,前述的裝置,還包括:第一判斷模塊,用于判斷所述所選詞是否包含在所述至少一個第二查詢詞中,所述中心詞選擇模塊在判斷結果為是時將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中心詞。可選地,前述的裝置,還包括:第二判斷模塊,用于判斷所述所選詞與所述至少一個第二查詢詞的長度差是否位于預設區間,所述中心詞選擇模塊在判斷結果為是時將所選詞作為所述多個第二查詢詞中至少一個第二查詢詞的中心詞。根據以上技術方案,本專利技術的從查詢詞中提取中心詞的方法和裝置至少具有以下優點:在本專利技術的技術方案中,通過對已知查詢詞以及已知查詢詞的中心詞進行訓練,能夠得到用于提取查詢詞中心詞的模型,利用該模型可以自動進行對查詢詞的中心詞提取,提取速度、準確率都非常高,有利于后續的基于中心詞推薦查詢詞的快速進行。上述說明僅是本專利技術技術方案的概述,為了能夠更清楚了解本專利技術的技術手段,而可依照說明書的內容予以實施,并且為了讓本專利技術的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本專利技術的具體實施方式。附圖說明通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本專利技術的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:圖1示出了根據本專利技術的一個實施例的從查詢詞中提取中心詞的方法的流程圖;圖2示出了根據本專利技術的一個實施例的從查詢詞中提取中心詞的方法的流程圖;圖3示出了根據本專利技術的一個實施例的從查詢詞中提取中心詞的裝置的框圖;圖4示出了根據本專利技術的一個實施例的從查詢詞中提取中心詞的裝置的框圖。具體實施方式下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。如圖1所示,本專利技術的一個實施例中提供了一種從查詢詞中提取中心詞的方法,包括:步驟110,獲取用戶輸入的第一查詢詞。步驟120,基于已知的多個查詢詞以及多個查詢詞的中心詞訓練得到的模型,從第一查詢詞中提取第一查詢詞的中心詞。根據本實施例的技術方案,通過對已知查詢詞以及已本文檔來自技高網...
【技術保護點】
一種從查詢詞中提取中心詞的方法,其特征在于,包括:獲取用戶輸入的第一查詢詞;基于已知的多個查詢詞以及所述多個查詢詞的中心詞訓練得到的模型,從所述第一查詢詞中提取所述第一查詢詞的中心詞。
【技術特征摘要】
1.一種從查詢詞中提取中心詞的方法,其特征在于,包括:
獲取用戶輸入的第一查詢詞;
基于已知的多個查詢詞以及所述多個查詢詞的中心詞訓練得到的模型,
從所述第一查詢詞中提取所述第一查詢詞的中心詞。
2.根據權利要求1所述的方法,其特征在于,基于已知的多個查詢詞以
及所述多個查詢詞的中心詞訓練得到的模型,從所述第一查詢詞中提取所述
第一查詢詞的中心詞,具體包括:
基于所述多個查詢詞的特征屬性以及所述多個查詢詞的中心詞訓練得到
的所述模型,對所述第一查詢詞的特征屬性進行分析得到所述第一查詢詞的
中心詞。
3.根據權利要求1-2任一項所述的方法,其特征在于,還包括:
從預設的點擊記錄中,獲取所述用戶點擊的同一地址對應的多個第二查
詢詞;所述點擊記錄用于記錄所述用戶已輸入的查詢詞以及已點擊的地址;
對所述多個第二查詢詞分詞得到多個詞;
根據所述多個詞的指定屬性從所述多個詞中選擇一個詞,將所選詞作為
所述多個第二查詢詞中至少一個第二查詢詞的中心詞;選出中心詞的第二查
詢詞用于訓練所述模型。
4.根據權利要求1-3任一項所述的方法,其特征在于,所述指定屬性為
所述多個詞在所述多個第二查詢詞中的詞頻;根據所述多個詞的指定屬性從
所述多個詞中選擇一個詞,具體包括:
選擇所述多個詞中詞頻最高的詞。
5.根據權利要求1-4任一項所述的方法,其特征在于,將所選詞作為所
述多個第二查詢詞中至少一個第二查詢詞的中心詞,具體包括:
將所述所選詞作為所述多個第二查詢詞中對應的頁面瀏覽量最高的第二
查詢詞的中心詞。
6.根據權利要求1-5任一項所述的方法,其特征在于,在將所選詞作為<...
【專利技術屬性】
技術研發人員:劉鎏,伍兆蓋,肖峰,
申請(專利權)人:北京奇虎科技有限公司,奇智軟件北京有限公司,
類型:發明
國別省市:北京;11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。