System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機,具體涉及一種內容查詢方法、裝置、設備與可讀存儲介質。
技術介紹
1、在多媒體平臺提供的對話搜索業(yè)務場景中,通常需要依據用戶的搜索詞查詢平臺內相關多媒體內容,并基于多媒體內容對用戶的搜索詞進行回復。然而,當用戶的搜索詞不夠完整或較為冷門時,直接使用該搜索詞進行搜索通常不能夠獲取到足夠多的相關多媒體內容。
2、目前,主要有通過對搜索詞進行同義詞改寫的方式來提高查詢到的多媒體內容的數量。然而,目前對搜索詞進行改寫主要依賴于大量人工標記的訓練數據來實現,導致查詢多媒體內容的訓練成本以及時間較長,影響到多媒體內容查詢的效果。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種內容查詢方法、裝置、設備與可讀存儲介質,用以解決相關技術中內容查詢效果不夠理想的技術問題。
2、第一方面,本申請?zhí)峁┮环N內容查詢方法,包括:
3、獲取初始搜索詞;
4、將所述初始搜索詞輸入至第一語言模型,得到所述搜索詞的關聯(lián)詞,其中,所述第一語言模型的訓練樣基于第二語言模型得到;
5、基于所述初始搜索詞和/或所述關聯(lián)詞,查詢得到目標多媒體內容。
6、作為本申請的一種可行實施例,所述第一語言模型是通過如下步驟訓練得到:
7、根據所述樣本詞語以及預設的文本模板生成所述樣本詞語對應的會話文本;
8、將所述會話文本輸入至所述第二語言模型得到所述樣本詞語的目標詞語;
9、根據所述目標詞語和所述樣本詞
10、作為本申請的一種可行實施例,所述根據所述樣本詞語以及預設的文本模板生成所述樣本詞語對應的會話文本的步驟之前,所述方法還包括:
11、獲取用戶的歷史搜索文本;
12、對所述歷史搜索文本進行分詞得到歷史搜索詞語;
13、根據所述歷史搜索詞語的頻率,將頻率低于預設頻率閾值的歷史搜索詞語確定為樣本詞語。
14、作為本申請的一種可行實施例,所述基于所述初始搜索詞和/或所述關聯(lián)詞,查詢得到目標多媒體內容,包括:
15、基于所述初始搜索詞,查詢得到所述初始搜索詞的第一多媒體內容;
16、若所述第一多媒體內容的數量低于預設的第一數量閾值,則基于所述初始搜索詞和所述關聯(lián)詞,查詢得到第二多媒體內容;
17、根據所述第一多媒體內容和所述第二多媒體內容確定所述初始搜索詞的目標多媒體內容。
18、作為本申請的一種可行實施例,所述根據所述第一多媒體內容和所述第二多媒體內容確定所述初始搜索詞的目標多媒體內容,包括:
19、將所述第一多媒體內容和所述第二多媒體內容合并,得到合并多媒體內容;
20、若所述合并多媒體內容的數量超過預設的第二數量閾值,則根據所述第二多媒體內容對應的關聯(lián)度從所述第二多媒體內容中確定第三多媒體內容;所述第二多媒體內容對應的關聯(lián)度至少包括所述第二多媒體內容與所述關聯(lián)詞之間的第一關聯(lián)度以及所述關聯(lián)詞與所述初始搜索詞之間的第二關聯(lián)度;
21、將所述第一多媒體內容和所述第三多媒體內容合并,得到所述初始搜索詞的目標多媒體內容。
22、作為本申請的一種可行實施例,所述基于所述初始搜索詞和/或所述關聯(lián)詞,查詢得到目標多媒體內容,包括:
23、展示所述關聯(lián)詞,以響應于對所述關聯(lián)詞的選擇操作,從所述關聯(lián)詞中確定目標關聯(lián)詞;
24、基于所述初始搜索詞和所述目標關聯(lián)詞,查詢得到目標多媒體內容。
25、第二方面,本申請?zhí)峁┝硪环N內容查詢方法,包括:
26、接收輸入的初始搜索詞;
27、獲取對應所述初始搜索詞的多媒體內容和應答文本;其中所述多媒體內容是基于對所述初始搜索詞和/或所述初始搜索詞的關聯(lián)詞查詢得到;所述應答文本是基于對所述初始搜索詞和所述多媒體內容生成得到;
28、顯示所述多媒體內容的縮略信息以及所述應答文本。
29、第三方面,本申請?zhí)峁┮环N內容查詢裝置,包括:
30、獲取模塊,用于獲取初始搜索詞;
31、確定模塊,用于將所述初始搜索詞輸入至第一語言模型,得到所述搜索詞的關聯(lián)詞,其中,所述第一語言模型的訓練樣本基于第二語言模型得到;
32、處理模塊,用于基于所述初始搜索詞和/或所述關聯(lián)詞,查詢得到目標多媒體內容。
33、第四方面,本申請?zhí)峁┝硪环N內容查詢裝置,包括:
34、接收模塊,用于接收輸入的初始搜索詞;
35、發(fā)送模塊,用于將所述初始搜索詞發(fā)送至預設服務端,以接收所述預設服務端返回的多媒體內容和應答文本;其中所述多媒體內容是所述預設服務端對所述初始搜索詞處理得到;所述應答文本是所述預設服務端對所述初始搜索詞和所述多媒體內容處理得到;
36、顯示模塊,用于顯示所述多媒體內容的縮略信息以及所述應答文本。
37、第五方面,本申請還提供一種計算機設備,所述計算機設備包括:
38、一個或多個處理器;
39、存儲器;以及
40、一個或多個應用程序,其中所述一個或多個應用程序被存儲于所述存儲器中,并配置為由所述處理器執(zhí)行以實現上述任一項提供的內容查詢方法。
41、第四方面,本申請還提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器進行加載,以執(zhí)行上述任一項提供的內容查詢方法。
42、本申請實施例提供的內容查詢方法,在獲取初始搜索詞后,通過將搜索詞輸入至第一語言模型中來得到關聯(lián)詞,以根據搜索詞和關聯(lián)詞查詢得到目標多媒體內容,其中,由于第一語言模型的訓練樣本是基于第二語言模型得到,因此,在第一語言模型的訓練過程無需對訓練樣本進行人工標注,從而降低了第一語言模型訓練的成本,提高了后續(xù)多媒體內容查詢的效果。
本文檔來自技高網...【技術保護點】
1.一種內容查詢方法,其特征在于,包括:
2.根據權利要求1所述的內容查詢方法,其特征在于,所述第一語言模型是通過如下步驟訓練得到:
3.根據權利要求2所述的內容查詢方法,其特征在于,所述根據樣本詞語以及預設的文本模板生成所述樣本詞語對應的會話文本的步驟之前,所述方法還包括:
4.根據權利要求1所述的內容查詢方法,其特征在于,所述基于所述初始搜索詞和/或所述關聯(lián)詞,查詢得到目標多媒體內容,包括:
5.根據權利要求4所述的內容查詢方法,其特征在于,所述根據所述第一多媒體內容和所述第二多媒體內容確定所述初始搜索詞的目標多媒體內容,包括:
6.根據權利要求1~5任一項所述的內容查詢方法,其特征在于,所述基于所述初始搜索詞和/或所述關聯(lián)詞,查詢得到目標多媒體內容,包括:
7.一種內容查詢方法,其特征在于,包括:
8.根據權利要求7所述的內容查詢方法,其特征在于,所述顯示所述多媒體內容的縮略信息以及所述應答文本的步驟之后,所述方法還包括:
9.一種內容查詢裝置,其特征在于,包括:
1
11.一種計算機設備,其特征在于,所述計算機設備包括:
12.一種計算機可讀存儲介質,其特征在于,其上存儲有計算機程序,所述計算機程序被處理器進行加載,以執(zhí)行權利要求1至6中或者權利要求7至8中任一項所述的內容查詢方法。
...【技術特征摘要】
1.一種內容查詢方法,其特征在于,包括:
2.根據權利要求1所述的內容查詢方法,其特征在于,所述第一語言模型是通過如下步驟訓練得到:
3.根據權利要求2所述的內容查詢方法,其特征在于,所述根據樣本詞語以及預設的文本模板生成所述樣本詞語對應的會話文本的步驟之前,所述方法還包括:
4.根據權利要求1所述的內容查詢方法,其特征在于,所述基于所述初始搜索詞和/或所述關聯(lián)詞,查詢得到目標多媒體內容,包括:
5.根據權利要求4所述的內容查詢方法,其特征在于,所述根據所述第一多媒體內容和所述第二多媒體內容確定所述初始搜索詞的目標多媒體內容,包括:
6.根據權利要求1~5任一項所述的內容查...
【專利技術屬性】
技術研發(fā)人員:陸軒韜,高龑,
申請(專利權)人:小紅書科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。