System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及計算機領域,尤其涉及一種范圍式搜索詞的生成方法、裝置、存儲介質以及電子設備。
技術介紹
1、在現有的視頻網站中,用戶通常通過搜索查詢入口尋找他們想觀看的視頻,用戶只需輸入少量關鍵字,系統就會展示與這些關鍵字相關的推薦詞列表。例如,當用戶輸入“天才”作為關鍵字時,系統可能會推薦[天才槍手,天才眼鏡狗,天才基本法]等相關的推薦詞。由于用戶數量龐大,搜索模塊需要構建一個完備的詞庫來滿足用戶的個性化搜索需求。然而,存在大量具有范圍式搜索意圖的用戶,他們的搜索需求更為復雜。目前,搜索系統中的范圍式搜索詞庫缺乏一種自動化生成的方式,僅依賴于人工篩選出的幾千個推薦詞組成的詞庫來支持線上搜索,這部分有限的詞庫在處理范圍式搜索意圖時存在不足。當用戶輸入相關的關鍵字時,系統難以召回合適的推薦詞,導致搜索模塊無法充分滿足用戶的范圍式搜索需求。這種局限性削弱了用戶體驗,無法為用戶提供準確的搜索結果。因此,改進和擴展范圍式搜索詞庫,特別是通過自動化手段生成更多相關的推薦詞,以更好地滿足用戶的搜索需求,顯得尤為重要。
技術實現思路
1、本申請提供了一種范圍式搜索詞的生成方法、裝置、存儲介質以及電子設備,以解決無法通過自動化手段生成范圍式搜索詞的技術問題。
2、第一方面,本申請提供了一種范圍式搜索詞的生成方法,包括:獲取視頻庫中每一個視頻的所有三級標簽,得到標簽集合;對上述標簽集合中的所有三級標簽進行組合,構建初始范圍式搜索詞集合;將上述初始范圍式搜索詞集合中的每一個范圍式搜索詞輸入至目標
3、第二方面,本申請提供了一種范圍式搜索詞的生成裝置,包括:獲取模塊,用于獲取視頻庫中每一個視頻的所有三級標簽,得到標簽集合;第一構建模塊,用于對上述標簽集合中的所有三級標簽進行組合,構建初始范圍式搜索詞集合;識別模塊,用于將上述初始范圍式搜索詞集合中的每一個范圍式搜索詞輸入至目標大語言模型,識別上述初始范圍式搜索詞集合中的每一個范圍式搜索詞的語法問題,得到上述初始范圍式搜索詞集合中的每一個范圍式搜索詞的識別結果;刪除模塊,用于將上述初始范圍式搜索詞集合中的目標范圍式搜索詞刪除,得到目標范圍式搜索詞集合,其中,上述目標范圍式搜索詞的識別結果為存在語法問題。
4、作為一種可選的示例,上述構建模塊包括:確定單元,用于確定組合規則,其中,上述組合規則為上述初始范圍式搜索詞集合中的每一個范圍式搜索詞包括至少兩個三級標簽;組合單元,用于根據上述組合規則,對上述標簽集合中的所有三級標簽進行組合,得到上述初始范圍式搜索詞集合。
5、作為一種可選的示例,上述裝置還包括:第一處理模塊,用于在構建初始范圍式搜索詞集合之后,將上述初始范圍式搜索詞集合中的每一個范圍式搜索詞作為當前范圍式搜索詞,對上述當前范圍式搜索詞執行如下操作:判斷上述初始范圍式搜索詞集合中是否存在與上述當前范圍式搜索詞相同的范圍式搜索詞;在上述初始范圍式搜索詞集合中存在與上述當前范圍式搜索詞相同的范圍式搜索詞的情況下,將上述初始范圍式搜索詞集合中除上述當前范圍式搜索詞外的與上述當前范圍式搜索詞相同的所有范圍式搜索詞刪除。
6、作為一種可選的示例,上述裝置還包括:第二構建模塊,用于在上述初始范圍式搜索詞集合中存在與上述當前范圍式搜索詞相同的范圍式搜索詞的情況下,將上述初始范圍式搜索詞集合中除上述當前范圍式搜索詞外的與上述當前范圍式搜索詞相同的所有范圍式搜索詞刪除之后,根據上述初始范圍式搜索詞集合,構建訓練數據集和驗證數據集;第二處理模塊,用于將上述訓練數據集輸入至初始大語言模型,得到上述訓練數據集的結果數據集;第一計算模塊,用于使用損失函數計算上述結果數據集與上述驗證數據集之間的差異,得到損失值;第二計算模塊,用于根據上述損失值調整上述初始大語言模型的模型參數,并重新計算上述損失值,直到重新計算的上述損失值小于目標閾值,得到上述目標大語言模型。
7、作為一種可選的示例,上述識別模塊包括:處理單元,用于將上述初始范圍式搜索詞集合中的每一個范圍式搜索詞作為當前范圍式搜索詞,對上述當前范圍式搜索詞執行如下操作:在上述視頻庫中查找與上述當前范圍式搜索詞對應的目標視頻;在上述視頻庫中不存在上述目標視頻的情況下,確定上述當前范圍式搜索詞的語法問題為存在語法問題;在上述視頻庫中存在上述目標視頻的情況下,確定上述當前范圍式搜索詞的語法問題為不存在語法問題。
8、作為一種可選的示例,上述處理單元,用于將上述當前范圍式搜索詞進行拆分,得到所有當前三級標簽;從上述視頻庫中獲取與每一個上述當前三級標簽對應的視頻集合;將每一個上述視頻集合中都存在的視頻確定為與上述當前范圍式搜索詞對應的目標視頻。
9、第三方面,本申請提供了一種存儲介質,該存儲介質中存儲有計算機程序,其中,該計算機程序被處理器運行時執行上述范圍式搜索詞的生成方法。
10、第四方面,本申請還提供了一種電子設備,包括存儲器和處理器,上述存儲器中存儲有計算機程序,上述處理器被設置為通過所述計算機程序執行上述的范圍式搜索詞的生成方法。
11、在本申請實施例中,采用了獲取視頻庫中每一個視頻的所有三級標簽,得到標簽集合;對上述標簽集合中的所有三級標簽進行組合,構建初始范圍式搜索詞集合;將上述初始范圍式搜索詞集合中的每一個范圍式搜索詞輸入至目標大語言模型,識別上述初始范圍式搜索詞集合中的每一個范圍式搜索詞的語法問題,得到上述初始范圍式搜索詞集合中的每一個范圍式搜索詞的識別結果;將上述初始范圍式搜索詞集合中的目標范圍式搜索詞刪除,得到目標范圍式搜索詞集合,其中,上述目標范圍式搜索詞的識別結果為存在語法問題的方法,由于在上述方法中,利用三級標簽自動化組合生成范圍式搜索詞集合,再通過大語言模型對初始范圍式搜索詞集合進行語法檢測和優化,最終生成在語法上更為準確的范圍式搜索詞集合,從而實現了自動化生成和優化范圍式搜索詞集合,減少對人工構建和維護詞庫的依賴,降低人力成本的目的,進而解決了無法通過自動化手段生成范圍式搜索詞的技術問題。
本文檔來自技高網...【技術保護點】
1.一種范圍式搜索詞的生成方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述對所述標簽集合中的所有三級標簽進行組合,構建初始范圍式搜索詞集合包括:
3.根據權利要求1所述的方法,其特征在于,在構建初始范圍式搜索詞集合之后,所述方法還包括:
4.根據權利要求3所述的方法,其特征在于,在所述初始范圍式搜索詞集合中存在與所述當前范圍式搜索詞相同的范圍式搜索詞的情況下,將所述初始范圍式搜索詞集合中除所述當前范圍式搜索詞外的與所述當前范圍式搜索詞相同的所有范圍式搜索詞刪除之后,所述方法還包括:
5.根據權利要求1所述的方法,其特征在于,所述將所述初始范圍式搜索詞集合中的每一個范圍式搜索詞輸入至目標大語言模型,識別所述初始范圍式搜索詞集合中的每一個范圍式搜索詞的語法問題,得到所述初始范圍式搜索詞集合中的每一個范圍式搜索詞的識別結果包括:
6.根據權利要求5所述的方法,其特征在于,所述在所述視頻庫中查找與所述當前范圍式搜索詞對應的目標視頻包括:
7.一種范圍式搜索詞的生成裝置,其特征在于,包括:
>8.根據權利要求7所述的裝置,其特征在于,所述構建模塊包括:
9.一種計算機可讀的存儲介質,所述計算機可讀的存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器運行時執行所述權利要求1至6任一項中所述的方法。
10.一種電子設備,包括存儲器和處理器,其特征在于,所述存儲器中存儲有計算機程序,所述處理器被設置為通過所述計算機程序執行所述權利要求1至6任一項中所述的方法。
...【技術特征摘要】
1.一種范圍式搜索詞的生成方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述對所述標簽集合中的所有三級標簽進行組合,構建初始范圍式搜索詞集合包括:
3.根據權利要求1所述的方法,其特征在于,在構建初始范圍式搜索詞集合之后,所述方法還包括:
4.根據權利要求3所述的方法,其特征在于,在所述初始范圍式搜索詞集合中存在與所述當前范圍式搜索詞相同的范圍式搜索詞的情況下,將所述初始范圍式搜索詞集合中除所述當前范圍式搜索詞外的與所述當前范圍式搜索詞相同的所有范圍式搜索詞刪除之后,所述方法還包括:
5.根據權利要求1所述的方法,其特征在于,所述將所述初始范圍式搜索詞集合中的每一個范圍式搜索詞輸入至目標大語言模型,識別所述初始范圍式搜索詞集...
【專利技術屬性】
技術研發人員:代聰,
申請(專利權)人:北京愛奇藝科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。