System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及直播的,具體涉及一種直播素材的推薦方法、系統、電子設備及存儲介質。
技術介紹
1、隨著直播行業的迅速發展,越來越多的內容創作者和商家開始利用直播平臺進行產品推廣、品牌宣傳和互動交流。為了提高直播的質量和觀眾的參與度,往往需要直播助手來支持主播的各種需求,例如實時互動、內容管理、數據分析等。這些功能不僅能夠提升直播的效果,還能幫助主播更好地了解觀眾的需求,從而實現更精準的營銷策略。
2、在現有的直播助手中,常見的素材推薦方法主要依賴于手動挑選或者簡單的關鍵詞匹配。具體來說,一種常見的方式是主播預先準備一些素材,然后在直播過程中手動選擇合適的素材進行展示。另一種方式是通過簡單的關鍵詞匹配,將預先設置好的關鍵詞與素材庫中的素材進行對比,選擇匹配度較高的素材進行推薦。但是,手動挑選素材費時費力,容易導致素材選擇不夠及時和準確。簡單的關鍵詞匹配方法缺乏智能性,難以全面考慮直播的主題和上下文信息,可能導致推薦的素材與直播內容不符,影響觀眾的觀看體驗。
3、因此,如何對直播素材進行更加智能化地推薦,成為亟待解決的技術問題。
技術實現思路
1、本申請提供一種直播素材的推薦方法、系統、電子設備及存儲介質,通過實時捕捉主播的語音內容、精準提取關鍵詞、高效篩選素材和靈活推薦匹配素材等步驟,實現了對直播素材的精準推薦,提升了直播的精準度、效率、互動性和適應性,從而優化了觀眾的觀看體驗和主播的直播效果。
2、在本申請的第一方面提供了一種直播素材的推薦方法,其特征
3、獲取主播的語音,將所述語音轉換為文本,并對所述文本進行分詞處理得到多個第一關鍵詞以組成關鍵詞集合;
4、根據與直播主題的相似度得分、詞頻得分和與預設高熱詞匹配得分對多個所述第一關鍵詞進行評分,并選擇評分最高的第一預設數量的所述第一關鍵詞作為第二關鍵詞;
5、根據所述第二關鍵詞在素材庫中進行檢索,獲取待選擇素材信息;
6、根據直播的上下文和所述直播主題,從所述待選擇素材信息中選擇匹配度最高的素材進行推薦。
7、可選的,所述根據與直播主題的相似度得分、詞頻得分和與預設高熱詞的匹配得分對多個所述第一關鍵詞進行評分包括:
8、對所述直播主題進行分詞處理,得到主題分詞,確定所述第一關鍵詞與所述主題分詞之間的交集和并集,并計算所述交集與所述并集的第一比值作為所述第一關鍵詞的相似度得分;
9、計算所述第一關鍵詞的詞頻和文檔頻率,根據所述文檔頻率計算逆文檔頻率,根據語義、位置和上下文為所述第一關鍵詞分配重要性因子,根據所述詞頻、逆文檔頻率和重要性因子計算所述第一關鍵詞的詞頻得分;
10、在預設知識庫中查找與所述第一關鍵詞匹配的高熱詞,并根據匹配結果計算所述第一關鍵詞的匹配得分;
11、對所述相似度得分、所述詞頻得分和所述匹配得分進行加權求和以得到所述第一關鍵詞的評分。
12、可選的,所述計算所述第一關鍵詞的詞頻和文檔頻率,根據所述文檔頻率計算逆文檔頻率,根據語義、位置和上下文為所述第一關鍵詞分配重要性因子包括:
13、遍歷所述文本確定所述第一關鍵詞在所述文本中出現的第一次數,計算所述第一次數與第二次數的第二比值作為所述第一關鍵詞的詞頻,所述第二次數為所述關鍵詞集合中所有關鍵詞在所述文本中出現的總次數;
14、遍歷預設文檔集合確定包含所述第一關鍵詞的第一文檔數量,計算所述第一文檔數量與第二文檔數量的第三比值作為所述第一關鍵詞的文檔頻率,所述第二文檔數量為所述預設文檔集合中所有文檔的總數量;
15、通過預設公式根據所述文檔頻率計算逆文檔頻率;
16、根據所述第一關鍵詞的語義特征確定語義重要性,根據所述第一關鍵詞在所述文本的位置確定位置重要性,并根據所述第一關鍵詞與其他關鍵詞的關聯度確定上下文重要性,并根據所述語義重要性、所述位置重要性和所述上下文重要性確定重要性因子,所述其他關鍵詞為所述關鍵詞集合中除所述第一關鍵詞之外的關鍵詞。
17、可選的,所述根據所述第二關鍵詞在素材庫中進行檢索,獲取待選擇素材信息包括:
18、應用布隆過濾器對數據存儲結構進行過濾,去除所述數據存儲結構不包含所述第二關鍵詞的列以得到第一目標列,所述數據存儲結構包括常用列和不常用列,所述常用列包括被搜索次數大于閾值的字段,所述不常用列包括被搜索次數小于或等于所述閾值的字段;
19、利用倒排索引在所述第一目標列的索引節點上檢索包含所述第二關鍵詞的記錄id列表;
20、合并來自不同索引節點的檢索結果,將所有記錄id列表進行合并以得到合并列表,并根據相關性對所述檢索結果進行排序;
21、根據所述合并列表確定待選擇素材信息。
22、可選的,所述應用布隆過濾器對數據存儲結構進行過濾,去除所述數據存儲結構不包含所述第二關鍵詞的列以得到第一目標列包括:
23、創建位向量,并將所述位向量的所有位初始化為零,
24、遍歷數據存儲結構,對于第二目標列使用相同的第二預設數量的哈希函數對所述第二目標列的標識或內容進行哈希計算,檢查所述位向量中對應的第二預設數量的位是否全部為一;
25、如果全部為一,則將所述第二目標列保留為目標列的一部分;
26、將所有被保留為目標列的列進行合并形成所述第一目標列。
27、可選的,所述合并來自不同索引節點的檢索結果,將所有記錄id列表進行合并以得到合并列表,并根據相關性對所述檢索結果進行排序包括:
28、在合并過程中,根據重復記錄id在不同索引節點上的出現頻率和權重進行合并處理,以保留出現頻率和權重最高的重復記錄id;
29、根據目標記錄id對應的素材內容、素材與直播主題的關聯度、素材的流行度計算所述目標記錄id的相關性得分,所述目標記錄id為合并列表中的任意一個記錄id;
30、根據相關性得分對所述合并列表中的記錄id進行降序排序。
31、可選的,所述根據直播的上下文和所述直播主題,從所述待選擇素材信息中選擇匹配度最高的素材進行推薦包括:
32、分析直播的上下文信息,提取所述上下文信息中的目標信息點,所述目標信息點包括人物、地點和事件;
33、將所述目標信息點與所述直播主題相結合形成綜合查詢條件,并根據所述綜合查詢條件,對所述待選擇素材信息進行過濾和篩選,選擇同時符合所述直播主題和所述目標信息點的待選素材;
34、為時效性、質量、用戶反饋分別設定權重,根據所述權重計算所述待選素材的綜合得分,并根據所述綜合得分對選擇的素材進行降序排序,將綜合得分最高的待選素材作為推薦素材進行推送。
35、在本申請的第二方面提供了一種直播素材的推薦系統,包括文本模塊、評分模塊、檢索模塊以及推薦模塊,其中:
36、文本模塊,配置用于獲取主播的語音,將所述本文檔來自技高網...
【技術保護點】
1.一種直播素材的推薦方法,其特征在于,應用于直播助手系統,所述方法包括:
2.根據權利要求1所述的直播素材的推薦方法,其特征在于,所述根據與直播主題的相似度得分、詞頻得分和與預設高熱詞的匹配得分對多個所述第一關鍵詞進行評分包括:
3.根據權利要求2所述的直播素材的推薦方法,其特征在于,所述計算所述第一關鍵詞的詞頻和文檔頻率,根據所述文檔頻率計算逆文檔頻率,根據語義、位置和上下文為所述第一關鍵詞分配重要性因子包括:
4.根據權利要求1所述的直播素材的推薦方法,其特征在于,所述根據所述第二關鍵詞在素材庫中進行檢索,獲取待選擇素材信息包括:
5.根據權利要求4所述的直播素材的推薦方法,其特征在于,所述應用布隆過濾器對數據存儲結構進行過濾,去除所述數據存儲結構不包含所述第二關鍵詞的列以得到第一目標列包括:
6.根據權利要求4所述的直播素材的推薦方法,其特征在于,所述合并來自不同索引節點的檢索結果,將所有記錄ID列表進行合并以得到合并列表,并根據相關性對所述檢索結果進行排序包括:
7.根據權利要求1所述的直播素材的推
8.一種直播素材的推薦系統,其特征在于,包括文本模塊、評分模塊、檢索模塊以及推薦模塊,其中:
9.一種電子設備,其特征在于,包括處理器、存儲器、用戶接口以及網絡接口,所述存儲器用于存儲指令,所述用戶接口和所述網絡接口均用于與其他設備通信,所述處理器用于執行所述存儲器中存儲的指令,以使所述電子設備執行如權利要求1-7任意一項所述的方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有指令,當所述指令被執行時,執行如權利要求1-7任意一項所述的方法。
...【技術特征摘要】
1.一種直播素材的推薦方法,其特征在于,應用于直播助手系統,所述方法包括:
2.根據權利要求1所述的直播素材的推薦方法,其特征在于,所述根據與直播主題的相似度得分、詞頻得分和與預設高熱詞的匹配得分對多個所述第一關鍵詞進行評分包括:
3.根據權利要求2所述的直播素材的推薦方法,其特征在于,所述計算所述第一關鍵詞的詞頻和文檔頻率,根據所述文檔頻率計算逆文檔頻率,根據語義、位置和上下文為所述第一關鍵詞分配重要性因子包括:
4.根據權利要求1所述的直播素材的推薦方法,其特征在于,所述根據所述第二關鍵詞在素材庫中進行檢索,獲取待選擇素材信息包括:
5.根據權利要求4所述的直播素材的推薦方法,其特征在于,所述應用布隆過濾器對數據存儲結構進行過濾,去除所述數據存儲結構不包含所述第二關鍵詞的列以得到第一目標列包括:
6.根據權利要求4所述的直播素材的推薦方...
【專利技術屬性】
技術研發人員:白雪峰,
申請(專利權)人:北京順世思成科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。