System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及計算機,尤其涉及搜索技術和大模型,能夠用于生成式搜索、智能問答、智能推薦等應用場景,具體涉及一種生成式搜索數據的處理方法、裝置、設備及存儲介質。
技術介紹
1、相關技術中,生成式搜索系統的優化通常依賴于人工標注的數據,獲取這些數據的時間和經濟成本較高,且優化方向與真實偏好的一致性難以保障。此外,傳統的用戶反饋信號復雜且噪音大,難以直接用于生成式大語言模型的優化。
技術實現思路
1、本公開提供一種生成式搜索數據的處理方法、裝置、設備及存儲介質。
2、根據本公開的第一方面,提供了一種生成式搜索數據的處理方法,該方法包括:收集目標對象對搜索頁面首位展示的搜索答案的反饋數據,其中,搜索答案是搜索系統利用第一大語言模型生成的答案;對反饋數據進行分析,以識別出影響搜索答案的滿意度的關鍵因素;結合關鍵因素,從反饋數據中挖掘出第一樣本集合和第二樣本集合,第一樣本集合包括滿意度大于第一閾值的樣本,第二樣本集合包括滿意度小于第二閾值的樣本;基于第一樣本集合和/或第二樣本集合,對第一大語言模型進行優化,得到第二大語言模型,其中,第二大語言模型生成的搜索答案與目標對象偏好的匹配度優于第一大語言模型;將第二大語言模型部署到搜索系統中,以替換第一大語言模型。
3、根據本公開的第二方面,提供了一種搜索處理方法,該方法包括:接收目標對象在搜索頁面上輸入的問題;利用預先訓練好的大語言模型,生成與問題相匹配的搜索答案;在搜索頁面的首位展示搜索答案;監測并記錄目標對象針對搜索答案的反饋
4、根據本公開的第三方面,提供了一種生成式搜索數據的處理裝置,該裝置包括:收集模塊,用于收集目標對象對搜索頁面首位展示的搜索答案的反饋數據,其中,搜索答案是搜索系統利用第一大語言模型生成的答案;分析模塊,用于對反饋數據進行分析,以識別出影響搜索答案的滿意度的關鍵因素;樣本挖掘模塊,用于結合關鍵因素,從反饋數據中挖掘出第一樣本集合和第二樣本集合,第一樣本集合包括滿意度大于第一閾值的樣本,第二樣本集合包括滿意度小于第二閾值的樣本;優化調整模塊,用于基于第一樣本集合和/或第二樣本集合,對第一大語言模型進行優化,得到第二大語言模型,其中,第二大語言模型生成的搜索答案與目標對象偏好的匹配度優于第一大語言模型;部署模塊,用于將第二大語言模型部署到搜索系統中,以替換第一大語言模型。
5、根據本公開的第四方面,提供了一種搜索處理裝置,該裝置包括:接收模塊,用于接收目標對象在搜索頁面上輸入的問題;生成模塊,用于利用預先訓練好的大語言模型,生成與問題相匹配的搜索答案;展示模塊,用于在搜索頁面的首位展示搜索答案;監測記錄模塊,用于監測并記錄目標對象針對搜索答案的反饋數據;其中,反饋數據用于優化大語言模型。
6、根據本公開的第五方面,提供了一種電子設備,包括:
7、至少一個處理器;以及
8、與該至少一個處理器通信連接的存儲器;其中,
9、該存儲器存儲有可被該至少一個處理器執行的指令,該指令被該至少一個處理器執行,以使該至少一個處理器能夠執行本公開實施例中任一的方法。
10、根據本公開的第六方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,該計算機指令用于使該計算機執行根據本公開實施例中任一的方法。
11、根據本公開的第七方面,提供了一種計算機程序產品,包括計算機程序,該計算機程序在被處理器執行時實現根據本公開實施例中任一的方法。
12、采用本公開的方案,通過收集多元反饋數據并自動挖掘出高置信度樣本,實現了生成式大語言模型的自我優化循環,提升了首位展示的搜索答案的質量,提高了目標對象獲取答案的效率。
13、應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
本文檔來自技高網...【技術保護點】
1.一種生成式搜索數據的處理方法,包括:
2.根據權利要求1所述的方法,其中,所述反饋數據包括:第一類反饋數據和第二類反饋數據;其中,所述第一類反饋數據包括目標對象搜索過程中的歷史行為數據;所述第二類反饋數據包括系統主動向目標對象收集的調研數據;其中,所述第一類反饋數據和所述第二類反饋數據是單輪生成式問答產生的數據。
3.根據權利要求2所述的方法,其中,所述反饋數據還包括:第三類反饋數據和第四類反饋數據;其中,所述第三類反饋數據包括多輪交互對話過程中產生的數據;所述第四類反饋數據包括多輪交互對話的深度的數據;其中,所述第三類反饋數據和所述第四類反饋數據是多輪生成式問答產生的數據。
4.根據權利要求1至3任一項所述的方法,其中,收集目標對象對搜索頁面首位展示的搜索答案的反饋數據,包括:
5.根據權利要求1所述的方法,其中,所述對所述反饋數據進行分析,以識別出影響所述搜索答案的滿意度的關鍵因素,包括:
6.根據權利要求1所述的方法,其中,所述結合所述關鍵因素,從所述反饋數據中挖掘出第一樣本集合和第二樣本集合,包括:
< ...【技術特征摘要】
1.一種生成式搜索數據的處理方法,包括:
2.根據權利要求1所述的方法,其中,所述反饋數據包括:第一類反饋數據和第二類反饋數據;其中,所述第一類反饋數據包括目標對象搜索過程中的歷史行為數據;所述第二類反饋數據包括系統主動向目標對象收集的調研數據;其中,所述第一類反饋數據和所述第二類反饋數據是單輪生成式問答產生的數據。
3.根據權利要求2所述的方法,其中,所述反饋數據還包括:第三類反饋數據和第四類反饋數據;其中,所述第三類反饋數據包括多輪交互對話過程中產生的數據;所述第四類反饋數據包括多輪交互對話的深度的數據;其中,所述第三類反饋數據和所述第四類反饋數據是多輪生成式問答產生的數據。
4.根據權利要求1至3任一項所述的方法,其中,收集目標對象對搜索頁面首位展示的搜索答案的反饋數據,包括:
5.根據權利要求1所述的方法,其中,所述對所述反饋數據進行分析,以識別出影響所述搜索答案的滿意度的關鍵因素,包括:
6.根據權利要求1所述的方法,其中,所述結合所述關鍵因素,從所述反饋數據中挖掘出第一樣本集合和第二樣本集合,包括:
7.根據權利要求1所述的方法,其中,所述基于所述第一樣本集合和/或所述第二樣本集合,對所述第一大語言模型進行優化,得到第二大語言模型,包括:
8.根據權利要求7所述的方法,其中,所述基于所述目標對齊算法,從所述第一樣本數據集合和所述第二樣本數據集合中篩選出符合所述目標對齊算法的訓練樣本,包括:
9.一種搜索處理方法,包括:
10.根據權利要求9所述的方法,其中,所述利用預先訓練好的大語言模型,生成與所述問題相匹配的搜索答案,包括:
11.根據權利要求10所述的方法,其中,所述確定所述問題對應的偏好特...
【專利技術屬性】
技術研發人員:王楷翔,夏喬林,王昊,魯宇婧,楊光開,鄧麗霞,徐昇,
申請(專利權)人:北京百度網訊科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。