System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲成av人片不卡无码,亚洲AV无码一区二区乱子伦 ,国产∨亚洲V天堂无码久久久
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    生成式搜索數據的處理方法、裝置、設備及存儲介質制造方法及圖紙

    技術編號:44432200 閱讀:3 留言:0更新日期:2025-02-28 18:43
    本公開提供一種生成式搜索數據的處理方法、裝置、設備及存儲介質。本公開涉及計算機技術領域,尤其涉及搜索技術和大模型技術領域,能夠用于生成式搜索、智能問答、智能推薦等應用場景。該方法包括:收集目標對象對搜索頁面首位展示的搜索答案的反饋數據;對反饋數據進行分析,以識別出影響搜索答案的滿意度的關鍵因素;結合關鍵因素,從反饋數據中挖掘出第一樣本集合和第二樣本集合;基于第一樣本集合和/或第二樣本集合,對第一大語言模型進行優化,得到第二大語言模型;將第二大語言模型部署到搜索系統中,以替換第一大語言模型。根據本公開的方案,能自動挖掘出高置信度樣本,實現生成式大語言模型的自我優化循環,提升搜索答案的質量。

    【技術實現步驟摘要】

    本公開涉及計算機,尤其涉及搜索技術和大模型,能夠用于生成式搜索、智能問答、智能推薦等應用場景,具體涉及一種生成式搜索數據的處理方法、裝置、設備及存儲介質


    技術介紹

    1、相關技術中,生成式搜索系統的優化通常依賴于人工標注的數據,獲取這些數據的時間和經濟成本較高,且優化方向與真實偏好的一致性難以保障。此外,傳統的用戶反饋信號復雜且噪音大,難以直接用于生成式大語言模型的優化。


    技術實現思路

    1、本公開提供一種生成式搜索數據的處理方法、裝置、設備及存儲介質。

    2、根據本公開的第一方面,提供了一種生成式搜索數據的處理方法,該方法包括:收集目標對象對搜索頁面首位展示的搜索答案的反饋數據,其中,搜索答案是搜索系統利用第一大語言模型生成的答案;對反饋數據進行分析,以識別出影響搜索答案的滿意度的關鍵因素;結合關鍵因素,從反饋數據中挖掘出第一樣本集合和第二樣本集合,第一樣本集合包括滿意度大于第一閾值的樣本,第二樣本集合包括滿意度小于第二閾值的樣本;基于第一樣本集合和/或第二樣本集合,對第一大語言模型進行優化,得到第二大語言模型,其中,第二大語言模型生成的搜索答案與目標對象偏好的匹配度優于第一大語言模型;將第二大語言模型部署到搜索系統中,以替換第一大語言模型。

    3、根據本公開的第二方面,提供了一種搜索處理方法,該方法包括:接收目標對象在搜索頁面上輸入的問題;利用預先訓練好的大語言模型,生成與問題相匹配的搜索答案;在搜索頁面的首位展示搜索答案;監測并記錄目標對象針對搜索答案的反饋數據;其中,反饋數據用于優化大語言模型。

    4、根據本公開的第三方面,提供了一種生成式搜索數據的處理裝置,該裝置包括:收集模塊,用于收集目標對象對搜索頁面首位展示的搜索答案的反饋數據,其中,搜索答案是搜索系統利用第一大語言模型生成的答案;分析模塊,用于對反饋數據進行分析,以識別出影響搜索答案的滿意度的關鍵因素;樣本挖掘模塊,用于結合關鍵因素,從反饋數據中挖掘出第一樣本集合和第二樣本集合,第一樣本集合包括滿意度大于第一閾值的樣本,第二樣本集合包括滿意度小于第二閾值的樣本;優化調整模塊,用于基于第一樣本集合和/或第二樣本集合,對第一大語言模型進行優化,得到第二大語言模型,其中,第二大語言模型生成的搜索答案與目標對象偏好的匹配度優于第一大語言模型;部署模塊,用于將第二大語言模型部署到搜索系統中,以替換第一大語言模型。

    5、根據本公開的第四方面,提供了一種搜索處理裝置,該裝置包括:接收模塊,用于接收目標對象在搜索頁面上輸入的問題;生成模塊,用于利用預先訓練好的大語言模型,生成與問題相匹配的搜索答案;展示模塊,用于在搜索頁面的首位展示搜索答案;監測記錄模塊,用于監測并記錄目標對象針對搜索答案的反饋數據;其中,反饋數據用于優化大語言模型。

    6、根據本公開的第五方面,提供了一種電子設備,包括:

    7、至少一個處理器;以及

    8、與該至少一個處理器通信連接的存儲器;其中,

    9、該存儲器存儲有可被該至少一個處理器執行的指令,該指令被該至少一個處理器執行,以使該至少一個處理器能夠執行本公開實施例中任一的方法。

    10、根據本公開的第六方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,該計算機指令用于使該計算機執行根據本公開實施例中任一的方法。

    11、根據本公開的第七方面,提供了一種計算機程序產品,包括計算機程序,該計算機程序在被處理器執行時實現根據本公開實施例中任一的方法。

    12、采用本公開的方案,通過收集多元反饋數據并自動挖掘出高置信度樣本,實現了生成式大語言模型的自我優化循環,提升了首位展示的搜索答案的質量,提高了目標對象獲取答案的效率。

    13、應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。

    本文檔來自技高網...

    【技術保護點】

    1.一種生成式搜索數據的處理方法,包括:

    2.根據權利要求1所述的方法,其中,所述反饋數據包括:第一類反饋數據和第二類反饋數據;其中,所述第一類反饋數據包括目標對象搜索過程中的歷史行為數據;所述第二類反饋數據包括系統主動向目標對象收集的調研數據;其中,所述第一類反饋數據和所述第二類反饋數據是單輪生成式問答產生的數據。

    3.根據權利要求2所述的方法,其中,所述反饋數據還包括:第三類反饋數據和第四類反饋數據;其中,所述第三類反饋數據包括多輪交互對話過程中產生的數據;所述第四類反饋數據包括多輪交互對話的深度的數據;其中,所述第三類反饋數據和所述第四類反饋數據是多輪生成式問答產生的數據。

    4.根據權利要求1至3任一項所述的方法,其中,收集目標對象對搜索頁面首位展示的搜索答案的反饋數據,包括:

    5.根據權利要求1所述的方法,其中,所述對所述反饋數據進行分析,以識別出影響所述搜索答案的滿意度的關鍵因素,包括:

    6.根據權利要求1所述的方法,其中,所述結合所述關鍵因素,從所述反饋數據中挖掘出第一樣本集合和第二樣本集合,包括:

    <p>7.根據權利要求1所述的方法,其中,所述基于所述第一樣本集合和/或所述第二樣本集合,對所述第一大語言模型進行優化,得到第二大語言模型,包括:

    8.根據權利要求7所述的方法,其中,所述基于所述目標對齊算法,從所述第一樣本數據集合和所述第二樣本數據集合中篩選出符合所述目標對齊算法的訓練樣本,包括:

    9.一種搜索處理方法,包括:

    10.根據權利要求9所述的方法,其中,所述利用預先訓練好的大語言模型,生成與所述問題相匹配的搜索答案,包括:

    11.根據權利要求10所述的方法,其中,所述確定所述問題對應的偏好特征,包括:

    12.一種生成式搜索數據的處理裝置,包括:

    13.根據權利要求12所述的裝置,其中,所述反饋數據包括:第一類反饋數據和第二類反饋數據;其中,所述第一類反饋數據包括目標對象搜索過程中的歷史行為數據;所述第二類反饋數據包括系統主動向目標對象收集的調研數據;其中,所述第一類反饋數據和所述第二類反饋數據是單輪生成式問答產生的數據。

    14.根據權利要求12所述的裝置,其中,所述反饋數據還包括:第三類反饋數據和第四類反饋數據;其中,所述第三類反饋數據包括多輪交互對話過程中產生的數據;所述第四類反饋數據包括多輪交互對話的深度的數據;其中,所述第三類反饋數據和所述第四類反饋數據是多輪生成式問答產生的數據。

    15.根據權利要求12至14任一項所述的裝置,其中,所述收集模塊,包括:

    16.根據權利要求12所述的裝置,其中,所述分析模塊,包括:

    17.根據權利要求12所述的裝置,其中,所述樣本挖掘模塊,包括:

    18.根據權利要求12所述的裝置,其中,所述優化調整模塊,包括:

    19.根據權利要求18所述的裝置,其中,所述第二生成子模塊,用于:

    20.一種搜索處理裝置,包括:

    21.根據權利要求20所述的裝置,其中,所述生成模塊,包括:

    22.根據權利要求21所述的裝置,其中,所述確定子模塊,用于:

    23.一種電子設備,包括:

    24.一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,計算機指令用于使計算機執行根據權利要求1-11中任一項的方法。

    25.一種計算機程序產品,包括存儲在存儲介質上的計算機程序,計算機程序在被處理器執行時實現根據權利要求1-11中任一項的方法。

    ...

    【技術特征摘要】

    1.一種生成式搜索數據的處理方法,包括:

    2.根據權利要求1所述的方法,其中,所述反饋數據包括:第一類反饋數據和第二類反饋數據;其中,所述第一類反饋數據包括目標對象搜索過程中的歷史行為數據;所述第二類反饋數據包括系統主動向目標對象收集的調研數據;其中,所述第一類反饋數據和所述第二類反饋數據是單輪生成式問答產生的數據。

    3.根據權利要求2所述的方法,其中,所述反饋數據還包括:第三類反饋數據和第四類反饋數據;其中,所述第三類反饋數據包括多輪交互對話過程中產生的數據;所述第四類反饋數據包括多輪交互對話的深度的數據;其中,所述第三類反饋數據和所述第四類反饋數據是多輪生成式問答產生的數據。

    4.根據權利要求1至3任一項所述的方法,其中,收集目標對象對搜索頁面首位展示的搜索答案的反饋數據,包括:

    5.根據權利要求1所述的方法,其中,所述對所述反饋數據進行分析,以識別出影響所述搜索答案的滿意度的關鍵因素,包括:

    6.根據權利要求1所述的方法,其中,所述結合所述關鍵因素,從所述反饋數據中挖掘出第一樣本集合和第二樣本集合,包括:

    7.根據權利要求1所述的方法,其中,所述基于所述第一樣本集合和/或所述第二樣本集合,對所述第一大語言模型進行優化,得到第二大語言模型,包括:

    8.根據權利要求7所述的方法,其中,所述基于所述目標對齊算法,從所述第一樣本數據集合和所述第二樣本數據集合中篩選出符合所述目標對齊算法的訓練樣本,包括:

    9.一種搜索處理方法,包括:

    10.根據權利要求9所述的方法,其中,所述利用預先訓練好的大語言模型,生成與所述問題相匹配的搜索答案,包括:

    11.根據權利要求10所述的方法,其中,所述確定所述問題對應的偏好特...

    【專利技術屬性】
    技術研發人員:王楷翔夏喬林王昊魯宇婧楊光開鄧麗霞徐昇
    申請(專利權)人:北京百度網訊科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码成人精品区在线观看| 国产成人无码区免费内射一片色欲| 久久久精品人妻无码专区不卡| 无码色AV一二区在线播放| 亚洲爆乳精品无码一区二区三区 | 亚洲Av无码国产情品久久| 亚洲精品无码久久不卡| 精品人妻系列无码一区二区三区| 天堂无码在线观看| 日韩乱码人妻无码中文字幕| 久久久无码精品亚洲日韩软件| 亚洲av无码一区二区三区观看| 波多野42部无码喷潮在线| 亚洲av无码电影网| 性无码一区二区三区在线观看| 无码少妇一区二区三区芒果| 亚洲AV无码成人精品区蜜桃| 亚洲色偷拍区另类无码专区| 国产精品亚洲专区无码唯爱网| 无码成A毛片免费| 一本一道AV无码中文字幕| 一本大道久久东京热无码AV| 精品亚洲成在人线AV无码| 无码AV中文字幕久久专区| 国产在线无码精品电影网 | 无码AV大香线蕉| 精品无码人妻夜人多侵犯18| 国产成人无码18禁午夜福利p| 特级无码a级毛片特黄| 久久久久无码精品国产h动漫| 中文字幕av无码无卡免费| 亚洲色av性色在线观无码| 无码成人一区二区| 亚洲AV无码精品蜜桃| AV无码久久久久不卡网站下载| 日韩AV无码精品人妻系列| 国产AV一区二区三区无码野战| 亚洲国产一二三精品无码| 久久青青草原亚洲AV无码麻豆| 亚洲AV无码久久| 亚洲中文字幕无码中文|