System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 免费无码又爽又刺激毛片,亚洲国产成人无码AV在线影院,熟妇无码乱子成人精品
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    用于訓練知識庫選取模型的方法、用戶問題的處理方法及裝置制造方法及圖紙

    技術編號:44192829 閱讀:15 留言:0更新日期:2025-02-06 18:31
    本申請涉及人工智能技術領域,尤其是一種用于訓練知識庫選取模型的方法、用戶問題的處理方法及裝置。包括:獲取用戶的多個歷史查詢問題、多個歷史查詢問題的參考回復以及用于表征多個歷史查詢問題及其對應參考回復來源的知識庫的預期選擇向量;確定每個歷史查詢問題的歷史嵌入向量、每個歷史查詢問題下每個知識庫的歷史選取概率向量;根據每個歷史查詢問題的歷史選取概率向量和預期選擇向量確定每個歷史查詢問題的第一損失值;根據所有的第一損失值確定知識庫選取模型的總損失值;在總損失值小于預設數值的情況下,確定知識庫選取模型訓練完成,提高知識庫選取模型的模型性能和對知識庫的選取精度、選取效率,為后續用戶查詢提供更為準確的回復。

    【技術實現步驟摘要】

    本申請涉及人工智能,具體地涉及一種用于訓練知識庫選取模型的方法、用戶問題的處理方法、裝置及存儲介質。


    技術介紹

    1、現有的知識庫檢索一般是利用大模型根據知識庫描述去檢索對應的知識庫或者直接在所有的知識庫中遍歷以得到對應的知識庫。一方面現有的知識庫檢索方式過度依賴于大模型對知識庫描述理解的準確性,而現有的知識庫描述往往做不到全面、準確,而是比較片面、重復冗余、存在歧義,從而導致大模型檢索的知識庫出現錯誤、不夠準確。另一方面直接對全部知識庫進行檢索的方式會導致計算資源大量消耗,且往往無法打破不同知識庫之間的信息壁壘,使得檢索過程十分煩瑣,且檢索結果不夠準確。上述的知識庫檢索方法均無法及時準確地檢索到對應的知識庫,導致無法為后續的用戶咨詢提供良好的回復,無法有效地解決用戶的問題。


    技術實現思路

    1、本申請實施例的目的是提供一種用于訓練知識庫選取模型的方法、用戶問題的處理方法、裝置及存儲介質,用以解決現有技術中無法準確選取用戶所需的知識庫、造成問答不準確的問題。

    2、為了實現上述目的,本申請第一方面提供一種用于訓練知識庫選取模型的方法,方法包括:

    3、獲取用戶的多個歷史查詢問題、多個歷史查詢問題的參考回復以及用于表征多個歷史查詢問題及其對應參考回復來源的知識庫的預期選擇向量;

    4、預處理多個歷史查詢問題中的每個歷史查詢問題,得到每個歷史查詢問題的歷史嵌入向量;

    5、將每個歷史查詢問題的歷史嵌入向量依次輸入至知識庫選取模型,以得到每個歷史查詢問題下每個知識庫的歷史選取概率向量;

    6、根據每個歷史查詢問題的歷史選取概率向量和預期選擇向量確定每個歷史查詢問題的第一損失值;

    7、根據所有的第一損失值確定知識庫選取模型的總損失值;

    8、在總損失值小于預設數值的情況下,確定知識庫選取模型訓練完成。

    9、在本申請實施例中,根據所有的第一損失值確定知識庫選取模型的總損失值包括:確定每個歷史查詢問題的參考上下文;將每個歷史查詢問題和每個歷史查詢問題的參考上下文輸入至大語言模型,以輸出每個歷史查詢問題的預測回復;根據每個歷史查詢問題的預測回復和每個歷史查詢問題的參考回復確定每個歷史查詢問題的第二損失值;根據所有的第一損失值和第二損失值確定知識庫選取模型的總損失值。

    10、在本申請實施例中,確定每個歷史查詢問題的參考上下文包括:針對每個歷史查詢問題,基于預設選擇邏輯處理該歷史查詢問題的歷史選取概率向量,以得到用于表征每個知識庫是否為該歷史查詢問題對應的參考上下文來源的知識庫的歷史選擇向量;根據該歷史查詢問題對應的歷史選擇向量確定該歷史查詢問題的參考上下文的來源知識庫;從來源知識庫中提取出與該歷史查詢問題對應的參考上下文。

    11、在本申請實施例中,根據所有的第一損失值和第二損失值確定知識庫選取模型的總損失值包括根據公式(1)確定總損失值:

    12、(1)

    13、其中,為總損失值,為第i個歷史查詢問題的參考回復,為第i個歷史查詢問題的預測回復,為第i個歷史查詢問題的歷史選取概率向量,為第i個歷史查詢問題的預期選擇向量,si為第i個歷史查詢問題的歷史選擇向量,m為第m個歷史查詢問題。

    14、在本申請實施例中,知識庫通過以下步驟訓練得到:確定目標垂域對應的多個參與方,多個參與方擁有目標垂域的本地文本數據;將目標垂域的初始大模型分發至多個參與方,以使多個參與方基于各自所擁有的目標垂域的本地文本數據迭代訓練初始大模型;獲取多個參與方各自返回的迭代訓練得到的臨時大模型,并將其中校驗合規的臨時大模型進行聚合得到當前最新的聚合大模型;在滿足迭代訓練的終止條件的情況下,將當前最新的聚合大模型確定為目標垂域對應的知識庫。

    15、在本申請實施例中,預處理多個歷史查詢問題中的每個歷史查詢問題包括:將多個歷史查詢問題中的每個歷史查詢問題輸入至嵌入模型,以通過嵌入模型輸出與每個歷史查詢問題對應的歷史嵌入向量。

    16、在本申請實施例中,方法還包括:在總損失值大于或等于預設數值的情況下,確定針對知識庫選取模型的訓練次數遞增,調整知識庫選取模型的模型參數,并再次回到獲取用戶的多個歷史查詢問題、多個歷史查詢問題的參考回復以及用于表征多個歷史查詢問題及其對應參考回復來源的知識庫的預期選擇向量的步驟,直至滿足訓練條件。

    17、本申請第二方面提供一種用戶問題的處理方法,方法包括:

    18、獲取用戶的當前查詢問題;

    19、將當前查詢問題輸入至嵌入模型,以通過嵌入模型輸出當前查詢問題的嵌入向量;

    20、將嵌入向量輸入至知識庫選取模型,以得到知識庫選取模型輸出的選取概率向量,其中,知識庫選取模型是使用上述的用于訓練知識庫選取模型的方法訓練的;

    21、根據選取概率向量確定表征每個知識庫是否為當前查詢問題對應的當前參考上下文的來源的當前選擇向量;

    22、根據所有的當前選擇向量確定是當前查詢問題的當前參考上下文的來源的目標知識庫;

    23、從目標知識庫中提取出針對當前查詢問題的當前參考上下文;

    24、根據當前查詢問題和當前參考上下文確定當前查詢問題的回復。

    25、在本申請實施例中,從目標知識庫中提取出針對當前查詢問題的當前參考上下文包括:基于嵌入向量在目標知識庫中進行檢索,以確定目標知識庫中與嵌入向量的相似度處于預設范圍內的目標向量;將目標向量對應的上下文文本作為當前查詢問題的當前參考上下文。

    26、在本申請實施例中,從目標知識庫中提取出針對當前查詢問題的當前參考上下文包括:將當前查詢問題輸入至目標知識庫,以通過目標知識庫中的生成模型生成當前參考上下文。

    27、在本申請實施例中,根據當前查詢問題和當前參考上下文確定當前查詢問題的回復包括:在目標知識庫的數量為多個的情況下,確定從每個目標知識庫中提取的一個當前參考上下文與查詢問題之間的語義相似度;基于語義相似度降序排列所有當前參考上下文;將排列后的所有當前參考上下文和當前查詢問題輸入至大語言模型,以通過大語言模型輸出回復。

    28、在本申請實施例中,根據當前查詢問題和當前參考上下文確定當前查詢問題的回復包括:將語義相似度大于預設數值的當前參考上下文確定為目標參考上下文;將目標參考上下文和當前查詢問題輸入至大語言模型,以通過大語言模型輸出回復。

    29、本申請第三方面提供一種用于訓練知識庫選取模型的裝置,包括:

    30、存儲器,被配置成存儲指令;

    31、處理器,被配置成從存儲器調用指令以及在執行指令時能夠實現上述的用于訓練知識庫選取模型的方法或實現上述的用戶問題的處理方法。

    32、本申請第四方面提供一種機器可讀存儲介質,該機器可讀存儲介質上存儲有指令,該指令用于使得機器執行上述的用于訓練知識庫選取模型的方法或執行上述的用戶問題的處理方法。

    33、通過上述技術方案,能夠確定每個歷史查詢本文檔來自技高網...

    【技術保護點】

    1.一種用于訓練知識庫選取模型的方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的用于訓練知識庫選取模型的方法,其特征在于,所述根據所有的第一損失值確定所述知識庫選取模型的總損失值包括:

    3.根據權利要求2所述的用于訓練知識庫選取模型的方法,其特征在于,所述確定每個歷史查詢問題的參考上下文包括:

    4.根據權利要求3所述的用于訓練知識庫選取模型的方法,其特征在于,根據所有的第一損失值和第二損失值確定所述知識庫選取模型的總損失值包括根據公式(1)確定所述總損失值:

    5.根據權利要求1所述的用于訓練知識庫選取模型的方法,其特征在于,所述知識庫通過以下步驟訓練得到:

    6.根據權利要求1所述的用于訓練知識庫選取模型的方法,其特征在于,預處理所述多個歷史查詢問題中的每個歷史查詢問題包括:

    7.根據權利要求1所述的用于訓練知識庫選取模型的方法,其特征在于,所述方法還包括:

    8.一種用戶問題的處理方法,其特征在于,所述方法包括:

    9.根據權利要求8所述的用戶問題的處理方法,其特征在于,從所述目標知識庫中提取出針對所述當前查詢問題的當前參考上下文包括:

    10.根據權利要求8所述的用戶問題的處理方法,其特征在于,從所述目標知識庫中提取出針對所述當前查詢問題的當前參考上下文包括:

    11.根據權利要求8所述的用戶問題的處理方法,其特征在于,根據所述當前查詢問題和所述當前參考上下文確定所述當前查詢問題的回復包括:

    12.根據權利要求11所述的用戶問題的處理方法,其特征在于,根據所述當前查詢問題和所述當前參考上下文確定所述當前查詢問題的回復包括:

    13.一種用于訓練知識庫選取模型的裝置,其特征在于,包括:

    14.一種機器可讀存儲介質,其特征在于,該機器可讀存儲介質上存儲有指令,該指令用于使得機器執行根據權利要求1至7中任一項所述的用于訓練知識庫選取模型的方法或執行根據權利要求8至12中任一項所述的用戶問題的處理方法。

    ...

    【技術特征摘要】

    1.一種用于訓練知識庫選取模型的方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的用于訓練知識庫選取模型的方法,其特征在于,所述根據所有的第一損失值確定所述知識庫選取模型的總損失值包括:

    3.根據權利要求2所述的用于訓練知識庫選取模型的方法,其特征在于,所述確定每個歷史查詢問題的參考上下文包括:

    4.根據權利要求3所述的用于訓練知識庫選取模型的方法,其特征在于,根據所有的第一損失值和第二損失值確定所述知識庫選取模型的總損失值包括根據公式(1)確定所述總損失值:

    5.根據權利要求1所述的用于訓練知識庫選取模型的方法,其特征在于,所述知識庫通過以下步驟訓練得到:

    6.根據權利要求1所述的用于訓練知識庫選取模型的方法,其特征在于,預處理所述多個歷史查詢問題中的每個歷史查詢問題包括:

    7.根據權利要求1所述的用于訓練知識庫選取模型的方法,其特征在于,所述方法還包括:

    8.一種用戶問題的處理方法,...

    【專利技術屬性】
    技術研發人員:周志忠尹倩倩童興
    申請(專利權)人:中科云谷科技有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 国产成人无码A区在线观看导航| 午夜麻豆国产精品无码| 人妻少妇偷人精品无码| MM1313亚洲精品无码久久| 2014AV天堂无码一区| 亚洲av成本人无码网站| 色窝窝无码一区二区三区成人网站| 无码午夜人妻一区二区三区不卡视频| 久久久久无码精品国产不卡| 国产综合无码一区二区三区| 亚洲AV永久无码精品一福利| 亚洲爆乳无码一区二区三区| 亚洲AⅤ无码一区二区三区在线 | 一本大道无码av天堂| 少妇性饥渴无码A区免费| 精品久久久久久无码人妻| 精品国产一区二区三区无码| 中文字幕丰满乱子无码视频| 无码精品人妻一区| 波多野结衣VA无码中文字幕电影 | 人妻少妇AV无码一区二区| 亚洲AV无码成人精品区日韩| 亚洲av永久无码嘿嘿嘿| 亚洲∧v久久久无码精品 | 乱人伦中文无码视频在线观看| 中文字幕在线无码一区| 人妻无码久久久久久久久久久 | 无码人妻品一区二区三区精99| 久久国产三级无码一区二区| 亚洲AV无码乱码在线观看牲色| 蜜臀亚洲AV无码精品国产午夜.| 亚洲国产成人精品无码区二本| 亚洲乱亚洲乱妇无码| 亚洲午夜无码久久| 亚洲AV无码一区二区三区性色 | 亚洲精品一级无码中文字幕| 国产午夜鲁丝片AV无码| 成在线人免费无码高潮喷水| 伊人久久综合精品无码AV专区| 亚洲国产精品无码久久久不卡| 国产爆乳无码一区二区麻豆 |