System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 亚洲av无码片在线播放,永久免费AV无码网站在线观看,亚洲av永久无码嘿嘿嘿
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于檢索增強生成的大語言模型與知識庫協(xié)作方法及裝置制造方法及圖紙

    技術(shù)編號:44226064 閱讀:5 留言:0更新日期:2025-02-11 13:31
    本發(fā)明專利技術(shù)提供了一種基于檢索增強生成的大語言模型與知識庫協(xié)作方法及裝置,其中方法包括:獲取用戶提出的問題,將所述問題輸入基于大語言模型的通用型問答系統(tǒng),得到對所述問題的回答;將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合;將所述回答與所述語句集合合并為針對所述問題的最終回答。通過大語言模型與知識庫的協(xié)作,解決大語言模型知識不足和滯后的問題,降低合成錯誤答案的風險,提高答案的精確度和上下文相關(guān)性,并且適應特定領(lǐng)域獨有的表達方式。

    【技術(shù)實現(xiàn)步驟摘要】

    本專利技術(shù)涉及計算機,尤其涉及一種基于檢索增強生成的大語言模型與知識庫協(xié)作方法及裝置


    技術(shù)介紹

    1、目前,基于llm(large?language?model,大語言模型)的通用型問答系統(tǒng)(如chatgpt,文心一言等產(chǎn)品)業(yè)呈現(xiàn)蓬勃發(fā)展的態(tài)勢。然而,通用型問答系統(tǒng)是通過大量在處理特定領(lǐng)域的問題時,常因缺乏足夠的領(lǐng)域知識而無法提供回答;其包含的知識源自其訓練數(shù)據(jù),所以無法反映最新的領(lǐng)域知識或信息;同時,對于特定領(lǐng)域下的問題,通用型問答系統(tǒng)往往容易給出錯誤答案,導致誤導用戶、引入風險。


    技術(shù)實現(xiàn)思路

    1、本專利技術(shù)旨在提供一種克服上述問題或者至少部分地解決上述問題的基于檢索增強生成的大語言模型與知識庫協(xié)作方法及裝置。

    2、為達到上述目的,本專利技術(shù)的技術(shù)方案具體是這樣實現(xiàn)的:

    3、本專利技術(shù)的一個方面提供了一種基于檢索增強生成的大語言模型與知識庫協(xié)作方法,包括:

    4、獲取用戶提出的問題,將所述問題輸入基于大語言模型的通用型問答系統(tǒng),得到對所述問題的回答;

    5、將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合;

    6、將所述回答與所述語句集合合并為針對所述問題的最終回答。

    7、可選地,所述將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,方法還包括:構(gòu)建所述知識庫。

    8、可選地,所述構(gòu)建所述知識庫包括:

    9、將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲;

    10、采用層級聚類方法對所述知識庫進行組織管理。

    11、可選地,所述將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲包括:

    12、將所述語句內(nèi)容轉(zhuǎn)化為句向量;

    13、將每個所述句向量作為一個獨立的簇;

    14、用簇內(nèi)所有句向量的均值作為該簇的特征,計算所有簇特征之間的余弦相似度,形成一個距離矩陣;

    15、在所述距離矩陣中找到相似度最高的兩個簇;

    16、將相似度最高的兩個簇合并成一個新的簇;

    17、更新所有簇的特征;

    18、返回執(zhí)行在所述距離矩陣中找到相似度最高的兩個簇,將相似度最高的兩個簇合并成一個新的簇,更新所有簇的特征的步驟,直至所有句向量合并成一個簇。

    19、可選地,所述將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合包括:

    20、對所述問題進行向量化處理,得到問題的向量表示;

    21、計算所述問題與當前簇的左右兩個分支簇的余弦相似度;

    22、將余弦相似度較高的分支簇作為所述當前簇;

    23、重復執(zhí)行計算所述問題與當前簇的左右兩個分支簇的余弦相似度,將余弦相似度較高的分支簇作為所述當前簇的步驟,直至所述當前簇的語句容量滿足要求;

    24、獲得所述當前簇中所有語句的集合。

    25、本專利技術(shù)的另一個方面提供了一種基于檢索增強生成的大語言模型與知識庫協(xié)作裝置,包括:

    26、回答模塊,用于獲取用戶提出的問題,將所述問題輸入基于大語言模型的通用型問答系統(tǒng),得到對所述問題的回答;

    27、檢索模塊,用于將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合;

    28、合并模塊,用于將所述回答與所述語句集合合并為針對所述問題的最終回答。

    29、可選地,裝置還包括:構(gòu)建模塊,用于在所述檢索模塊將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,構(gòu)建所述知識庫。

    30、可選地,所述構(gòu)建模塊通過如下方式構(gòu)建所述知識庫:

    31、將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲;

    32、采用層級聚類方法對所述知識庫進行組織管理。

    33、可選地,所述構(gòu)建模塊通過如下方式將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲:

    34、將所述語句內(nèi)容轉(zhuǎn)化為句向量;

    35、將每個所述句向量作為一個獨立的簇;

    36、用簇內(nèi)所有句向量的均值作為該簇的特征,計算所有簇特征之間的余弦相似度,形成一個距離矩陣;

    37、在所述距離矩陣中找到相似度最高的兩個簇;

    38、將相似度最高的兩個簇合并成一個新的簇;

    39、更新所有簇的特征;

    40、返回執(zhí)行在所述距離矩陣中找到相似度最高的兩個簇,將相似度最高的兩個簇合并成一個新的簇,更新所有簇的特征的步驟,直至所有句向量合并成一個簇。

    41、可選地,所述檢索模塊通過如下方式將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合:

    42、對所述問題進行向量化處理,得到問題的向量表示;

    43、計算所述問題與當前簇的左右兩個分支簇的余弦相似度;

    44、將余弦相似度較高的分支簇作為所述當前簇;

    45、重復執(zhí)行計算所述問題與當前簇的左右兩個分支簇的余弦相似度,將余弦相似度較高的分支簇作為所述當前簇的步驟,直至所述當前簇的語句容量滿足要求;

    46、獲得所述當前簇中所有語句的集合。

    47、由此可見,通過本專利技術(shù)提供的基于檢索增強生成的大語言模型與知識庫協(xié)作方法及裝置,通過大語言模型與知識庫的協(xié)作,解決大語言模型知識不足和滯后的問題,降低合成錯誤答案的風險,提高答案的精確度和上下文相關(guān)性,并且適應特定領(lǐng)域獨有的表達方式。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護點】

    1.一種基于檢索增強生成的大語言模型與知識庫協(xié)作方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,還包括:構(gòu)建所述知識庫。

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述構(gòu)建所述知識庫包括:

    4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合包括:

    6.一種基于檢索增強生成的大語言模型與知識庫協(xié)作裝置,其特征在于,包括:

    7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括:構(gòu)建模塊,用于在所述檢索模塊將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,構(gòu)建所述知識庫。

    8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述構(gòu)建模塊通過如下方式構(gòu)建所述知識庫:

    9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述構(gòu)建模塊通過如下方式將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲:

    10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述檢索模塊通過如下方式將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合:

    ...

    【技術(shù)特征摘要】

    1.一種基于檢索增強生成的大語言模型與知識庫協(xié)作方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,還包括:構(gòu)建所述知識庫。

    3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述構(gòu)建所述知識庫包括:

    4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲包括:

    5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合包括:

    6.一種基于檢索增強生成的大語...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:王鐵強,劉興偉,王勛,蔡昊劉宗奇,
    申請(專利權(quán))人:北京市燃氣集團有限責任公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码欧精品亚洲日韩一区夜夜嗨 | 亚洲中文字幕无码永久在线| 亚洲日韩国产AV无码无码精品| 久久久久亚洲AV无码专区体验| 亚洲AV成人无码久久WWW| 国产成人精品无码一区二区三区| 91精品久久久久久无码| 成在人线av无码免费高潮喷水| 亚洲欧洲无码一区二区三区| 亚洲av永久无码精品国产精品| 国产人成无码视频在线观看| 亚洲a∨无码男人的天堂| 亚洲AV中文无码乱人伦下载| 亚洲精品无码99在线观看| 精品无码人妻一区二区三区18| 亚洲国产av高清无码| 亚洲中文久久精品无码ww16| 无码不卡亚洲成?人片| 亚洲国产精品无码久久久秋霞1| 日韩精品无码一本二本三本| 国产成年无码久久久久毛片| 中文字幕无码av激情不卡 | 精品人妻无码专区在中文字幕| 无码任你躁久久久久久老妇App | 中文无码制服丝袜人妻av| 日韩精品无码永久免费网站| 蕾丝av无码专区在线观看| 永久免费无码网站在线观看| 精品无码久久久久久久久| 成在人线AV无码免费| 内射无码午夜多人| 亚洲AV无码不卡在线观看下载| 国产乱子伦精品免费无码专区| 无码AⅤ精品一区二区三区| 永久免费无码日韩视频| 久久久久成人精品无码| 亚洲级αV无码毛片久久精品| 午夜福利无码不卡在线观看| 无码人妻精品一区二区三区99仓本| 久久人妻av无码中文专区| 熟妇人妻无码中文字幕|