System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及計算機,尤其涉及一種基于檢索增強生成的大語言模型與知識庫協(xié)作方法及裝置。
技術(shù)介紹
1、目前,基于llm(large?language?model,大語言模型)的通用型問答系統(tǒng)(如chatgpt,文心一言等產(chǎn)品)業(yè)呈現(xiàn)蓬勃發(fā)展的態(tài)勢。然而,通用型問答系統(tǒng)是通過大量在處理特定領(lǐng)域的問題時,常因缺乏足夠的領(lǐng)域知識而無法提供回答;其包含的知識源自其訓練數(shù)據(jù),所以無法反映最新的領(lǐng)域知識或信息;同時,對于特定領(lǐng)域下的問題,通用型問答系統(tǒng)往往容易給出錯誤答案,導致誤導用戶、引入風險。
技術(shù)實現(xiàn)思路
1、本專利技術(shù)旨在提供一種克服上述問題或者至少部分地解決上述問題的基于檢索增強生成的大語言模型與知識庫協(xié)作方法及裝置。
2、為達到上述目的,本專利技術(shù)的技術(shù)方案具體是這樣實現(xiàn)的:
3、本專利技術(shù)的一個方面提供了一種基于檢索增強生成的大語言模型與知識庫協(xié)作方法,包括:
4、獲取用戶提出的問題,將所述問題輸入基于大語言模型的通用型問答系統(tǒng),得到對所述問題的回答;
5、將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合;
6、將所述回答與所述語句集合合并為針對所述問題的最終回答。
7、可選地,所述將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,方法還包括:構(gòu)建所述知識庫。
8、可選地,所述構(gòu)建所述知識庫包括:
9
10、采用層級聚類方法對所述知識庫進行組織管理。
11、可選地,所述將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲包括:
12、將所述語句內(nèi)容轉(zhuǎn)化為句向量;
13、將每個所述句向量作為一個獨立的簇;
14、用簇內(nèi)所有句向量的均值作為該簇的特征,計算所有簇特征之間的余弦相似度,形成一個距離矩陣;
15、在所述距離矩陣中找到相似度最高的兩個簇;
16、將相似度最高的兩個簇合并成一個新的簇;
17、更新所有簇的特征;
18、返回執(zhí)行在所述距離矩陣中找到相似度最高的兩個簇,將相似度最高的兩個簇合并成一個新的簇,更新所有簇的特征的步驟,直至所有句向量合并成一個簇。
19、可選地,所述將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合包括:
20、對所述問題進行向量化處理,得到問題的向量表示;
21、計算所述問題與當前簇的左右兩個分支簇的余弦相似度;
22、將余弦相似度較高的分支簇作為所述當前簇;
23、重復執(zhí)行計算所述問題與當前簇的左右兩個分支簇的余弦相似度,將余弦相似度較高的分支簇作為所述當前簇的步驟,直至所述當前簇的語句容量滿足要求;
24、獲得所述當前簇中所有語句的集合。
25、本專利技術(shù)的另一個方面提供了一種基于檢索增強生成的大語言模型與知識庫協(xié)作裝置,包括:
26、回答模塊,用于獲取用戶提出的問題,將所述問題輸入基于大語言模型的通用型問答系統(tǒng),得到對所述問題的回答;
27、檢索模塊,用于將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合;
28、合并模塊,用于將所述回答與所述語句集合合并為針對所述問題的最終回答。
29、可選地,裝置還包括:構(gòu)建模塊,用于在所述檢索模塊將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,構(gòu)建所述知識庫。
30、可選地,所述構(gòu)建模塊通過如下方式構(gòu)建所述知識庫:
31、將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲;
32、采用層級聚類方法對所述知識庫進行組織管理。
33、可選地,所述構(gòu)建模塊通過如下方式將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲:
34、將所述語句內(nèi)容轉(zhuǎn)化為句向量;
35、將每個所述句向量作為一個獨立的簇;
36、用簇內(nèi)所有句向量的均值作為該簇的特征,計算所有簇特征之間的余弦相似度,形成一個距離矩陣;
37、在所述距離矩陣中找到相似度最高的兩個簇;
38、將相似度最高的兩個簇合并成一個新的簇;
39、更新所有簇的特征;
40、返回執(zhí)行在所述距離矩陣中找到相似度最高的兩個簇,將相似度最高的兩個簇合并成一個新的簇,更新所有簇的特征的步驟,直至所有句向量合并成一個簇。
41、可選地,所述檢索模塊通過如下方式將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合:
42、對所述問題進行向量化處理,得到問題的向量表示;
43、計算所述問題與當前簇的左右兩個分支簇的余弦相似度;
44、將余弦相似度較高的分支簇作為所述當前簇;
45、重復執(zhí)行計算所述問題與當前簇的左右兩個分支簇的余弦相似度,將余弦相似度較高的分支簇作為所述當前簇的步驟,直至所述當前簇的語句容量滿足要求;
46、獲得所述當前簇中所有語句的集合。
47、由此可見,通過本專利技術(shù)提供的基于檢索增強生成的大語言模型與知識庫協(xié)作方法及裝置,通過大語言模型與知識庫的協(xié)作,解決大語言模型知識不足和滯后的問題,降低合成錯誤答案的風險,提高答案的精確度和上下文相關(guān)性,并且適應特定領(lǐng)域獨有的表達方式。
本文檔來自技高網(wǎng)...【技術(shù)保護點】
1.一種基于檢索增強生成的大語言模型與知識庫協(xié)作方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,還包括:構(gòu)建所述知識庫。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述構(gòu)建所述知識庫包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合包括:
6.一種基于檢索增強生成的大語言模型與知識庫協(xié)作裝置,其特征在于,包括:
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括:構(gòu)建模塊,用于在所述檢索模塊將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,構(gòu)建所述知識庫。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述構(gòu)建模塊通過如下
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述構(gòu)建模塊通過如下方式將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲:
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述檢索模塊通過如下方式將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合:
...【技術(shù)特征摘要】
1.一種基于檢索增強生成的大語言模型與知識庫協(xié)作方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述問題進行向量化處理后,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合之前,還包括:構(gòu)建所述知識庫。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述構(gòu)建所述知識庫包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將文檔集合中的文檔以語句內(nèi)容、文檔內(nèi)順序、文檔索引的三元組形式進行向量化存儲包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述問題進行向量化處理,送入知識庫中進行檢索,得到所述知識庫中與所述問題相關(guān)的語句集合包括:
6.一種基于檢索增強生成的大語...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:王鐵強,劉興偉,王勛,蔡昊,劉宗奇,
申請(專利權(quán))人:北京市燃氣集團有限責任公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。