System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現(xiàn)步驟摘要】
本專利技術涉及知識圖譜,具體涉及一種基于知識圖譜增強大語言模型的政府服務問答方法。
技術介紹
1、知識圖譜又稱為科學知識圖譜,在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發(fā)展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯(lián)系。
2、大語言模型(large?language?model,llm)是指使用大量文本數(shù)據(jù)訓練的深度學習模型,可以生成自然語言文本或理解語言文本的含義。llm可以處理多種自然語言任務,如文本分類、問答、對話等,是通向人工智能的一條重要途徑。
3、現(xiàn)有的llm無法與知識圖譜結合,進而無法更好的應用在政府服務場景中,亟需一種基于知識圖譜增強大語言模型的政府服務問答方法。
技術實現(xiàn)思路
1、本專利技術實施例的目的在于提供一種基于知識圖譜增強大語言模型的政府服務問答方法,用以解決現(xiàn)有技術中l(wèi)lm無法與知識圖譜結合,進而無法更好的應用在政府服務場景中的問題。
2、為實現(xiàn)上述目的,本專利技術實施例提供一種基于知識圖譜增強大語言模型的政府服務問答方法,所述方法具體包括:
3、獲取歷史問題,基于所述歷史問題構建政府服務知識圖譜;
4、提取所述歷史問題的答案,基于所述歷史問題和歷史問題對應的答案構建常見問題解答庫;
5、獲取原始政府服務文檔,通過不同的劃分方法對所述原始政府服務文檔進行邏輯劃分得到片段,將所述片段輸入大語言
6、獲取用戶問題,判斷所述用戶問題與常見問題解答庫中的歷史問題是否匹配;
7、若匹配,基于所述歷史問題的答案輸出問題答案;
8、若不匹配,將所述用戶問題與政府服務知識圖譜進行知識鏈接得到多個知識,將所述多個知識逐個輸入所述大語言模型進行向量化,得到知識向量;同時,將所述用戶問題輸入大語言模型進行向量化,得到完整問題向量;
9、基于所述知識向量與完整問題向量進行聯(lián)合搜索,得到候選文檔片段列表;
10、將所述候選文檔片段列表輸入所述大語言模型,生成問題答案。
11、在上述技術方案的基礎上,本專利技術還可以做如下改進:
12、進一步地,所述獲取歷史問題,基于所述歷史問題構建政府服務知識圖譜,包括:
13、構建業(yè)務知識體系,包括對政府服務的業(yè)務域進行分類,對政府服務的用戶對象進行細化,對政府服務的業(yè)務場景進行細化和對政府服務的業(yè)務流程進行細化。
14、進一步地,所述獲取歷史問題,基于所述歷史問題構建政府服務知識圖譜,包括:
15、提取所述歷史問題對應的業(yè)務標簽;
16、將復雜業(yè)務拆分為多個子業(yè)務,對所述子業(yè)務進行跨業(yè)務關聯(lián)。
17、進一步地,所述提取歷史問題的答案,基于所述歷史問題和歷史問題對應的答案構建常見問題解答庫,包括:
18、從所述歷史問題中提取關鍵問題,基于所述關鍵問題構建關鍵問題解答庫;
19、提取所述關鍵問題對應的答案,構建關鍵問題解答庫。
20、進一步地,所述提取所述歷史問題的答案,基于所述歷史問題和歷史問題對應的答案構建常見問題解答庫,還包括:
21、獲得所述關鍵問題的答案后,對所述答案進行校驗,判斷所述答案是否正確;
22、當所述答案正確時,確定所述歷史問題對應的答案;
23、當所述答案錯誤時,重新獲取所述關鍵問題對應的答案,并對所述答案進行校驗,直至所述答案正確。
24、進一步地,所述獲取用戶問題,判斷所述用戶問題與常見問題解答庫中的歷史問題是否匹配,還包括:
25、判斷所述用戶問題是否僅包含一個問題;
26、若所述用戶問題包含兩個及以上問題,對所述用戶問題進行拆分,得到多個子問題;
27、將所述子問題輸入大語言模型,得到所述子問題對應的業(yè)務類別;
28、若所述用戶問題僅包含一個問題,判斷所述用戶問題與常見問題解答庫中的歷史問題是否匹配。
29、進一步地,所述獲取用戶問題,判斷所述用戶問題與常見問題解答庫中的歷史問題是否匹配,包括:
30、根據(jù)所述用戶問題,執(zhí)行所述常見問題解答庫匹配;其中,所述執(zhí)行方式包括基于向量直接搜索、基于知識向量搜索和基于標簽匹配。
31、進一步地,所述獲取用戶問題,判斷所述用戶問題與常見問題解答庫中的歷史問題是否匹配,包括:
32、優(yōu)先執(zhí)行所述關鍵問題解答庫與用戶問題的匹配;
33、若所述關鍵問題解答庫與用戶問題無法匹配,執(zhí)行所述常見問題庫與用戶問題的匹配。
34、進一步地,所述基于知識向量與完整問題向量進行聯(lián)合搜索,得到候選文檔片段列表,包括:
35、當未檢索到所述候選文檔片段列表時,重新獲取所述用戶問題的補充問題,直至檢索到所述候選文檔片段列表。
36、進一步地,所述基于知識圖譜增強大語言模型的政府服務問答方法,還包括:
37、通過所述政府服務知識圖譜進行知識鏈接,基于所述知識鏈接的結果對問題答案進行驗真。
38、本專利技術實施例具有如下優(yōu)點:
39、本專利技術中基于知識圖譜增強大語言模型的政府服務問答方法,通過獲取歷史問題,基于歷史問題構建政府服務知識圖譜;提取歷史問題的答案,基于歷史問題和歷史問題對應的答案構建常見問題解答庫;獲取原始政府服務文檔,通過不同的劃分方法對原始政府服務文檔進行邏輯劃分得到片段,將片段輸入大語言模型進行向量化,得到片段向量;獲取用戶問題,判斷用戶問題與常見問題解答庫中的歷史問題是否匹配;若匹配,基于歷史問題的答案輸出問題答案;若不匹配,將用戶問題與政府服務知識圖譜進行知識鏈接得到多個知識,將多個知識逐個輸入大語言模型進行向量化,得到知識向量;同時,將用戶問題輸入大語言模型進行向量化,得到完整問題向量;基于知識向量與完整問題向量進行聯(lián)合搜索,得到候選文檔片段列表;將候選文檔片段列表輸入大語言模型,生成問題答案,解決了現(xiàn)有技術中大語言模型無法與知識圖譜結合,進而無法更好的應用在政府服務場景中的問題。
本文檔來自技高網(wǎng)...【技術保護點】
1.基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述獲取歷史問題,基于所述歷史問題構建政府服務知識圖譜,包括:
3.根據(jù)權利要求2所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述獲取歷史問題,基于所述歷史問題構建政府服務知識圖譜,包括:
4.根據(jù)權利要求1所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述提取歷史問題的答案,基于所述歷史問題和歷史問題對應的答案構建常見問題解答庫,包括:
5.根據(jù)權利要求4所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述提取歷史問題的答案,基于所述歷史問題和歷史問題對應的答案構建常見問題解答庫,還包括:
6.根據(jù)權利要求5所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述獲取用戶問題,判斷所述用戶問題與常見問題解答庫中的歷史問題是否匹配,還包括:
7.根據(jù)權利要求4所述基于知識圖譜增強大語言模型的政府服
8.根據(jù)權利要求7所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述獲取用戶問題,判斷所述用戶問題與常見問題解答庫中的歷史問題是否匹配,包括:
9.根據(jù)權利要求1所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述基于知識向量與完整問題向量進行聯(lián)合搜索,得到候選文檔片段列表,包括:
10.根據(jù)權利要求1所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述基于知識圖譜增強大語言模型的政府服務問答方法,還包括:
...【技術特征摘要】
1.基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述獲取歷史問題,基于所述歷史問題構建政府服務知識圖譜,包括:
3.根據(jù)權利要求2所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述獲取歷史問題,基于所述歷史問題構建政府服務知識圖譜,包括:
4.根據(jù)權利要求1所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述提取歷史問題的答案,基于所述歷史問題和歷史問題對應的答案構建常見問題解答庫,包括:
5.根據(jù)權利要求4所述基于知識圖譜增強大語言模型的政府服務問答方法,其特征在于,所述提取歷史問題的答案,基于所述歷史問題和歷史問題對應的答案構建常見問題解答庫,還包括:
6.根據(jù)權利要求5所述基于知識...
【專利技術屬性】
技術研發(fā)人員:胡芳槐,丁軍,
申請(專利權)人:海乂知信息科技南京有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。