System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及自然語言處理,特別涉及基于graphrag的大模型問答方法、系統、設備、介質及產品。
技術介紹
1、在信息爆炸的時代,人們越來越依賴于智能問答系統來快速獲取準確的信息。智能問答系統不僅改變了人們獲取信息的方式,也極大地提高了信息處理的效率。而在這個系統中,大模型無疑扮演著核心的角色。大模型以其強大的數據處理能力和深度學習能力,為智能問答系統提供了強大的支撐,使得知識庫的快速構建與查詢成為可能。但現有的問答系統存在明顯缺陷:
2、在回答復雜問題時,現有的問答系統無法覆蓋更多相關的知識點和信息源,無法提供更全面的答案;
3、對于需要多步驟推理或多文檔信息整合的復雜查詢,現有的問答系統準確性較低;
4、在處理大規模數據集時,現有的問答系統算力資源需求較高;
5、在處理跨領域、跨數據集的復雜語義問題推理時,現有的問答系統無法實現跨領域整合和推理;
6、現有的問答系統的答案較單一,且無法將答案按高相關性和高質量提供,使得高相關性和高質量的答案不容易被用戶發現和使用。
技術實現思路
1、為了實現本專利技術的上述目的和其他優點,本專利技術的第一目的是提供一種基于graphrag的大模型問答方法,包括以下步驟:
2、確定可用數據源,并對數據進行預處理;
3、對預處理后的數據進行知識抽取、知識融合、知識計算,以構建知識圖譜;
4、通過graphrag的大語言模型從用戶查詢中提取關鍵實體;
...【技術保護點】
1.一種基于GraphRAG的大模型問答方法,其特征在于,包括以下步驟:
2.如權利要求1所述的一種基于GraphRAG的大模型問答方法,其特征在于,所述確定可用數據源步驟包括:
3.如權利要求2所述的一種基于GraphRAG的大模型問答方法,其特征在于:所述可用數據源包括結構化數據庫、半結構化數據、非結構化文本。
4.如權利要求1所述的一種基于GraphRAG的大模型問答方法,其特征在于,所述對數據進行預處理步驟包括:
5.如權利要求1所述的一種基于GraphRAG的大模型問答方法,其特征在于:所述對預處理后的數據進行知識抽取步驟包括:
6.如權利要求5所述的一種基于GraphRAG的大模型問答方法,其特征在于,所述利用命名實體識別技術與關系抽取技術從文本數據中抽取實體步驟包括:
7.如權利要求5所述的一種基于GraphRAG的大模型問答方法,其特征在于,利用命名實體識別技術與關系抽取技術從文本數據中抽取關系步驟包括:
8.如權利要求1所述的一種基于GraphRAG的大模型問答方法,其特征在于,
9.如權利要求1所述的一種基于GraphRAG的大模型問答方法,其特征在于,所述通過GraphRAG的大語言模型從用戶查詢中提取關鍵實體步驟包括:
10.如權利要求9所述的一種基于GraphRAG的大模型問答方法,其特征在于,所述根據提取的關鍵實體檢索所述知識圖譜中的相關子圖步驟包括:
11.如權利要求10所述的一種基于GraphRAG的大模型問答方法,其特征在于,所述將所述上下文信息送入所述GraphRAG的大語言模型進行生成式回答步驟還包括:
12.一種基于GraphRAG的大模型問答系統,應用如權利要求1~11任一項所述的方法,其特征在于:包括數據預處理模塊、知識圖譜構建模塊、實體提取模塊、子圖檢索模塊、答案生成模塊;其中,
13.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1~11任一項所述方法的步驟。
14.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1~11任一項所述方法的步驟。
15.一種計算機程序產品,其特征在于,所述計算機程序產品包括計算機程序,所述計算機程序被處理器執行時實現如權利要求1~11任一項所述方法的步驟。
...【技術特征摘要】
1.一種基于graphrag的大模型問答方法,其特征在于,包括以下步驟:
2.如權利要求1所述的一種基于graphrag的大模型問答方法,其特征在于,所述確定可用數據源步驟包括:
3.如權利要求2所述的一種基于graphrag的大模型問答方法,其特征在于:所述可用數據源包括結構化數據庫、半結構化數據、非結構化文本。
4.如權利要求1所述的一種基于graphrag的大模型問答方法,其特征在于,所述對數據進行預處理步驟包括:
5.如權利要求1所述的一種基于graphrag的大模型問答方法,其特征在于:所述對預處理后的數據進行知識抽取步驟包括:
6.如權利要求5所述的一種基于graphrag的大模型問答方法,其特征在于,所述利用命名實體識別技術與關系抽取技術從文本數據中抽取實體步驟包括:
7.如權利要求5所述的一種基于graphrag的大模型問答方法,其特征在于,利用命名實體識別技術與關系抽取技術從文本數據中抽取關系步驟包括:
8.如權利要求1所述的一種基于graphrag的大模型問答方法,其特征在于,對預處理后的數據進行知識融合步驟包括:
9.如權利要求1所述的一種基于graphrag的大模型問答方法...
【專利技術屬性】
技術研發人員:姚康,張賀童,董婷,付威威,鄭天佑,丁上上,董月芳,鄭田莉,程泉博,任志杰,
申請(專利權)人:中國科學院蘇州生物醫學工程技術研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。