System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及計算機自然語言信息處理及人工智能,特別涉及基于rag技術的專家系統的構建方法。
技術介紹
1、當前,依賴于知識庫的專家系統尚未能完全模仿人類專家的廣泛常識和適應能力。它們無法從經驗中學習,與那些融合了機器學習技術的先進人工智能系統相比,它們嚴格受限于預設的編程規則和數據集。這些系統的知識領域往往較為狹窄,難以擴展到其他領域,隨著專家系統的規模不斷擴大,隨之而來的是輸出結果的準確性問題,錯誤率有所增加。在信息處理方面,大多數知識庫系統主要依賴于關鍵詞匹配或基于文檔鏈接的知識檢索方法,這導致了一些用戶體驗上的不足,如知識錄入和維護過程的復雜性,以及答案呈現時缺乏整合性和邏輯性。
2、rag(retrieval-augmented?generation)模型是一種結合了檢索(retrieval)和生成(generation)的人工智能技術。與傳統的基于知識庫的專家系統相比,rag模型可以從大量的文本數據中檢索信息,這使得它能夠訪問比傳統專家系統更廣泛的知識庫,rag模型在生成回答時,不僅依賴于預設的規則,還能夠理解和整合上下文信息,提供更加準確和連貫的答案。
3、因此,如何簡化知識庫的維護同時提供更友好、更邏輯化的答案呈現,從而生成更好的新一代專家系統成為本領域技術人員亟需解決的技術問題。
技術實現思路
1、有鑒于現有技術的上述缺陷,本專利技術提供基于rag技術的專家系統的構建方法,實現的目的是簡化知識庫的維護同時提供更友好、更邏輯化的答案呈現,從而
2、為實現上述目的,本專利技術公開了基于rag技術的專家系統的構建方法,包括如下步驟:
3、步驟1、知識庫構建;
4、步驟2、檢索系統構建;
5、步驟3、生成系統構建。
6、優選的,步驟1具體如下:
7、步驟1.1、數據準備,具體為:根據預期要生成的“領域專家”,挑選具有代表性的知識文檔形成所需要的數據;
8、步驟1.2、數據解析,具體為:從各種格式的所述所需要的數據中進行解析生成包括標題和內容”的結構化文本;
9、步驟1.3、數據分塊,具體為:對處理后的所述結構化文本進行分塊;
10、將所述結構化文本按照固定的最大長度進行分塊,并盡量使得同一個所述標題所對應的所述內容,均被劃分到相同的文本塊中;
11、步驟1.4、數據入庫,具體為:采用語義向量模型對分塊后的所述結構化文本進行向量化的表示;
12、對于同一個“領域專家”對應的知識庫,把相應的向量化的所述文本塊,存放在同一個“集合”中。
13、更優選的,在步驟1.1中,所述知識文檔是多樣化的。
14、更優選的,在步驟1.4中,將每一所述文本塊的向量表示和對應的文本數據存儲為索引。
15、優選的,步驟2具體如下:
16、步驟2.1、問題理解,具體為:對用戶提問的意圖進行理解,并根據上下文信息對用戶的問題進行改寫,并對改寫后的問題進行向量化的表示;
17、步驟2.2、內容查詢,具體為:根據所述用戶問題的向量化的數值,從所述知識庫中檢索出與所述用戶問題最相關的文本塊的數值向量,并根據索引得到對應的所述文本塊;
18、步驟2.3、相關度排序,具體為:采用重排模型對查詢得到的所述文本塊的文本數據,與所述用戶問題進行相關度排序,得到最有價值的所述文本塊;
19、步驟2.4、返回文本塊,具體為:根據預先設置好的閾值,返回大于所述閾值的所有所述文本塊,或者設置topk,根據相關度的排序,返回前k個數據。
20、優選的,步驟3具體如下:
21、步驟3.1、構建提示模板,具體為:根據專家系統的設計需求,進行提示模板的創建;
22、所述提示模板用于給定的場景下,引導大語言模型根據檢索得到的文本塊,生成滿足用戶查詢意圖的內容;
23、步驟3.2、文本生成,具體為:根據所述提示模板的內容構成,把查詢得到的所述文本塊,按照順序填充進所述提示模板,并通過設定好大語言模型扮演的角色,引導大語言模型根據模板內容進行文本生成;
24、步驟3.3、結果展示,具體為:根據專家系統的設計需求,構建前端頁面;
25、所述前端頁面支持用戶與大語言模型進行互動,用戶可以根據自己的需求,選擇不同類型的專家進行提問。
26、本專利技術的有益效果:
27、本專利技術的應用能夠簡化知識庫的維護同時提供更友好、更邏輯化的答案呈現,從而生成更好的新一代專家系統。
28、以下將結合附圖對本專利技術的構思、具體結構及產生的技術效果作進一步說明,以充分地了解本專利技術的目的、特征和效果。
本文檔來自技高網...【技術保護點】
1.基于RAG技術的專家系統的構建方法;其特征在于,包括如下步驟:
2.根據權利要求1所述的基于RAG技術的專家系統的構建方法,其特征在于,步驟1具體如下:
3.根據權利要求2所述的基于RAG技術的專家系統的構建方法,其特征在于,在步驟1.1中,所述知識文檔是多樣化的。
4.根據權利要求2所述的基于RAG技術的專家系統的構建方法,其特征在于,在步驟1.4中,將每一所述文本塊的向量表示和對應的文本數據存儲為索引。
5.根據權利要求1所述的基于RAG技術的專家系統的構建方法,其特征在于,步驟2具體如下:
6.根據權利要求1所述的基于RAG技術的專家系統的構建方法,其特征在于,步驟3具體如下:
【技術特征摘要】
1.基于rag技術的專家系統的構建方法;其特征在于,包括如下步驟:
2.根據權利要求1所述的基于rag技術的專家系統的構建方法,其特征在于,步驟1具體如下:
3.根據權利要求2所述的基于rag技術的專家系統的構建方法,其特征在于,在步驟1.1中,所述知識文檔是多樣化的。
4.根據權利要求2所...
【專利技術屬性】
技術研發人員:李永超,武曉東,葉軍,方浩,羅紅,吳愉帆,呂嘉文,
申請(專利權)人:上海電力設計院有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。