System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及于人工智能,特別是涉及一種內容檢索方法、裝置、計算機設備、存儲介質和程序產品。
技術介紹
1、隨著大模型在各行業的廣泛應用,其在專業場景或行業細分領域面臨專業知識不足的問題。通用大模型的知識局限于訓練數據,主要來源于網絡公開數據,對于實時性、非公開或離線數據無法獲取。并且數據安全對企事業單位至關重要,將私域數據上傳第三方平臺進行訓練會帶來數據泄露風險,使得完全依賴通用大模型自身能力的應用方案在數據安全和效果方面難以平衡。
2、檢索增強生成技術成為解決上述問題的有效方案,但是,面對文本中的表格、圖片等不同形式的內容,目前技術難以有效地進行針對性處理和索引,以實現知識的全面關聯和準確檢索。
技術實現思路
1、基于此,有必要針對上述技術問題,提供一種能夠解決上述問題的內容檢索方法、裝置、計算機設備、存儲介質和程序產品。
2、第一方面,本申請提供了一種內容檢索方法,該方法包括:
3、獲取目標問題的關鍵詞;
4、根據關鍵詞在預先建立的知識庫進行檢索處理,得到目標檢索內容;知識庫是由文本、表格和圖片中的至少一種知識數據通過索引嵌套結構構建的;
5、根據目標檢索內容確定目標回復內容。
6、在其中一個實施例中,上述根據關鍵詞在預先建立的知識庫,得到目標檢索內容,包括:
7、根據關鍵詞在知識庫中進行初步檢索處理,得到初步檢索內容;初步檢索處理包括相似度檢索處理和全文檢索處理中的至少一種;
8、在
9、在其中一個實施例中,上述根據第一索引信息進行深度檢索處理,得到目標檢索內容,包括:
10、在深度檢索處理的每一輪迭代檢索過程中,基于第一索引信息和知識庫的索引嵌套結構進行檢索處理得到檢索結果;
11、在檢索結果表征存在第二索引信息的情況下,基于第二索引信息和知識庫的索引嵌套結構進行下一深度的檢索處理,直至檢索結束得到目標檢索內容。
12、在其中一個實施例中,上述方法還包括:
13、在每一輪迭代檢索過程中,獲取深度參數;
14、在迭代次數符合深度參數的情況下停止檢索,并根據停止檢索時檢索到的內容確定目標檢索內容。
15、在其中一個實施例中,上述知識庫的索引嵌套結構構建過程包括:
16、對預先獲取的知識數據進行數據結構分割處理,得到索引根目錄;
17、對知識數據進行內容分割處理,得到索引鍵值對;
18、對知識數據中的預設內容進行替換處理,得到替換內容;替換處理包括文字替換、表格替換和圖片替換中的至少一種;
19、基于索引嵌套算法,對索引根目錄、索引鍵值和替換內容進行嵌套處理,得到知識庫的索引嵌套結構。
20、在其中一個實施例中,上述根據目標檢索內容確定目標回復內容,包括:
21、對目標檢索內容進行語言風格調整處理,得到中間回復內容;
22、對中間回復內容進行內容簡化處理,得到目標回復內容。
23、第二方面,本申請還提供了一種內容檢索裝置。該裝置包括:
24、關鍵詞獲取模塊,用于獲取目標問題的關鍵詞;
25、檢索模塊,用于根據關鍵詞在預先建立的知識庫進行檢索處理,得到目標檢索內容;知識庫是由文本、表格和圖片中的至少一種知識數據通過索引嵌套結構構建的;
26、內容確定模塊,用于根據目標檢索內容確定目標回復內容。
27、第三方面,本申請還提供了一種計算機設備。該計算機設備包括存儲器和處理器,存儲器存儲有計算機程序,處理器執行計算機程序時實現以下步驟:
28、獲取目標問題的關鍵詞;
29、根據關鍵詞在預先建立的知識庫進行檢索處理,得到目標檢索內容;知識庫是由文本、表格和圖片中的至少一種知識數據通過索引嵌套結構構建的;
30、根據目標檢索內容確定目標回復內容。
31、第四方面,本申請還提供了一種計算機可讀存儲介質。該計算機可讀存儲介質,其上存儲有計算機程序,計算機程序被處理器執行時實現以下步驟:
32、獲取目標問題的關鍵詞;
33、根據關鍵詞在預先建立的知識庫進行檢索處理,得到目標檢索內容;知識庫是由文本、表格和圖片中的至少一種知識數據通過索引嵌套結構構建的;
34、根據目標檢索內容確定目標回復內容。
35、第五方面,本申請還提供了一種計算機程序產品。該計算機程序產品,包括計算機程序,該計算機程序被處理器執行時實現以下步驟:
36、獲取目標問題的關鍵詞;
37、根據關鍵詞在預先建立的知識庫進行檢索處理,得到目標檢索內容;知識庫是由文本、表格和圖片中的至少一種知識數據通過索引嵌套結構構建的;
38、根據目標檢索內容確定目標回復內容。
39、上述內容檢索方法、裝置、計算機設備、存儲介質和程序產品,本申請通過獲取目標問題的關鍵詞;根據關鍵詞在預先建立的由文本、表格和圖片中的至少一種知識數據通過索引嵌套結構構建的知識庫進行檢索處理,得到目標檢索內容;根據目標檢索內容確定目標回復內容。通過獲取目標問題的關鍵詞并在具有索引嵌套結構的知識庫中進行檢索,能夠快速準確地定位到與問題高度相關的目標檢索內容。這種方式避免了在大量無組織的數據中盲目搜索,極大地提高了問題解答的效率和準確性。
本文檔來自技高網...【技術保護點】
1.一種內容檢索方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述根據所述關鍵詞在預先建立的知識庫,得到目標檢索內容,包括:
3.根據權利要求2所述的方法,其特征在于,所述根據所述第一索引信息進行深度檢索處理,得到所述目標檢索內容,包括:
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
5.根據權利要求3所述的方法,其特征在于,所述知識庫的索引嵌套結構構建過程包括:
6.根據權利要求1所述的方法,其特征在于,所述根據所述目標檢索內容確定目標回復內容,包括:
7.一種內容檢索裝置,其特征在于,所述裝置包括:
8.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至6中任一項所述的方法的步驟。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至6中任一項所述的方法的步驟。
10.一種計算機程序產品,包括計算機程序
...【技術特征摘要】
1.一種內容檢索方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述根據所述關鍵詞在預先建立的知識庫,得到目標檢索內容,包括:
3.根據權利要求2所述的方法,其特征在于,所述根據所述第一索引信息進行深度檢索處理,得到所述目標檢索內容,包括:
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
5.根據權利要求3所述的方法,其特征在于,所述知識庫的索引嵌套結構構建過程包括:
6.根據權利要求1所述的方法,其特征在于,所述根據所述目標檢索內容確...
【專利技術屬性】
技術研發人員:童國煒,黃林軼,呂宏峰,
申請(專利權)人:中國電子產品可靠性與環境試驗研究所工業和信息化部電子第五研究所中國賽寶實驗室,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。