System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及自然語言處理,更具體的說,是涉及一種知識問答方法、裝置、設備及可讀存儲介質。
技術介紹
1、隨著互聯網的快速發展,人們獲取信息的方式越來越多樣化,但同時也面臨著信息過載的問題。因此,如何從海量信息中快速準確地獲取自己需要的知識成為了一個重要的問題。知識問答系統可以幫助用戶從海量信息中快速準確地獲取自己需要的知識。隨著大語言模型的發展,目前的知識問答系統多采用大語言模型外掛知識庫的方式實現。大語言模型外掛知識庫是指將一個大規模知識庫與大語言模型結合在一起。知識問答系統采用大語言模型+外掛知識庫的方式旨在利用大語言模型的語言理解和生成能力,以及大規模知識庫的豐富信息,使知識問答系統能夠更好地理解和回答與知識相關的問題。
2、但是,當知識文本較長時,采用大語言模型外掛知識庫的方式實現的知識問答系統,無法給出高質量的答案。
3、因此,如何提供一種知識問答方法,以提升知識問答的效果,成為本領域技術人員亟待解決的技術問題。
技術實現思路
1、鑒于上述問題,本申請提出了一種知識問答方法、裝置、設備及可讀存儲介質,以提升知識問答的效果。具體方案如下:
2、一種知識問答方法,所述方法包括:
3、獲取用戶輸入的問題文本,以及所述問題文本對應的摘要文本庫,所述摘要文本庫中包括所述問題文本所屬領域各知識文本對應的摘要文本,針對每個知識文本,所述知識文本對應的摘要文本為長度小于所述知識文本,語義信息與所述知識文本一致的文本;
4、從所述摘
5、基于所述目標摘要文本,調用答案生成模型,生成所述問題文本對應的最終答案,所述答案生成模型為通過訓練得到的具備文本總結能力的大語言模型。
6、可選地,所述摘要文本庫的構建方式,包括:
7、針對所述問題文本所屬領域的每個知識文本,基于所述知識文本,調用摘要文本生成模型,生成所述知識文本對應的摘要文本,所述摘要文本生成模型為通過訓練得到的具備生成摘要文本的能力的大語言模型;
8、將各個所述知識文本對應的摘要文本進行組合,構建得到所述摘要文本庫。
9、可選地,所述基于所述知識文本,調用摘要文本生成模型,生成所述知識文本對應的摘要文本,包括:
10、獲取預配置的摘要文本生成prompt格式模板,所述摘要文本生成prompt格式模板中包括摘要文本生成要求信息和知識文本槽;
11、將所述知識文本填充至所述摘要文本生成prompt格式模板中的所述知識文本槽中,得到摘要文本生成prompt;
12、將所述摘要文本生成prompt輸入摘要文本生成模型,得到所述摘要文本生成模型輸出的所述知識文本對應的摘要文本。
13、可選地,所述從所述摘要文本庫中確定目標摘要文本,包括:
14、對所述用戶輸入的問題文本進行同義擴寫,得到擴寫后的問題文本,所述擴寫后的問題文本的長度大于所述用戶輸入的問題文本的長度;
15、基于所述擴寫后的問題文本與所述摘要文本庫中各個摘要文本的相似度,確定所述目標摘要文本。
16、可選地,所述對所述用戶輸入的問題文本進行同義擴寫,得到擴寫后的問題文本,包括:
17、將所述用戶輸入的問題文本輸入第一文本擴寫模型,得到所述第一文本擴寫模型輸出的擴寫后的問題文本,所述第一文本擴寫模型是利用樣本問題文本為訓練樣本,以所述樣本問題文本對應的擴寫后的問題文本為樣本標簽訓練得到的神經網絡模型。
18、可選地,所述對所述用戶輸入的問題文本進行同義擴寫,得到擴寫后的問題文本,包括:
19、基于所述用戶輸入的問題文本,調用第二文本擴寫模型,生成所述擴寫后的問題文本,所述第二文本擴寫模型為通過訓練得到的具備文本擴寫能力的大語言模型。
20、可選地,所述基于所述用戶輸入的問題文本,調用第二文本擴寫模型,生成所述擴寫后的問題文本,包括:
21、獲取預配置的文本擴寫prompt格式模板,所述文本擴寫prompt格式模板中包括文本擴寫要求信息和問題文本槽;
22、將所述問題文本填充至所述文本擴寫prompt格式模板中的所述問題文本槽中,得到文本擴寫prompt;
23、將所述文本擴寫prompt輸入摘要第二文本擴寫模型,得到所述第二文本擴寫模型輸出的所述擴寫后的問題文本。
24、可選地,所述基于所述擴寫后的問題文本與所述摘要文本庫中各個摘要文本的相似度,確定目標摘要文本,包括:
25、針對所述摘要文本庫中的每個摘要文本,計算所述摘要文本與所述擴寫后的問題文本的第一相似度;
26、基于各個所述摘要文本與所述擴寫后的問題文本的第一相似度,確定候選摘要文本;
27、針對每個所述候選摘要文本,計算所述候選摘要文本與所述擴寫后的問題文本的第二相似度;
28、基于各個所述候選摘要文本與所述擴寫后的問題文本的第二相似度,確定所述目標摘要文本。
29、一種知識問答裝置,所述裝置包括:
30、獲取單元,用于獲取用戶輸入的問題文本,以及所述問題文本對應的摘要文本庫,所述摘要文本庫中包括所述問題文本所屬領域各知識文本對應的摘要文本,針對每個知識文本,所述知識文本對應的摘要文本為長度小于所述知識文本,語義信息與所述知識文本一致的文本;
31、目標摘要文本確定單元,用于從所述摘要文本庫中確定目標摘要文本,所述目標摘要文本為所述摘要文本庫中與所述問題文本相似度滿足預設條件的摘要文本;
32、最終答案生成單元,用于基于所述目標摘要文本,調用答案生成模型,生成所述問題文本對應的最終答案,所述答案生成模型為通過訓練得到的具備文本總結能力的大語言模型。
33、可選地,所述裝置還包括摘要文本庫構建單元,所述摘要文本庫構建單元,包括:
34、摘要文本生成單元,用于針對所述問題文本所屬領域的每個知識文本,基于所述知識文本,調用摘要文本生成模型,生成所述知識文本對應的摘要文本,所述摘要文本生成模型為通過訓練得到的具備生成摘要文本的能力的大語言模型;
35、摘要文本組合單元,用于將各個所述知識文本對應的摘要文本進行組合,構建得到所述摘要文本庫。
36、可選地,所述摘要文本生成單元,具體用于:
37、獲取預配置的摘要文本生成prompt格式模板,所述摘要文本生成prompt格式模板中包括摘要文本生成要求信息和知識文本槽;
38、將所述知識文本填充至所述摘要文本生成prompt格式模板中的所述知識文本槽中,得到摘要文本生成prompt;
39、將所述摘要文本生成prompt輸入摘要文本生成模型,得到所述摘要文本生成模型輸出的所述知識文本對應的摘要文本。
40、可選地,所述目標摘要文本本文檔來自技高網...
【技術保護點】
1.一種知識問答方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述摘要文本庫的構建方式,包括:
3.根據權利要求2所述的方法,其特征在于,所述基于所述知識文本,調用摘要文本生成模型,生成所述知識文本對應的摘要文本,包括:
4.根據權利要求1所述的方法,其特征在于,所述從所述摘要文本庫中確定目標摘要文本,包括:
5.根據權利要求4所述的方法,其特征在于,所述對所述用戶輸入的問題文本進行同義擴寫,得到擴寫后的問題文本,包括:
6.根據權利要求4所述的方法,其特征在于,所述對所述用戶輸入的問題文本進行同義擴寫,得到擴寫后的問題文本,包括:
7.根據權利要求6所述的方法,其特征在于,所述基于所述用戶輸入的問題文本,調用第二文本擴寫模型,生成所述擴寫后的問題文本,包括:
8.根據權利要求4所述的方法,其特征在于,所述基于所述擴寫后的問題文本與所述摘要文本庫中各個摘要文本的相似度,確定目標摘要文本,包括:
9.一種知識問答裝置,其特征在于,所述裝置包括:
11.一種可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時,實現如權利要求1至8中任一項所述的知識問答方法的各個步驟。
...【技術特征摘要】
1.一種知識問答方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述摘要文本庫的構建方式,包括:
3.根據權利要求2所述的方法,其特征在于,所述基于所述知識文本,調用摘要文本生成模型,生成所述知識文本對應的摘要文本,包括:
4.根據權利要求1所述的方法,其特征在于,所述從所述摘要文本庫中確定目標摘要文本,包括:
5.根據權利要求4所述的方法,其特征在于,所述對所述用戶輸入的問題文本進行同義擴寫,得到擴寫后的問題文本,包括:
6.根據權利要求4所述的方法,其特征在于,所述對所述用戶輸入的問題文本進行同義擴寫,得到擴...
【專利技術屬性】
技術研發人員:張宋誠,吳飛,方四安,柳林,徐承,
申請(專利權)人:合肥訊飛數碼科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。