System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及計算機,尤其涉及一種對大模型幻覺的優化方法、裝置、設備及介質。
技術介紹
1、近年來,隨著深度學習技術的不斷進步和計算資源的顯著提升,大模型技術在自然語言處理領域取得了前所未有的突破。這些模型通過學習海量的數據集,不僅能夠理解復雜的語義結構,還能生成高質量的文本內容,極大地推動了機器翻譯、情感分析、對話系統等應用的發展。然而,隨著模型規模的不斷擴大,一個被稱為“幻覺問題”的現象逐漸顯現,成為制約大模型進一步發展的關鍵障礙。所謂“幻覺”,是指模型在生成或回答問題時,可能會產生與事實不符的信息,或是編造不存在的事實,這不僅影響了模型輸出的準確性和可靠性,也對用戶的信任造成了負面影響。此外,由于大模型內部機制的復雜性,此類錯誤往往難以預測和控制,給模型的應用帶來了不確定性。因此,解決大模型的幻覺問題,提高其輸出的可信度和穩定性,已成為當前研究的一個重要方向。
2、需要說明的是,在上述
技術介紹
部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
技術實現思路
1、本公開提供一種對大模型幻覺的優化方法、裝置、設備及介質,至少在一定程度上糾正大模型的幻覺問題。
2、本公開的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本公開的實踐而習得。
3、根據本公開的一個方面,提供了一種對大模型幻覺的優化方法,包括:
4、獲取查詢文本,查詢文本記載了待處理的提問內容;
5、
6、對查詢文本進行信息抽取,得到查詢文本樹;
7、基于查詢文本樹和第一上下文候選集,評估第一上下文候選集中知識的可見度,其中,每條知識的可見度用于表示第一上下文候選集中每條知識與查詢文本的相關程度;
8、基于第一上下文候選集中知識的可見度,對第一上下文候選集中知識重新排序,得到目標上下文候選集;
9、將目標上下文候選集和查詢文本輸入大模型進行推理,得到查詢文本的答復文本。
10、在本公開的一個實施例中,基于查詢文本在知識向量數據庫中進行查詢,得到外部知識第一上下文候選集之后,方法還包括:
11、計算第一上下文候選集中每條知識與查詢文本之間的相似度值;
12、基于相似度值,對第一上下文候選集中知識重新排序,得到第二上下文候選集;
13、基于第一上下文候選集中知識的可見度,對第一上下文候選集中知識重新排序,得到目標上下文候選集,包括:基于第二上下文候選集中知識的可見度,對第二上下文候選集中知識重新排序,得到目標上下文候選集。
14、在本公開的一個實施例中,基于查詢文本樹和第一上下文候選集,評估第一上下文候選集中知識的可見度,包括:
15、將查詢文本樹和第一上下文候選集中每條知識,輸入至深度學習模型評估查詢文本樹和每條知識之間的相關性,得到相關性得分;
16、基于相關性得分,確定第一上下文候選集中知識的可見度。
17、在本公開的一個實施例中,基于第二上下文候選集中知識的可見度,對第二上下文候選集中知識重新排序,得到目標上下文候選集,包括:
18、將查詢文本轉換成向量形式,得到查詢向量;
19、將查詢向量、可見度、第二上下文候選集中的鍵向量和值向量,輸入至自注意力機制模型,到目標上下文候選集;
20、其中,自注意力機制模型在計算每個頭的輸出時,將可見度作為懲罰因子加入計算。
21、在本公開的一個實施例中,基于查詢文本在知識向量數據庫中進行查詢,得到外部知識第一上下文候選集,包括:
22、將查詢文本轉換成向量形式,得到查詢向量;
23、基于查詢向量對知識向量數據庫中的結構向量進行索引召回,得到外部知識第一上下文候選集。
24、在本公開的一個實施例中,基于查詢向量對知識向量數據庫中的結構向量進行索引召回,得到外部知識第一上下文候選集之前,包括:
25、基于與司法領域相關的原始文本數據,構建法律本體,法律本體為結構化的法律知識;
26、將法律本體中的法律知識,轉換成結構向量,并存入知識向量數據庫。
27、在本公開的一個實施例中,與司法領域相關的原始文本數據,包括多源異構數據。
28、根據本公開的另一個方面,提供一種對大模型幻覺的優化裝置,包括:
29、查詢獲取模塊,用于獲取查詢文本,查詢文本記載了待處理的提問內容;
30、知識查詢模塊,用于基于查詢文本在知識向量數據庫中進行查詢,得到外部知識第一上下文候選集;
31、信息抽取模塊,用于對查詢文本進行信息抽取,得到查詢文本樹;
32、可見度評估模塊,用于基于查詢文本樹和第一上下文候選集,評估第一上下文候選集中知識的可見度,其中,每條知識的可見度用于表示第一上下文候選集中每條知識與查詢文本的相關程度;
33、第一重排模塊,用于基于第一上下文候選集中知識的可見度,對第一上下文候選集中知識重新排序,得到目標上下文候選集;
34、模型推理模塊,用于將目標上下文候選集和查詢文本輸入大模型進行推理,得到查詢文本的答復文本。
35、根據本公開的又一個方面,提供一種電子設備,包括:存儲器,用于存儲指令;處理器,用于調用所述存儲器中存儲的指令,實現上述的對大模型幻覺的優化方法。
36、根據本公開的又一個方面,提供一種計算機可讀存儲介質,其上存儲有計算機指令,所述計算機指令被處理器執行時實現上述的對大模型幻覺的優化方法。
37、根據本公開的又一個方面,提供一種計算機程序產品,計算機程序產品存儲有指令,所述指令在由計算機執行時,使得計算機實施上述的對大模型幻覺的優化方法。
38、根據本公開的又一個方面,提供一種芯片,包括至少一個處理器和接口;
39、接口,用于為至少一個處理器提供程序指令或者數據;
40、至少一個處理器用于執行程序指令,以實現上述的對大模型幻覺的優化方法。
41、本公開實施例所提供的對大模型幻覺的優化方法、裝置、設備及介質,基于知識的可見度對第一上下文候選集中的知識進行重新排序,形成目標上下文候選集。這一機制不僅能夠篩選出最相關的信息,還能夠排除掉那些可能引起誤導或不準確答案的知識點,有效減少了幻覺問題的發生概率。最終,將經過優化的目標上下文候選集連同原始查詢文本一起輸入大模型,可以使得模型在生成回復時有更加準確和全面的依據,提升了回復的質量。
42、應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本公開。
本文檔來自技高網...【技術保護點】
1.一種對大模型幻覺的優化方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述基于所述查詢文本在知識向量數據庫中進行查詢,得到外部知識第一上下文候選集之后,所述方法還包括:
3.根據權利要求1所述的方法,其特征在于,所述基于所述查詢文本樹和所述第一上下文候選集,評估所述第一上下文候選集中知識的可見度,包括:
4.根據權利要求2所述的方法,其特征在于,所述基于所述第二上下文候選集中知識的可見度,對所述第二上下文候選集中知識重新排序,得到目標上下文候選集,包括:
5.根據權利要求1所述的方法,其特征在于,所述基于所述查詢文本在知識向量數據庫中進行查詢,得到外部知識第一上下文候選集,包括:
6.根據權利要求5所述的方法,其特征在于,所述基于所述查詢向量對所述知識向量數據庫中的結構向量進行索引召回,得到外部知識第一上下文候選集之前,包括:
7.根據權利要求6所述的方法,其特征在于,所述與司法領域相關的原始文本數據,包括多源異構數據。
8.一種對大模型幻覺的優化裝置,其特征在于,包括:<
...【技術特征摘要】
1.一種對大模型幻覺的優化方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述基于所述查詢文本在知識向量數據庫中進行查詢,得到外部知識第一上下文候選集之后,所述方法還包括:
3.根據權利要求1所述的方法,其特征在于,所述基于所述查詢文本樹和所述第一上下文候選集,評估所述第一上下文候選集中知識的可見度,包括:
4.根據權利要求2所述的方法,其特征在于,所述基于所述第二上下文候選集中知識的可見度,對所述第二上下文候選集中知識重新排序,得到目標上下文候選集,包括:
5.根據權利要求1所述的方法,其特征在于,所述基于所述查詢文本在知識向量...
【專利技術屬性】
技術研發人員:石麗娟,
申請(專利權)人:中國電信股份有限公司技術創新中心,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。