System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及人工智能,尤其涉及用于減少忠實性幻覺問題的生成模型架構系統及其構建方法。
技術介紹
1、在編程語言中,token通常指的是源代碼中的一個單獨的、有意義的單元。它可以是關鍵字、標識符、運算符、分隔符、字符串字面量等等。在編譯器和解釋器中,token常常用于詞法分析、語法分析和程序解析等方面。在身份認證中,token通常是指服務器端生成的一串字符串,用作客戶端進行請求的一個令牌。當用戶第一次登錄后,服務器生成一個token并將其返回給客戶端,以后客戶端只需帶上這個token前來請求數據即可,無需再次帶上用戶名和密碼。這樣做的目的是為了減輕服務器的壓力,減少頻繁的查詢數據庫,使服務器更加健壯。
2、現有模型構建中,忠實性幻覺是一個常見問題,模型生成的內容可能與用戶的指令或上下文不一致。這通常是由于模型在處理長序列時,對不同位置的token注意力不足,導致對上下文的理解不準確。為此本申請通過改進的自注意力機制、上下文感知機制和源上下文強化技術,能夠有效解決大模型在生成內容時的忠實性幻覺問題,提高生成內容的質量和可靠性。
技術實現思路
1、本申請實施例通過提供用于減少忠實性幻覺問題的生成模型架構系統及其構建方法,通過改進的自注意力機制、上下文感知機制和源上下文強化技術,能夠有效解決大模型在生成內容時的忠實性幻覺問題,提高生成內容的質量和可靠性。
2、本申請實施例提供了用于減少忠實性幻覺問題的生成模型架構系統,包括數據信息輸入單元,將模態數據信息輸入,所輸
3、信息預處理單元,將輸入的模態數據信息按照目標信息進行清洗和標準化處理,之后將信息特征進行量化、排序編碼后,獲得預處理后的數據特征信息;
4、模型構建單元,依據預處理后的數據特征信息構建初始模型;
5、模型訓練單元,對構建的初始模型進行訓練,使其按照目標信息多次進行模型訓練;
6、信息處理單元,利用訓練模型將數據特征信息再次進行解碼排序、數值量化,獲得與目標信息相似或相近的數據特征進行輸出;
7、輸出單元,利用語音合成技術將獲得的數據特征信息讀出;
8、評價單元,根據輸出的數據信息,判斷訓練模型所生成的數據信息與目標信息特征的差異。
9、進一步的還包括信息調控分配單元,將模態數據信息的上下文數據序列進行區分,對數據特征信息著重進行分析調控,以保證初始模型構建的準確性;
10、信息監測單元,對模型訓練過程中的數據信息特征實時進行監測,與目標信息進行多次比較,以便及時對數據信息特征的錯誤就是進行修正;
11、信息調整單元,依據監測到的數據信息特征的錯誤結合上下文數據序列,對構建模型進行修改。
12、進一步的信息預處理單元包括文本信息處理、語言信息處理;
13、文本信息處理將模態數據信息中的文本信息進行分析提取,生成文字記錄,提取文字特征并轉成數據序列;
14、語言信息處理將模態數據信息中的語音信息進行分析提取,利用語音識別技術獲得語音信息中的文字信息,提取語音特征并轉成數據序列。
15、進一步的信息調控分配單元包括信息對比、信息調控;
16、信息對比將模態數據信息與目標信息進行對比,同時將上下數據序列全面進行分析;
17、信息調控依據對上下數據序列全面的分析,能夠識別用戶輸入指令的細微差別,并據此調整模型的生成行為,以生成與用戶指令和上下文更加一致的內容。
18、用于減少忠實性幻覺問題的生成模型架構的構建方法,具體包括以下過程:
19、(1)將模態數據信息,例如文本、語言、圖像等數據信息輸入架構系統;
20、(2)對輸入的數據信息進行清洗和標準化處理,將上下文的數據區分后進行調整,之后每個特征進行數值量化、排序編碼后,獲得預處理后的信息;
21、(3)將預處理后的信息構建初始模型;
22、(4)對構建的初始模型進行訓練,模型訓練過程中對數據信息特征實時進行監測,以便及時對數據信息特征的錯誤進行修正;
23、(5)利用訓練模型生成將每個特征進行解碼排序、數值量化,獲得新的信息特征進行輸出;
24、(6)根據輸出的數據信息,判斷訓練模型所生成的數據信息與目標信息特征的差異。
25、本申請實施例中提供的一個或多個技術方案,至少具有如下技術效果或優點:通過改進的自注意力機制、上下文感知機制和源上下文強化技術,能夠有效解決大模型在生成內容時的忠實性幻覺問題,提高生成內容的質量和可靠性。
本文檔來自技高網...【技術保護點】
1.用于減少忠實性幻覺問題的生成模型架構系統,其特征在于:包括數據信息輸入單元,將模態數據信息輸入,所輸入的模態數據信息包括文本、圖像、音頻等;
2.如權利要求1所述的用于減少忠實性幻覺問題的生成模型架構系統,其特征在于:還包括信息調控分配單元,將模態數據信息的上下文數據序列進行區分,對數據特征信息著重進行分析調控,以保證初始模型構建的準確性;
3.如權利要求1所述的用于減少忠實性幻覺問題的生成模型架構系統,其特征在于:信息預處理單元包括文本信息處理、語言信息處理;
4.如權利要求1所述的用于減少忠實性幻覺問題的生成模型架構系統,其特征在于:信息調控分配單元包括信息對比、信息調控;
5.用于減少忠實性幻覺問題的生成模型架構的構建方法,其特征在于:具體包括以下過程:
【技術特征摘要】
1.用于減少忠實性幻覺問題的生成模型架構系統,其特征在于:包括數據信息輸入單元,將模態數據信息輸入,所輸入的模態數據信息包括文本、圖像、音頻等;
2.如權利要求1所述的用于減少忠實性幻覺問題的生成模型架構系統,其特征在于:還包括信息調控分配單元,將模態數據信息的上下文數據序列進行區分,對數據特征信息著重進行分析調控,以保證初始模型構建的準確性;<...
【專利技術屬性】
技術研發人員:陳科儒,
申請(專利權)人:中健華夏中醫藥產業發展廣東有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。