System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于llm,具體涉及多跳問題和/或符號(hào)推理問題的llm處理方法、處理系統(tǒng)。
技術(shù)介紹
1、在當(dāng)今大模型時(shí)代,大語言模型在各種各樣的nlp(natural?languageprocessing,簡(jiǎn)稱nlp)任務(wù)上取得了令人矚目的成績(jī),使得以大語言模型llm(largelanguage?model,簡(jiǎn)稱llm)為基礎(chǔ)的應(yīng)用開始蓬勃發(fā)展,例如輔助編程、心理輔導(dǎo)、缺陷檢測(cè)等。
2、盡管大型語言模型在自然語言處理任務(wù)上展現(xiàn)出了卓越的能力,但是微調(diào)llm來補(bǔ)充其缺少的知識(shí)來適應(yīng)下游應(yīng)用較為困難。這是因?yàn)閘lm對(duì)于高質(zhì)量訓(xùn)練數(shù)據(jù)的需求很高。通常情況下,為了使這些模型能夠在各種任務(wù)上表現(xiàn)出色,研究人員需要提供數(shù)百萬甚至數(shù)十億個(gè)標(biāo)記過的文本片段作為訓(xùn)練素材。然而,獲取如此規(guī)模且多樣化的高質(zhì)量數(shù)據(jù)集是一項(xiàng)艱巨的任務(wù),不僅耗費(fèi)大量資源,還可能導(dǎo)致隱私和版權(quán)問題。在獲得高質(zhì)量數(shù)據(jù)的基礎(chǔ)上,仍然很難為llm補(bǔ)充缺少的知識(shí),這是因?yàn)椴徽_的訓(xùn)練方法往往會(huì)導(dǎo)致災(zāi)難性遺忘問題,使得模型忘記先前學(xué)到的知識(shí)。此外,由于現(xiàn)實(shí)世界中的語言使用情況極其復(fù)雜且不斷變化,知識(shí)更新快,這就意味著,即使補(bǔ)充完缺少的知識(shí)后又可能面臨缺少知識(shí)的問題。除了缺少知識(shí)的問題,llm也面臨著推理能力不足、推理軌跡不清晰的問題,而且llm在回答一些專業(yè)問題或者回答其訓(xùn)練數(shù)據(jù)中并未包含的與最新知識(shí)有關(guān)的問題時(shí),往往會(huì)產(chǎn)生錯(cuò)誤的回答,傳統(tǒng)的方法直接使用用戶輸入的原始問題進(jìn)行檢索,這樣的檢索方法并不能檢索到有用的文檔,尤其是對(duì)于多跳問題和/或符號(hào)推理問題,但現(xiàn)實(shí)中的問題很大一
3、目前,已經(jīng)出現(xiàn)了以cot(chain?of?thought,簡(jiǎn)稱cot,例如few-shot-cot)和rag(retrieval?augmented?generation,簡(jiǎn)稱rag)為代表的技術(shù),cot技術(shù)采用提示(prompting)方法,cot技術(shù)為模型提供了推理演示示例,基于一次調(diào)用模型產(chǎn)生推理步驟獲得最終答案,然而產(chǎn)生的推理軌跡和產(chǎn)生的答案并不相匹配,即推理軌跡并不能推導(dǎo)出答案。rag技術(shù)雖然可以通過將用戶輸入的問題作為查詢進(jìn)行檢索,將獲得的文檔提供給llm作為補(bǔ)充的知識(shí)來輔助llm回答問題,但是面對(duì)復(fù)雜的多跳問題和/或符號(hào)推理問題,rag并不總是能檢索到有用的文檔,而且檢索到的無關(guān)文檔會(huì)對(duì)回答產(chǎn)生不利的影響。綜上所述,針對(duì)現(xiàn)有技術(shù)中大模型知識(shí)更新困難,大語言模型回答多跳問題和/或符號(hào)推理問題的準(zhǔn)確率低,模型的推理能力差,難以或無法較好顯示llm推理軌跡的技術(shù)問題,亟需提供多跳問題和/或符號(hào)推理問題的llm處理解決方案。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)申請(qǐng)?zhí)峁┝硕嗵鴨栴}和/或符號(hào)推理問題的llm處理方法、處理系統(tǒng),旨在部分或全部解決了現(xiàn)有大語言模型回答多跳問題和/或符號(hào)推理問題的技術(shù)問題,本專利技術(shù)申請(qǐng)能夠使得大模型可以及時(shí)獲得最新知識(shí)和行業(yè)知識(shí),提高了大語言模型回答多跳問題和/或符號(hào)推理問題準(zhǔn)確率,也不局限于某一特定的大語言模型,極大豐富了大語言模型的應(yīng)用場(chǎng)景。為了實(shí)現(xiàn)上述目的,本專利技術(shù)申請(qǐng)采用如下技術(shù)方案:
2、第一方面,多跳問題和/或符號(hào)推理問題的llm處理方法,包括以下步驟:
3、步驟s100:輸入多跳問題和/或符號(hào)推理問題,使用大語言模型llm制定多跳問題和/或符號(hào)推理問題的n個(gè)處理階段,n為大于等于2的正整數(shù);
4、步驟s200:在第1處理階段中,獲取第1推理計(jì)劃和第1臨時(shí)推理答案ta1;在第2處理階段中,獲取第2推理計(jì)劃和第2臨時(shí)推理答案ta2,...,在第n-1處理階段中,獲取第n-1推理計(jì)劃和第n-1臨時(shí)推理答案tan-1,在第n處理階段中,獲取第n推理計(jì)劃;
5、步驟s300:根據(jù)多跳問題和/或符號(hào)推理問題、第1臨時(shí)推理答案,第2臨時(shí)推理答案,...,第n-2臨時(shí)推理答案、第n推理計(jì)劃,輸出多跳問題和/或符號(hào)推理問題的答案。
6、可選地,步驟s200包括:
7、步驟s201:在第1處理階段中,推理制定第1推理計(jì)劃,第1推理計(jì)劃包括:多跳問題和/或符號(hào)推理問題q,問題理解定義qu,第1計(jì)劃plan和第1推理問題sq1;獲取第1推理問題sq1,處理確定第1推理問題sq1的第1臨時(shí)推理答案ta1,從而完成獲取第1推理計(jì)劃和第1臨時(shí)推理答案ta1;
8、步驟s202:在第2處理階段中,根據(jù)第1推理計(jì)劃和第1臨時(shí)推理答案ta1,推理制定第2推理計(jì)劃,第2推理計(jì)劃包括:?jiǎn)栴}理解定義qu,第1臨時(shí)推理答案ta1,第2計(jì)劃plan和第2推理問題sq2;獲取第2推理問題sq2,處理確定第2推理問題的第2臨時(shí)推理答案ta2,從而完成獲取第2推理計(jì)劃和第2臨時(shí)推理答案ta2;
9、步驟s203:在第3處理階段中,根據(jù)第2推理計(jì)劃和第2臨時(shí)推理答案ta2,推理制定第3計(jì)劃,第3推理計(jì)劃包括:?jiǎn)栴}理解定義qu,第2臨時(shí)推理答案ta2,第3計(jì)劃plan和第3推理問題sq3;獲取第3推理問題sq3,處理確定第3推理問題sq3的第3推理臨時(shí)答案ta3,從而完成獲取第3推理計(jì)劃和第3臨時(shí)推理答案ta3;...,
10、步驟s20n-1:在第n-1處理階段中,根據(jù)第n-2臨時(shí)推理答案tan-2和第n-2推理計(jì)劃,推理制定第n-1推理計(jì)劃,第n-1推理計(jì)劃包括:?jiǎn)栴}理解定義qu,第n-2臨時(shí)推理答案tan-2,第n-1計(jì)劃plan和第n-1推理問題sqn-1;獲取第n-1推理問題sqn-1,處理確定第n-1推理問題sqn-1的第n-1臨時(shí)推理答案tan-1;
11、步驟s20n:在第n處理階段中,根據(jù)第n-1推理計(jì)劃和第n-1臨時(shí)推理答案tan-1,推理制定第n推理計(jì)劃,第n推理計(jì)劃包括:?jiǎn)栴}理解定義qu,第n-1臨時(shí)推理答案tan-1,第n計(jì)劃plan和第n推理問題,從而完成獲取第n推理計(jì)劃。
12、可選地,在步驟s200中,對(duì)于多跳問題,第1推理問題sq1,第2推理問題sq2,...,第n推理問題sqn均采用sq格式,sq格式為:{"subject":將被執(zhí)行的處理階段那一步驟中所涉及的主體,"question":基于將被執(zhí)行的處理階段那一步驟中所需的知識(shí)產(chǎn)生的問題};和/或,在步驟s200中,對(duì)于符號(hào)推理問題,第1推理問題sq1,第2推理問題sq2,...,第n推理問題sqn均采用q格式,q格式為:{"question":基于將被執(zhí)行的處理階段那一步驟中所需的知識(shí)產(chǎn)生的問題}。
13、可選地,在采用sq格式的推理問題中,subject能夠作為限制條件,question被向量化后作為查詢?cè)谙蛄繑?shù)據(jù)庫(kù)chroma中進(jìn)行檢索,檢索到的文檔和對(duì)應(yīng)question被輸入到大語言模型,產(chǎn)生的回答即為臨時(shí)推理答案。
14、可選地,第1計(jì)劃plan,第2計(jì)劃plan,...,第n計(jì)劃plan均采用step格式,第1計(jì)劃plan的step格式包括:i?need?to?本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種多跳問題和/或符號(hào)推理問題的LLM處理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的多跳問題和/或符號(hào)推理問題的LLM處理方法,其特征在于,步驟S200包括:
3.根據(jù)權(quán)利要求2所述的多跳問題和/或符號(hào)推理問題的LLM處理方法,其特征在于,在步驟S200中,對(duì)于多跳問題,第1推理問題SQ1,第2推理問題SQ2,...,第n推理問題SQn均采用SQ格式,SQ格式為:{"subject":將被執(zhí)行的處理階段那一步驟中所涉及的主體,"question":基于將被執(zhí)行的處理階段那一步驟中所需的知識(shí)產(chǎn)生的問題};和/或,在步驟S200中,對(duì)于符號(hào)推理問題,第1推理問題SQ1,第2推理問題SQ2,...,第n推理問題SQn均采用Q格式,Q格式為:{"question":基于將被執(zhí)行的處理階段那一步驟中所需的知識(shí)產(chǎn)生的問題}。
4.根據(jù)權(quán)利要求3所述的多跳問題和/或符號(hào)推理問題的LLM處理方法,其特征在于,在采用SQ格式的推理問題中,subject能夠作為限制條件,question被向量化后作為查詢?cè)谙蛄繑?shù)據(jù)庫(kù)Chroma中進(jìn)行檢索,檢索
5.根據(jù)權(quán)利要求2所述的多跳問題和/或符號(hào)推理問題的LLM處理方法,其特征在于,第1計(jì)劃Plan,第2計(jì)劃Plan,...,第n計(jì)劃Plan均采用step格式;
6.根據(jù)權(quán)利要求5所述的多跳問題和/或符號(hào)推理問題的LLM處理方法,其特征在于,
7.一種多跳問題和/或符號(hào)推理問題的LLM處理系統(tǒng),用于實(shí)現(xiàn)上述權(quán)利要求1-6任一項(xiàng)所述的多跳問題和/或符號(hào)推理問題的LLM處理方法,其特征在于,包括:
8.根據(jù)權(quán)利要求7所述的多跳問題和/或符號(hào)推理問題的LLM處理系統(tǒng),其特征在于,多跳問題和/或符號(hào)推理問題的LLM處理系統(tǒng)還包括:顯示單元,顯示單元顯示第1處理階段的顯示第1推理計(jì)劃,第2處理階段的顯示第2推理計(jì)劃,...,第n-1處理階段的第n-1推理計(jì)劃,顯示第n處理階段的第n推理計(jì)劃;
9.一種多跳問題和/或符號(hào)推理問題的LLM處理裝置,其特征在于,包括通信相連的存儲(chǔ)器、處理器,所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序,所述處理器用于讀取所述計(jì)算機(jī)程序,執(zhí)行上述權(quán)利要求1-6任一項(xiàng)所述的多跳問題和/或符號(hào)推理問題的LLM處理方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有指令,當(dāng)所述指令在計(jì)算機(jī)上運(yùn)行時(shí),執(zhí)行上述權(quán)利要求1-6任一項(xiàng)所述的多跳問題和/或符號(hào)推理問題的LLM處理方法。
...【技術(shù)特征摘要】
1.一種多跳問題和/或符號(hào)推理問題的llm處理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的多跳問題和/或符號(hào)推理問題的llm處理方法,其特征在于,步驟s200包括:
3.根據(jù)權(quán)利要求2所述的多跳問題和/或符號(hào)推理問題的llm處理方法,其特征在于,在步驟s200中,對(duì)于多跳問題,第1推理問題sq1,第2推理問題sq2,...,第n推理問題sqn均采用sq格式,sq格式為:{"subject":將被執(zhí)行的處理階段那一步驟中所涉及的主體,"question":基于將被執(zhí)行的處理階段那一步驟中所需的知識(shí)產(chǎn)生的問題};和/或,在步驟s200中,對(duì)于符號(hào)推理問題,第1推理問題sq1,第2推理問題sq2,...,第n推理問題sqn均采用q格式,q格式為:{"question":基于將被執(zhí)行的處理階段那一步驟中所需的知識(shí)產(chǎn)生的問題}。
4.根據(jù)權(quán)利要求3所述的多跳問題和/或符號(hào)推理問題的llm處理方法,其特征在于,在采用sq格式的推理問題中,subject能夠作為限制條件,question被向量化后作為查詢?cè)谙蛄繑?shù)據(jù)庫(kù)chroma中進(jìn)行檢索,檢索到的文檔和對(duì)應(yīng)question被輸入到大語言模型,產(chǎn)生的回答即為臨時(shí)推理答案。
5.根據(jù)權(quán)利要求2所述的多跳問題和/或符號(hào)推...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李偉,張炎青,朱昊俊,楊道俊,
申請(qǐng)(專利權(quán))人:江南大學(xué),
類型:發(fā)明
國(guó)別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。