System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于自然語言處理領(lǐng)域,具體涉及大語言模型領(lǐng)域,尤其涉及一種學(xué)科教育大模型知識(shí)邊界探索方法。
技術(shù)介紹
1、大語言模型(large?language?models,llms)是一類通過深度學(xué)習(xí)技術(shù)訓(xùn)練而成的自然語言處理模型,旨在理解、生成人類語言。同時(shí)在教育領(lǐng)域有著廣泛的應(yīng)用前景。然而,目前絕大多數(shù)大語言模型為提高模型的語言理解能力,都是在海量公共領(lǐng)域數(shù)據(jù)下完成預(yù)訓(xùn)練,再進(jìn)行指令微調(diào)、強(qiáng)化學(xué)習(xí)等對(duì)齊訓(xùn)練。雖然這一方法提高了模型的對(duì)話能力同時(shí)擴(kuò)大了模型知識(shí)覆蓋面,但也不可避免的導(dǎo)致了模型對(duì)特定領(lǐng)域的信息缺失,進(jìn)而使得在特殊領(lǐng)域能力下降,更導(dǎo)致了“幻覺”的出現(xiàn),因此提高模型在特殊領(lǐng)域的能力并降低幻覺十分重要。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)針對(duì)上述的大模型語言在特殊領(lǐng)域能力下降的技術(shù)問題,提出一種學(xué)科教育大模型知識(shí)邊界探索方法。
2、為了達(dá)到上述目的,本專利技術(shù)采用的技術(shù)方案為,包括以下步驟:
3、s1、首先對(duì)學(xué)科大模型知識(shí)邊界進(jìn)行提取,利用大語言模型生成文本中的每個(gè)字符token具有概率值的原理,基于softmax函數(shù)將logits轉(zhuǎn)化為概率分布來獲取每個(gè)token的生成概率,每個(gè)token的生成概率其中zi表示tokenti對(duì)應(yīng)的logits值,表示模型在生成下一個(gè)token時(shí)對(duì)詞匯表中每個(gè)可能token的非標(biāo)準(zhǔn)化得分,v是詞匯表大小,表示大語言模型生成的所有token數(shù)量;
4、s2、接著設(shè)計(jì)一個(gè)計(jì)算每個(gè)token概率波動(dòng)性來衡量模型生成
5、s3、然后設(shè)定問題數(shù)據(jù)集θ,獲取學(xué)科教育大模型的回復(fù),并人工標(biāo)注回復(fù)內(nèi)容屬于知識(shí)邊界內(nèi)還是知識(shí)邊界外,然后通過統(tǒng)計(jì)全部δ,得到一個(gè)知識(shí)邊界內(nèi)波動(dòng)率閾值ρ;
6、s4、最后進(jìn)行特定指令微調(diào),在完成如何評(píng)估大模型回答內(nèi)容是否為知識(shí)邊界內(nèi)的答案計(jì)算并獲取知識(shí)邊界內(nèi)波動(dòng)率閾值后,對(duì)θ內(nèi)的數(shù)據(jù)進(jìn)行標(biāo)注,將δ超過的ρ數(shù)據(jù)定義為知識(shí)邊界外數(shù)據(jù),并將這些數(shù)據(jù)的原始大模型回復(fù)內(nèi)容替換,以此作為指令微調(diào)數(shù)據(jù)集對(duì)大模型進(jìn)行知識(shí)邊界認(rèn)知糾正。
7、作為優(yōu)選,所述步驟s1中學(xué)科教育大模型知識(shí)邊界提取,是通過計(jì)算模型生成回復(fù)的置信度曲線波動(dòng)率來確定大模型的知識(shí)邊界。
8、與現(xiàn)有技術(shù)相比,本專利技術(shù)的優(yōu)點(diǎn)和積極效果在于,通過對(duì)模型回復(fù)的答案的準(zhǔn)確性判斷及生成答案所需知識(shí)的邊界探索,有效提取了模型的邊界外知識(shí),并豐富這部分知識(shí)對(duì)大模型進(jìn)行指令微調(diào),有效降低了模型因知識(shí)缺乏帶來的幻覺。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種學(xué)科教育大模型知識(shí)邊界探索方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種學(xué)科教育大模型知識(shí)邊界探索方法,其特征在于,所述步驟S1中學(xué)科教育大模型知識(shí)邊界提取,是通過計(jì)算模型生成回復(fù)的置信度曲線波動(dòng)率來確定大模型的知識(shí)邊界。
【技術(shù)特征摘要】
1.一種學(xué)科教育大模型知識(shí)邊界探索方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種學(xué)科教育大模型知識(shí)邊界...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:趙志俊,廖大強(qiáng),徐義晗,丁勝高,鄭偉,陳亮,董文軒,李曉芹,王文江,吳天慧,
申請(qǐng)(專利權(quán))人:廣東南華工商職業(yè)學(xué)院,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。