當(dāng)前位置: 首頁 > 專利查詢>廣東南華工商職業(yè)學(xué)院專利>正文

一種學(xué)科教育大模型知識(shí)邊界探索方法技術(shù)

技術(shù)編號(hào)：44494279 閱讀：5 留言：0更新日期：2025-03-04 18:00

本發(fā)明專利技術(shù)屬于自然語言處理領(lǐng)域，具體涉及大語言模型領(lǐng)域，尤其涉及一種學(xué)科教育大模型知識(shí)邊界探索方法。針對(duì)大模型在特殊領(lǐng)域能力下降及幻覺問題，該方法先利用大語言模型原理，基于softmax函數(shù)獲取token生成概率，再設(shè)計(jì)算法計(jì)算概率波動(dòng)性衡量回復(fù)置信度，接著設(shè)定數(shù)據(jù)集并人工標(biāo)注，統(tǒng)計(jì)得到知識(shí)邊界內(nèi)波動(dòng)率閾值。最后進(jìn)行特定指令微調(diào)，標(biāo)注數(shù)據(jù)并替換邊界外數(shù)據(jù)原始回復(fù)作為微調(diào)數(shù)據(jù)集，糾正模型知識(shí)邊界認(rèn)知。此方法通過對(duì)模型回復(fù)的評(píng)估與知識(shí)邊界探索，有效提取邊界外知識(shí)并微調(diào)模型，降低了因知識(shí)缺乏產(chǎn)生的幻覺，提升了模型在學(xué)科教育領(lǐng)域的實(shí)用性與準(zhǔn)確性。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】

本專利技術(shù)屬于自然語言處理領(lǐng)域，具體涉及大語言模型領(lǐng)域，尤其涉及一種學(xué)科教育大模型知識(shí)邊界探索方法。

技術(shù)介紹

1、大語言模型(large?language?models,llms)是一類通過深度學(xué)習(xí)技術(shù)訓(xùn)練而成的自然語言處理模型，旨在理解、生成人類語言。同時(shí)在教育領(lǐng)域有著廣泛的應(yīng)用前景。然而，目前絕大多數(shù)大語言模型為提高模型的語言理解能力，都是在海量公共領(lǐng)域數(shù)據(jù)下完成預(yù)訓(xùn)練，再進(jìn)行指令微調(diào)、強(qiáng)化學(xué)習(xí)等對(duì)齊訓(xùn)練。雖然這一方法提高了模型的對(duì)話能力同時(shí)擴(kuò)大了模型知識(shí)覆蓋面，但也不可避免的導(dǎo)致了模型對(duì)特定領(lǐng)域的信息缺失，進(jìn)而使得在特殊領(lǐng)域能力下降，更導(dǎo)致了“幻覺”的出現(xiàn)，因此提高模型在特殊領(lǐng)域的能力并降低幻覺十分重要。

技術(shù)實(shí)現(xiàn)思路

1、本專利技術(shù)針對(duì)上述的大模型語言在特殊領(lǐng)域能力下降的技術(shù)問題，提出一種學(xué)科教育大模型知識(shí)邊界探索方法。

2、為了達(dá)到上述目的，本專利技術(shù)采用的技術(shù)方案為，包括以下步驟：

3、s1、首先對(duì)學(xué)科大模型知識(shí)邊界進(jìn)行提取，利用大語言模型生成文本中的每個(gè)字符token具有概率值的原理，基于softmax函數(shù)將logits轉(zhuǎn)化為概率分布來獲取每個(gè)token的生成概率，每個(gè)token的生成概率其中zi表示tokenti對(duì)應(yīng)的logits值，表示模型在生成下一個(gè)token時(shí)對(duì)詞匯表中每個(gè)可能token的非標(biāo)準(zhǔn)化得分，v是詞匯表大小，表示大語言模型生成的所有token數(shù)量；

4、s2、接著設(shè)計(jì)一個(gè)計(jì)算每個(gè)token概率波動(dòng)性來衡量模型生成

5、s3、然后設(shè)定問題數(shù)據(jù)集θ，獲取學(xué)科教育大模型的回復(fù)，并人工標(biāo)注回復(fù)內(nèi)容屬于知識(shí)邊界內(nèi)還是知識(shí)邊界外，然后通過統(tǒng)計(jì)全部δ，得到一個(gè)知識(shí)邊界內(nèi)波動(dòng)率閾值ρ；

6、s4、最后進(jìn)行特定指令微調(diào)，在完成如何評(píng)估大模型回答內(nèi)容是否為知識(shí)邊界內(nèi)的答案計(jì)算并獲取知識(shí)邊界內(nèi)波動(dòng)率閾值后，對(duì)θ內(nèi)的數(shù)據(jù)進(jìn)行標(biāo)注，將δ超過的ρ數(shù)據(jù)定義為知識(shí)邊界外數(shù)據(jù)，并將這些數(shù)據(jù)的原始大模型回復(fù)內(nèi)容替換，以此作為指令微調(diào)數(shù)據(jù)集對(duì)大模型進(jìn)行知識(shí)邊界認(rèn)知糾正。

7、作為優(yōu)選，所述步驟s1中學(xué)科教育大模型知識(shí)邊界提取，是通過計(jì)算模型生成回復(fù)的置信度曲線波動(dòng)率來確定大模型的知識(shí)邊界。

8、與現(xiàn)有技術(shù)相比，本專利技術(shù)的優(yōu)點(diǎn)和積極效果在于，通過對(duì)模型回復(fù)的答案的準(zhǔn)確性判斷及生成答案所需知識(shí)的邊界探索，有效提取了模型的邊界外知識(shí)，并豐富這部分知識(shí)對(duì)大模型進(jìn)行指令微調(diào)，有效降低了模型因知識(shí)缺乏帶來的幻覺。

本文檔來自技高網(wǎng)...

【技術(shù)保護(hù)點(diǎn)】

1.一種學(xué)科教育大模型知識(shí)邊界探索方法，其特征在于，包括以下步驟：

2.根據(jù)權(quán)利要求1所述的一種學(xué)科教育大模型知識(shí)邊界探索方法，其特征在于，所述步驟S1中學(xué)科教育大模型知識(shí)邊界提取，是通過計(jì)算模型生成回復(fù)的置信度曲線波動(dòng)率來確定大模型的知識(shí)邊界。

【技術(shù)特征摘要】

1.一種學(xué)科教育大模型知識(shí)邊界探索方法，其特征在于，包括以下步驟：

2.根據(jù)權(quán)利要求1所述的一種學(xué)科教育大模型知識(shí)邊界...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：趙志俊，廖大強(qiáng)，徐義晗，丁勝高，鄭偉，陳亮，董文軒，李曉芹，王文江，吳天慧，
申請(qǐng)(專利權(quán))人：廣東南華工商職業(yè)學(xué)院，
類型：發(fā)明
國別省市：

全部詳細(xì)技術(shù)資料下載我是這個(gè)專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評(píng)論

還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)