System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 在线观看亚洲AV每日更新无码,国产精品va无码免费麻豆,精品无码久久久久国产
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種學(xué)科教育大模型知識(shí)邊界探索方法技術(shù)

    技術(shù)編號(hào):44494279 閱讀:5 留言:0更新日期:2025-03-04 18:00
    本發(fā)明專利技術(shù)屬于自然語言處理領(lǐng)域,具體涉及大語言模型領(lǐng)域,尤其涉及一種學(xué)科教育大模型知識(shí)邊界探索方法。針對(duì)大模型在特殊領(lǐng)域能力下降及幻覺問題,該方法先利用大語言模型原理,基于softmax函數(shù)獲取token生成概率,再設(shè)計(jì)算法計(jì)算概率波動(dòng)性衡量回復(fù)置信度,接著設(shè)定數(shù)據(jù)集并人工標(biāo)注,統(tǒng)計(jì)得到知識(shí)邊界內(nèi)波動(dòng)率閾值。最后進(jìn)行特定指令微調(diào),標(biāo)注數(shù)據(jù)并替換邊界外數(shù)據(jù)原始回復(fù)作為微調(diào)數(shù)據(jù)集,糾正模型知識(shí)邊界認(rèn)知。此方法通過對(duì)模型回復(fù)的評(píng)估與知識(shí)邊界探索,有效提取邊界外知識(shí)并微調(diào)模型,降低了因知識(shí)缺乏產(chǎn)生的幻覺,提升了模型在學(xué)科教育領(lǐng)域的實(shí)用性與準(zhǔn)確性。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)屬于自然語言處理領(lǐng)域,具體涉及大語言模型領(lǐng)域,尤其涉及一種學(xué)科教育大模型知識(shí)邊界探索方法。


    技術(shù)介紹

    1、大語言模型(large?language?models,llms)是一類通過深度學(xué)習(xí)技術(shù)訓(xùn)練而成的自然語言處理模型,旨在理解、生成人類語言。同時(shí)在教育領(lǐng)域有著廣泛的應(yīng)用前景。然而,目前絕大多數(shù)大語言模型為提高模型的語言理解能力,都是在海量公共領(lǐng)域數(shù)據(jù)下完成預(yù)訓(xùn)練,再進(jìn)行指令微調(diào)、強(qiáng)化學(xué)習(xí)等對(duì)齊訓(xùn)練。雖然這一方法提高了模型的對(duì)話能力同時(shí)擴(kuò)大了模型知識(shí)覆蓋面,但也不可避免的導(dǎo)致了模型對(duì)特定領(lǐng)域的信息缺失,進(jìn)而使得在特殊領(lǐng)域能力下降,更導(dǎo)致了“幻覺”的出現(xiàn),因此提高模型在特殊領(lǐng)域的能力并降低幻覺十分重要。


    技術(shù)實(shí)現(xiàn)思路

    1、本專利技術(shù)針對(duì)上述的大模型語言在特殊領(lǐng)域能力下降的技術(shù)問題,提出一種學(xué)科教育大模型知識(shí)邊界探索方法。

    2、為了達(dá)到上述目的,本專利技術(shù)采用的技術(shù)方案為,包括以下步驟:

    3、s1、首先對(duì)學(xué)科大模型知識(shí)邊界進(jìn)行提取,利用大語言模型生成文本中的每個(gè)字符token具有概率值的原理,基于softmax函數(shù)將logits轉(zhuǎn)化為概率分布來獲取每個(gè)token的生成概率,每個(gè)token的生成概率其中zi表示tokenti對(duì)應(yīng)的logits值,表示模型在生成下一個(gè)token時(shí)對(duì)詞匯表中每個(gè)可能token的非標(biāo)準(zhǔn)化得分,v是詞匯表大小,表示大語言模型生成的所有token數(shù)量;

    4、s2、接著設(shè)計(jì)一個(gè)計(jì)算每個(gè)token概率波動(dòng)性來衡量模型生成回復(fù)置信度的算法,波動(dòng)性δ越大,說明模型在該回復(fù)中的置信度越不穩(wěn)定,計(jì)算方式如下:其中n表示生成序列中token的數(shù)量;

    5、s3、然后設(shè)定問題數(shù)據(jù)集θ,獲取學(xué)科教育大模型的回復(fù),并人工標(biāo)注回復(fù)內(nèi)容屬于知識(shí)邊界內(nèi)還是知識(shí)邊界外,然后通過統(tǒng)計(jì)全部δ,得到一個(gè)知識(shí)邊界內(nèi)波動(dòng)率閾值ρ;

    6、s4、最后進(jìn)行特定指令微調(diào),在完成如何評(píng)估大模型回答內(nèi)容是否為知識(shí)邊界內(nèi)的答案計(jì)算并獲取知識(shí)邊界內(nèi)波動(dòng)率閾值后,對(duì)θ內(nèi)的數(shù)據(jù)進(jìn)行標(biāo)注,將δ超過的ρ數(shù)據(jù)定義為知識(shí)邊界外數(shù)據(jù),并將這些數(shù)據(jù)的原始大模型回復(fù)內(nèi)容替換,以此作為指令微調(diào)數(shù)據(jù)集對(duì)大模型進(jìn)行知識(shí)邊界認(rèn)知糾正。

    7、作為優(yōu)選,所述步驟s1中學(xué)科教育大模型知識(shí)邊界提取,是通過計(jì)算模型生成回復(fù)的置信度曲線波動(dòng)率來確定大模型的知識(shí)邊界。

    8、與現(xiàn)有技術(shù)相比,本專利技術(shù)的優(yōu)點(diǎn)和積極效果在于,通過對(duì)模型回復(fù)的答案的準(zhǔn)確性判斷及生成答案所需知識(shí)的邊界探索,有效提取了模型的邊界外知識(shí),并豐富這部分知識(shí)對(duì)大模型進(jìn)行指令微調(diào),有效降低了模型因知識(shí)缺乏帶來的幻覺。

    本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種學(xué)科教育大模型知識(shí)邊界探索方法,其特征在于,包括以下步驟:

    2.根據(jù)權(quán)利要求1所述的一種學(xué)科教育大模型知識(shí)邊界探索方法,其特征在于,所述步驟S1中學(xué)科教育大模型知識(shí)邊界提取,是通過計(jì)算模型生成回復(fù)的置信度曲線波動(dòng)率來確定大模型的知識(shí)邊界。

    【技術(shù)特征摘要】

    1.一種學(xué)科教育大模型知識(shí)邊界探索方法,其特征在于,包括以下步驟:

    2.根據(jù)權(quán)利要求1所述的一種學(xué)科教育大模型知識(shí)邊界...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:趙志俊,廖大強(qiáng),徐義晗丁勝高,鄭偉,陳亮,董文軒,李曉芹,王文江,吳天慧,
    申請(qǐng)(專利權(quán))人:廣東南華工商職業(yè)學(xué)院,
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 亚洲中文字幕久久精品无码A| 亚洲av无码国产精品夜色午夜| 人妻无码第一区二区三区| 无码人妻精品一区二区三区东京热 | 久久久久久久久免费看无码| 国产成人无码免费看片软件| 久久男人Av资源网站无码软件 | 久久久久亚洲av无码专区喷水| 精品高潮呻吟99av无码视频| 潮喷无码正在播放| 一本大道无码av天堂| 久久久久久久无码高潮| 国产精品无码一区二区在线观一 | 成人无码视频97免费| 日本精品人妻无码免费大全| 99无码精品二区在线视频| 亚洲精品中文字幕无码蜜桃| 国产成人亚洲综合无码| 国产精品久久无码一区二区三区网| 无码国产精品一区二区免费16| 国产成人A亚洲精V品无码| 无码国内精品久久人妻麻豆按摩| 亚洲av成人中文无码专区| 亚洲AV无码国产精品色| 亚洲成无码人在线观看| 无码久久精品国产亚洲Av影片| 中文字幕乱妇无码AV在线| 波多野结衣AV无码久久一区| 午夜无码一区二区三区在线观看| 欧日韩国产无码专区| 精品人妻中文无码AV在线 | 中文字字幕在线中文无码 | 中文字幕在线无码一区| 亚洲AV蜜桃永久无码精品| 无码专区国产无套粉嫩白浆内射 | 亚洲精品无码成人AAA片| 国产办公室秘书无码精品99 | 亚洲另类无码专区首页| 50岁人妻丰满熟妇αv无码区| 亚洲中文字幕无码中文| 无码熟妇人妻av|