System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 国产高清无码二区,亚洲人片在线观看天堂无码,性无码一区二区三区在线观看
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備技術(shù)方案

    技術(shù)編號(hào):44161937 閱讀:13 留言:0更新日期:2025-01-29 10:33
    本發(fā)明專(zhuān)利技術(shù)提供一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備,該方法包括獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)以構(gòu)建初步任務(wù)集。將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù)。將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi)以生成符合微調(diào)指令格式的新任務(wù)集Task。將新任務(wù)集Task輸入通用Llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;計(jì)算每一新微調(diào)指令數(shù)據(jù)和相應(yīng)目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分并進(jìn)行篩選以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集。將精調(diào)指令數(shù)據(jù)集輸入至通用Llama模型內(nèi)進(jìn)行精調(diào)訓(xùn)練以形成基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專(zhuān)利技術(shù)涉及數(shù)據(jù)處理,且特別涉及一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備


    技術(shù)介紹

    1、隨著深度學(xué)習(xí)技術(shù)的發(fā)展與成熟,自然語(yǔ)言大模型因其出色的語(yǔ)言處理能力以及創(chuàng)造力成為人工智能中的新星。雖然通用自然語(yǔ)言大模型技術(shù)在通用語(yǔ)言邏輯能力上的發(fā)展較為成熟出色,但其在專(zhuān)業(yè)垂直領(lǐng)域(如多任務(wù)的社會(huì)治理領(lǐng)域)上的應(yīng)用卻暴露出大量的問(wèn)題。

    2、當(dāng)前,通用自然語(yǔ)言大模型在垂直領(lǐng)域上應(yīng)用存在的問(wèn)題主要有兩點(diǎn)。問(wèn)題一在于數(shù)據(jù)質(zhì)量較差。相對(duì)于通用領(lǐng)域的數(shù)據(jù)集,垂直領(lǐng)域的數(shù)據(jù)更需要業(yè)務(wù)領(lǐng)域的專(zhuān)家進(jìn)行審查,而如此將耗費(fèi)巨大的人力財(cái)力。而且普通的數(shù)據(jù)分析處理技術(shù)又達(dá)不到高數(shù)據(jù)質(zhì)量的要求,這樣會(huì)導(dǎo)致模型的能力更差甚至達(dá)不到通用模型原有的邏輯能力。問(wèn)題二則是專(zhuān)業(yè)領(lǐng)域的數(shù)據(jù)源較少,數(shù)據(jù)采集困難。如果只讓業(yè)務(wù)專(zhuān)家人工梳理產(chǎn)生不僅在速度上有著巨大限制,而且數(shù)據(jù)缺乏任務(wù)創(chuàng)造性,數(shù)據(jù)維度較單一的情況,還會(huì)導(dǎo)致數(shù)據(jù)質(zhì)量的變差。


    技術(shù)實(shí)現(xiàn)思路

    1、本專(zhuān)利技術(shù)為了克服現(xiàn)有技術(shù)的不足,提供一種借助第三方模型進(jìn)行數(shù)據(jù)擴(kuò)展任務(wù)數(shù)據(jù)集并對(duì)數(shù)據(jù)進(jìn)行評(píng)分篩選以獲得高質(zhì)量模型訓(xùn)練數(shù)據(jù)的基于評(píng)分機(jī)制的大模型訓(xùn)練方法、模型、系統(tǒng)及設(shè)備。

    2、為了實(shí)現(xiàn)上述目的,本專(zhuān)利技術(shù)提供一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其包括:

    3、獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;

    4、將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),微調(diào)指令格式包括任務(wù)主題類(lèi)型,待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽;

    5、將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集task,新任務(wù)集task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;

    6、將新任務(wù)集task輸入通用llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;

    7、計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集;

    8、將精調(diào)指令數(shù)據(jù)集輸入至通用llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    9、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,基于評(píng)分機(jī)制的大模型訓(xùn)練方法還包括:

    10、在獲得精調(diào)指令數(shù)據(jù)集后,將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集;

    11、基于擴(kuò)展的精調(diào)指令數(shù)據(jù)集訓(xùn)練llama模型,以獲得基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    12、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,初步任務(wù)集包括一系列的目標(biāo)領(lǐng)域任務(wù),且每一目標(biāo)領(lǐng)域任務(wù)下均包括至少一條微調(diào)指令數(shù)據(jù)。

    13、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,在獲得初步任務(wù)集后:將初步任務(wù)集進(jìn)行分類(lèi),根據(jù)任務(wù)類(lèi)型劃分成分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集;

    14、之后,再將分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)分別生成符合微調(diào)指令格式的兩類(lèi)新任務(wù)集;

    15、將兩類(lèi)新任務(wù)集分別輸入通用llama模型,以獲取每一新任務(wù)集內(nèi)每一任務(wù)的新微調(diào)指令數(shù)據(jù)集所對(duì)應(yīng)的相同任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集。

    16、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,在計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分score時(shí)的步驟包括:

    17、基于n-gram模型,計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的重合度指標(biāo)rouge-n和rouge-l,其中:

    18、;

    19、;

    20、其中:和分別為句子的字符計(jì)數(shù)函數(shù)和字符的匹配數(shù)計(jì)數(shù)函數(shù),為根據(jù)n-gram模型進(jìn)行字符拆分后的微調(diào)指令數(shù)據(jù)的字符序列,d為目標(biāo)領(lǐng)域數(shù)據(jù)集中的單個(gè)數(shù)據(jù),為超參數(shù)要依據(jù)具體情況制定,為召回率,為精確率;

    21、計(jì)算n-gram精度的幾何平均值并求出相應(yīng)權(quán)重;

    22、令為候選翻譯的長(zhǎng)度且為有效參考語(yǔ)料庫(kù)長(zhǎng)度,以計(jì)算簡(jiǎn)潔懲罰bp和bleu指標(biāo):

    23、;

    24、bleu=;

    25、計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分score:score=100(0.4rouge-n+0.4rouge-l+0.2bleu)。

    26、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,所獲取的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)包括方案數(shù)據(jù)、評(píng)價(jià)文章以及相關(guān)解讀數(shù)據(jù)。

    27、另一方面,本專(zhuān)利技術(shù)還提供一種基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型,其采用上述基于評(píng)分機(jī)制的大模型訓(xùn)練方法訓(xùn)練后獲得。

    28、另一方面,本專(zhuān)利技術(shù)還提供一種基于評(píng)分機(jī)制的數(shù)據(jù)模型訓(xùn)練系統(tǒng),其包括:

    29、數(shù)據(jù)獲取模塊,獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;

    30、微調(diào)模塊,將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),微調(diào)指令格式包括任務(wù)主題類(lèi)型,待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽;

    31、指令擴(kuò)展模塊,將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集task,新任務(wù)集task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;

    32、模型調(diào)用模塊,將新任務(wù)集task輸入通用llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;

    33、精調(diào)指令篩選模塊,計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集。

    34、訓(xùn)練模塊,將精調(diào)指令數(shù)據(jù)集輸入至通用llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    35、根據(jù)本專(zhuān)利技術(shù)的一實(shí)施例,在精調(diào)指令篩選模塊獲得精調(diào)指令數(shù)據(jù)集后,指令擴(kuò)展模塊將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集;之后,模型調(diào)用模塊將擴(kuò)展的精調(diào)指令數(shù)據(jù)集輸入訓(xùn)練llama模型,以獲得基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    36、另一方面,本專(zhuān)利技術(shù)還提供一種計(jì)算機(jī)設(shè)備,其包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述訓(xùn)練方法內(nèi)的步驟。

    37、綜上所述,本專(zhuān)利技術(shù)提供的基于評(píng)分機(jī)制的大模型訓(xùn)練方法通過(guò)微調(diào)指令格式對(duì)初步任務(wù)集內(nèi)的每一數(shù)據(jù)進(jìn)行調(diào)整,以作為自監(jiān)督學(xué)習(xí)模型。通過(guò)自監(jiān)督學(xué)習(xí)模型按照微調(diào)指令數(shù)據(jù)的格式在每一任務(wù)本文檔來(lái)自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,包括:獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),所述微調(diào)指令格式包括任務(wù)主題類(lèi)型,待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽;?將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集Task,新任務(wù)集Task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;將新任務(wù)集Task輸入通用Llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集;將精調(diào)指令數(shù)據(jù)集輸入至通用Llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    2.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,所述方法還包括:在獲得精調(diào)指令數(shù)據(jù)集后,將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集;基于擴(kuò)展的精調(diào)指令數(shù)據(jù)集訓(xùn)練Llama模型,以獲得基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    3.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,所述初步任務(wù)集包括一系列的目標(biāo)領(lǐng)域任務(wù),且每一目標(biāo)領(lǐng)域任務(wù)下均包括至少一條微調(diào)指令數(shù)據(jù)。

    4.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,在獲得初步任務(wù)集后:將初步任務(wù)集進(jìn)行分類(lèi),根據(jù)任務(wù)類(lèi)型劃分成分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集;之后,再將分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)分別生成符合微調(diào)指令格式的兩類(lèi)新任務(wù)集;將兩類(lèi)新任務(wù)集分別輸入通用Llama模型,以獲取每一新任務(wù)集內(nèi)每一任務(wù)的新微調(diào)指令數(shù)據(jù)集所對(duì)應(yīng)的相同任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集。

    5.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,在計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分SCORE時(shí)的步驟包括:基于N-gram模型,計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的重合度指標(biāo)ROUGE-N和ROUGE-L,其中:

    6.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,所獲取的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)包括方案數(shù)據(jù)、評(píng)價(jià)文章以及相關(guān)解讀數(shù)據(jù)。

    7.一種基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型,其特征在于,采用權(quán)利要求1~6任一項(xiàng)所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法訓(xùn)練后獲得。

    8.一種基于評(píng)分機(jī)制的大模型訓(xùn)練系統(tǒng),其特征在于,包括:數(shù)據(jù)獲取模塊,獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;微調(diào)模塊,將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),所述微調(diào)指令格式包括任務(wù)主題類(lèi)型,待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽;指令擴(kuò)展模塊,將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集Task,新任務(wù)集Task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;模型調(diào)用模塊,將新任務(wù)集Task輸入通用Llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;精調(diào)指令篩選模塊,計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集;訓(xùn)練模塊,將精調(diào)指令數(shù)據(jù)集輸入至通用Llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    9.根據(jù)權(quán)利要求9所述的基于評(píng)分機(jī)制的大模型訓(xùn)練系統(tǒng),其特征在于,在精調(diào)指令篩選模塊獲得精調(diào)指令數(shù)據(jù)集后,指令擴(kuò)展模塊將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集;之后,模型調(diào)用模塊將擴(kuò)展的精調(diào)指令數(shù)據(jù)集輸入訓(xùn)練Llama模型,以獲得基于Llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    10.一種計(jì)算機(jī)設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1至6中任一項(xiàng)所述方法內(nèi)的步驟。

    ...

    【技術(shù)特征摘要】

    1.一種基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,包括:獲取目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù),并對(duì)獲取的每一相關(guān)數(shù)據(jù)進(jìn)行不同任務(wù)主題的分類(lèi)以構(gòu)建初步任務(wù)集;將初步任務(wù)集內(nèi)的每一數(shù)據(jù)按照預(yù)設(shè)的微調(diào)指令格式進(jìn)行調(diào)整以構(gòu)建初始微調(diào)指令數(shù)據(jù),所述微調(diào)指令格式包括任務(wù)主題類(lèi)型,待處理的文本數(shù)據(jù)以及人工標(biāo)注標(biāo)簽;?將構(gòu)建初始微調(diào)指令數(shù)據(jù)后的初步任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)生成符合微調(diào)指令格式的新任務(wù)集task,新任務(wù)集task中每一任務(wù)均包含n個(gè)新微調(diào)指令數(shù)據(jù),為每一任務(wù)所包含的新微調(diào)指令數(shù)據(jù)集,表示第i個(gè)新微調(diào)指令數(shù)據(jù),其中對(duì)應(yīng)微調(diào)指令格式中的待處理的文本數(shù)據(jù),對(duì)應(yīng)微調(diào)指令格式中的人工標(biāo)注標(biāo)簽;將新任務(wù)集task輸入通用llama模型,基于每一任務(wù)下的新微調(diào)指令數(shù)據(jù)集獲取相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集;計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的相應(yīng)任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分,并篩選出得分超過(guò)設(shè)定相似度得分的新微調(diào)指令數(shù)據(jù),以形成每一任務(wù)下的精調(diào)指令數(shù)據(jù)集;將精調(diào)指令數(shù)據(jù)集輸入至通用llama模型內(nèi),對(duì)其精調(diào)訓(xùn)練以形成基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    2.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,所述方法還包括:在獲得精調(diào)指令數(shù)據(jù)集后,將精調(diào)指令數(shù)據(jù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),并基于自監(jiān)督學(xué)習(xí)產(chǎn)生擴(kuò)展的精調(diào)指令數(shù)據(jù)集;基于擴(kuò)展的精調(diào)指令數(shù)據(jù)集訓(xùn)練llama模型,以獲得基于llama的目標(biāo)領(lǐng)域相關(guān)數(shù)據(jù)模型。

    3.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,所述初步任務(wù)集包括一系列的目標(biāo)領(lǐng)域任務(wù),且每一目標(biāo)領(lǐng)域任務(wù)下均包括至少一條微調(diào)指令數(shù)據(jù)。

    4.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,在獲得初步任務(wù)集后:將初步任務(wù)集進(jìn)行分類(lèi),根據(jù)任務(wù)類(lèi)型劃分成分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集;之后,再將分類(lèi)任務(wù)集和非分類(lèi)任務(wù)集輸入自監(jiān)督學(xué)習(xí)模型內(nèi),基于自監(jiān)督學(xué)習(xí)分別生成符合微調(diào)指令格式的兩類(lèi)新任務(wù)集;將兩類(lèi)新任務(wù)集分別輸入通用llama模型,以獲取每一新任務(wù)集內(nèi)每一任務(wù)的新微調(diào)指令數(shù)據(jù)集所對(duì)應(yīng)的相同任務(wù)主題的目標(biāo)領(lǐng)域數(shù)據(jù)集。

    5.根據(jù)權(quán)利要求1所述的基于評(píng)分機(jī)制的大模型訓(xùn)練方法,其特征在于,在計(jì)算每一新微調(diào)指令數(shù)據(jù)和所獲取的目標(biāo)領(lǐng)域數(shù)據(jù)集之間的相似度得分score時(shí)...

    【專(zhuān)利技術(shù)屬性】
    技術(shù)研發(fā)人員:申永生洪永佳趙鵬煒葉曉華韓萌陳沖杰
    申請(qǐng)(專(zhuān)利權(quán))人:杭州城市大腦有限公司
    類(lèi)型:發(fā)明
    國(guó)別省市:

    網(wǎng)友詢問(wèn)留言 已有0條評(píng)論
    • 還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 亚洲va无码va在线va天堂| 中文无码vs无码人妻| 亚洲精品av无码喷奶水糖心| 亚洲AV日韩AV永久无码色欲| 国产亚洲大尺度无码无码专线| 亚洲Aⅴ无码专区在线观看q| 全免费a级毛片免费看无码| 中文一国产一无码一日韩| 永久免费av无码网站韩国毛片| 国产精品免费看久久久无码| 精品无码国产污污污免费网站| 18禁无遮挡无码网站免费| 色综合久久久久无码专区| 亚洲精品一级无码鲁丝片| 亚洲爆乳大丰满无码专区| 日日麻批免费40分钟无码| 日韩人妻无码一区二区三区| 无码的免费不卡毛片视频| 毛片一区二区三区无码| 亚洲爆乳无码精品AAA片蜜桃| 久久久久亚洲AV成人无码网站| 精品国产毛片一区二区无码| 日韩夜夜高潮夜夜爽无码| 激情无码人妻又粗又大中国人| 国产av永久无码天堂影院| 国产亚洲情侣一区二区无码AV| 毛片亚洲AV无码精品国产午夜| 无码午夜成人1000部免费视频 | 夜夜添无码一区二区三区| 无码少妇丰满熟妇一区二区| 无码丰满少妇2在线观看| 亚洲精品无码mv在线观看网站 | 亚洲av无码成人精品国产| 精品无码久久久久久尤物| 亚洲av成人无码久久精品| 免费无遮挡无码永久视频| 亚洲日韩乱码中文无码蜜桃 | 国产真人无码作爱免费视频| 亚洲无码视频在线| 国产精品无码永久免费888| 久久无码AV中文出轨人妻|